Redis系列之底层数据结构SDS详解

 更新时间:2024年11月07日 09:02:32   作者:smileNicky  
SDS(简单动态字符串)是Redis使用的核心数据结构,用于替代C语言的字符串,以解决长度获取慢、内存溢出等问题,SDS通过预分配与惰性释放策略优化内存使用,增强安全性,且能存储文本与二进制数据,可查看源码src/sds.h和src/sds.c了解更多

实验的环境

  • Redis 6.0
  • VSCode 1.88.1

什么是SDS?

SDS:Simple Dynamic String,翻译为简单动态字符串。

SDS是一种用于存储二进制数据的数据结构,具有动态扩容的特点,代码位于src/sds.hsrc/sds.c

SDS的总体数据结构大致如图:在源码里sds包括几个部分,lenallocflagsbuf,其中 sdshdr是头部,buf是真实存储数据的地方,在存储的数据后面会跟一个\0,所以数据加上\0就是所谓的buf

  • len:保存了SDS字符串的长度
  • buf[]:保存数据的地方
  • alloc:分别以uint8, uint16, uint32, uint64表示整个SDS
  • flags:始终为一字节, 以低三位标示着头部的类型, 高5位未使用

查看源码sds.h,可以看到SDS里面有几种不同的头部,其中sdshdr5实际并未使用到,所以实际上有四种不同的头部

/* Note: sdshdr5 is never used, we just access the flags byte directly.
 * However is here to document the layout of type 5 SDS strings. */
struct __attribute__ ((__packed__)) sdshdr5 {
    unsigned char flags; /* 3 lsb of type, and 5 msb of string length */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr8 {
    uint8_t len; /* used */
    uint8_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr16 {
    uint16_t len; /* used */
    uint16_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr32 {
    uint32_t len; /* used */
    uint32_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr64 {
    uint64_t len; /* used */
    uint64_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};

为什么要使用SDS?

Redis是用C语言写的,为什么不直接就用C语言里的char来定义字符串?

获取字符串长度

由于有len属性,所以获取SDS字符串的长度只需要读取len属性,所以时间复杂度为O(1)

如果直接使用C语言中的字符串来实现,获取字符串的长度需要遍历计数,时间复杂度为O(n)

避免缓存区溢出

C语言中,如果使用strcat函数来进行两个字符串的拼接,如果没有分配足够长度的内存空间,就会造成缓存区溢出。

而对于SDS数据类型,在进行字符串修改的时候,会根据记录的len属性检查内存空间是否满足需求,如果不满足,会进行相应空间的扩展,所以不会出现缓存区溢出

减少字符串内存重新分配次数

C语言中字符串,是不会记录字符串的长度的,所以一旦修改了字符串,就需要重新分配内存,因为如果没有重新分配,字符串长度增大时会造成内存溢出区溢出,长度减小时会造成内存泄漏。

而对于SDS来说,因为有长度熟悉lenalloc属性的存在,SDS实现了空间预分配惰性空间释放两种策略来减少重新分配内存

  1. 空间预分配:SDS对空间进行扩展的时候,扩展的内存比实际需要的多,这样可以减少字符串增长操作所需的内存重新分配次数
  2. 惰性空间释放:SDS对字符串进行缩短操作时,不会立即进行内存重新分配,来回收缩短后多余的内存空间,而是使用alloc将这些字节数量记录下来,等待后续使用

二进制安全

C语言中,是以空字符串作为字符串结束的标识,但是一些特殊的字符串,可能就包括空字符串的,所以容易丢失数据,不能正确存取。

而SDS是根据len属性,以处理二进制的方式来处理buf里的数据,所以保存数据更加安全

兼容部分C字符串函数

SDS可以重用C语言库<string.h>中的一部分函数

C字符串和SDS对比

C字符串SDS
获取字符串长度时间复杂度为O(n)获取字符串的长度时间复杂度为O(1)
不安全,可能会造成缓冲区溢出安全,不会造成缓冲区溢出
修改字符串n次就需要进行n次内存分配修改字符串长度n次,最多需要n次内存分配
只能保存文本数据可以保存文本数据或者二进制数据
可以使用所有<string.h>库中的函数可以使用一部分<string.h>库中的函数

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Redisson之lock()和tryLock()的区别及说明

    Redisson之lock()和tryLock()的区别及说明

    这篇文章主要介绍了Redisson之lock()和tryLock()的区别及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-12-12
  • redis的hash类型操作方法

    redis的hash类型操作方法

    Hash 是一个 String 类型的 field(字段) 和 value(值) 的映射表,hash 特别适合用于存储对象,这篇文章主要介绍了redis的hash类型的详解,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-06-06
  • 分布式利器redis及redisson的延迟队列实践

    分布式利器redis及redisson的延迟队列实践

    这篇文章为大家主要介绍了分布式利器redis及redisson的延迟队列实践,搜遍全网好像还没有使用redisson的延迟队列的,redisson作为一个分布式利器,这么好用的工具没人用有点可惜
    2022-03-03
  • Redis的setNX分布式锁超时时间失效 -1问题及解决

    Redis的setNX分布式锁超时时间失效 -1问题及解决

    这篇文章主要介绍了Redis的setNX分布式锁超时时间失效 -1问题及解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-01-01
  • NoSQL和Redis简介及Redis在Windows下的安装和使用教程

    NoSQL和Redis简介及Redis在Windows下的安装和使用教程

    这篇文章主要介绍了NoSQL和Redis简介及Redis在Windows下的安装和使用教程,本文同时讲解了python操作redis,并给出了操作实例,需要的朋友可以参考下
    2015-01-01
  • Redis实现消息的发布订阅原理分析

    Redis实现消息的发布订阅原理分析

    本文主要介绍了Redis实现消息的发布订阅原理分析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-07-07
  • redis初学者常见字符乱码问题及解决方案

    redis初学者常见字符乱码问题及解决方案

    这篇文章主要介绍了redis初学者常见字符乱码问题及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-09-09
  • Redis高并发缓存设计问题与性能优化

    Redis高并发缓存设计问题与性能优化

    本文详细介绍了Redis缓存设计中常见的问题及解决方案,包括缓存穿透、缓存失效(击穿)、缓存雪崩、热点缓存key重建优化、缓存与数据库双写不一致以及开发规范与性能优化,感兴趣的可以了解一下
    2024-11-11
  • Redis与MySQL数据一致性问题的策略模式及解决方案

    Redis与MySQL数据一致性问题的策略模式及解决方案

    开发中,一般会使用Redis缓存一些常用的热点数据用来减少数据库IO,提高系统的吞吐量,本文将给大家介绍了Redis与MySQL数据一致性问题的策略模式及解决方案,文中通过代码示例介绍的非常详细,需要的朋友可以参考下
    2024-07-07
  • 详解Redis缓存穿透/击穿/雪崩原理及其解决方案

    详解Redis缓存穿透/击穿/雪崩原理及其解决方案

    缓存可以比喻为防弹衣,但如果没有使用好这个防弹衣效果就会适得其反,所以要更好的使用缓存才能发挥出它的作用。本文详细讲解了缓存穿透/击穿/雪崩以及其解决方法,感兴趣的小伙伴可以学习一下这篇文章
    2021-09-09

最新评论