redis数据结构

这篇笔记主要用来梳理 Redis 常见底层数据结构的设计思路，包括 redisObject、SDS、dict、quicklist、skiplist，以及小对象编码从 ziplist 向 listpack 的演进关系。重点不在命令用法，而在“逻辑类型如何映射到底层结构”和“为什么 Redis 会这样设计”。

文章内容以经典对象模型为主，同时补充 Redis 6.x、7.x 之后的实现差异，避免把历史结构和当前版本实现混在一起。阅读时可以把它当作一篇“整体视图 + 高频考点 + 版本纠偏”的复习笔记，而不是逐文件源码精读。

参考资料：

OBJECT ENCODING Redis

Memory optimization Redis

redis/redis-doc: object-encoding.md

redis/redis

[TOC]

1.RedisObject

所有 Redis 键值对的统一封装，用于管理数据的类型、编码、引用计数等元信息

版本说明：这篇笔记主要按 Redis 经典对象模型来理解底层结构。需要特别注意的是，Redis 7.0 起很多“小对象紧凑编码”从 ziplist 迁移到了 listpack，Redis 8 的内部对象实现也有继续演进。因此，读源码时一定要先看版本。

typedef struct redisObject {
    unsigned type:4;        // 数据类型（4位）
    unsigned encoding:4;    // 编码方式（4位）
    unsigned lru:LRU_BITS;  // LRU/LFU 信息（默认24位，用于缓存淘汰）
    int refcount;           // 引用计数（用于内存回收）
    void *ptr;              // 指向实际数据的指针（如SDS、dict、ziplist等）
} robj;

// type 数据类型
#define OBJ_STRING 0    // 字符串
#define OBJ_LIST 1      // 列表
#define OBJ_SET 2       // 集合
#define OBJ_ZSET 3      // 有序集合
#define OBJ_HASH 4      // 哈希

// encoding 编码方式，表示当前对象实际存储的编码结构
#define OBJ_ENCODING_RAW 0        // 原始字符串（经典 robj 模型里常见为长度 > 44 字节）
#define OBJ_ENCODING_EMBSTR 1     // 嵌入式字符串（经典 robj 模型里常见为长度 <= 44 字节，与 robj 连续分配）
#define OBJ_ENCODING_INT 2        // 整数（直接存储long，无需SDS）
#define OBJ_ENCODING_HT 3         // 哈希表（dict，用于哈希/集合等）
#define OBJ_ENCODING_ZIPMAP 4     // 压缩映射（已废弃，Redis 2.6后用ziplist替代）
#define OBJ_ENCODING_LINKEDLIST 5 // 双向链表（已废弃，列表用ziplist或quicklist）
#define OBJ_ENCODING_ZIPLIST 6    // 压缩列表（紧凑存储小数据，用于列表/哈希/有序集合）
#define OBJ_ENCODING_INTSET 7     // 整数集合（存储整数值的集合，元素少且小）
#define OBJ_ENCODING_SKIPLIST 8   // 跳表（与dict结合用于有序集合）
#define OBJ_ENCODING_EMBSTR_RAW 9 // （内部临时使用，不对外暴露）
#define OBJ_ENCODING_QUICKLIST 10 // 快速列表（Redis 3.2+ 列表的默认编码，结合ziplist和链表）

补充理解：

type 表示“逻辑数据类型”，比如 string、list、hash
encoding 表示“物理存储编码”，比如 string 逻辑类型可能是 int / embstr / raw
同一个逻辑类型，会因为数据规模变化发生编码转换，这也是 Redis 节省内存的关键
从使用者角度，可以通过 OBJECT ENCODING key 观察当前 key 的真实编码

2.SDS 简单动态字符串

struct __attribute__ ((__packed__)) sdshdrXX {
    unsigned int len;     // 字符串实际长度（已使用字节数，不包含结尾的\0）
    unsigned int alloc;   // 字符串总容量（已分配字节数，不包含结尾的\0）
    unsigned char flags;  // 标志位（低3位表示SDS类型，高5位未使用）
    char buf[];           // 柔性数组，存储字符串实际数据（结尾自动添加\0）
};

补充：

sdshdrXX 里的 XX 不是固定类型名，而是不同头部版本，例如 sdshdr5、sdshdr8、sdshdr16、sdshdr32、sdshdr64
这样设计的目的是让短字符串用更小的头部，长字符串再切到更大的长度字段，减少额外元数据占用
buf 尾部依然会保留 \0，因此 SDS 既兼容部分 C 字符串函数，又不会把 \0 当作真实长度依据

问题一：为什么不用C原生字符串（char*数组）

不能存储二进制数据：C 字符串以 \0 作为结束标志，若内容包含 \0（如图片、音频），会被误认为字符串结束
长度获取低效：需要遍历整个字符串直到 \0，时间复杂度为 O(n)
内存重分配频繁：每次修改字符串长度（增 / 减）都需要重新分配内存，效率低下

思考

先提几个重要的点：预分配、惰性释放优化、小于1M，2倍空间扩容、大于1M，空闲空间给1M

常数时间获取长度： 长度用 len 字段，直接获取。类似 ArrayList 中的 size 字段
杜绝缓冲区溢出： 修改字符串（如拼接 sdscat）时，SDS 会先检查 alloc - len 是否足够。若足够，直接使用空闲空间；若不足，自动扩容（分配足够内存）后再修改，避免缓冲区溢出。
减少内存重分配次数：
1. 预分配：字符串增长时，除了分配必要空间，还会额外分配空闲空间（减少后续增长的重分配）。
  - 若增长后 len < 1MB，空闲空间 = len（总容量 alloc = 2*len）
  - 若增长后 len >= 1MB，空闲空间固定为 1MB（总容量 alloc = len + 1MB）
2. 惰性释放：字符串缩短时，不立即释放多余空间，而是保留为空闲空间（alloc 不变，len 减小），供后续增长使用。若需手动释放，可调用 sdstrim 函数
二进制安全： SDS 用 len 标识字符串结束，而非 \0，因此可以存储任意二进制数据（如图片、视频、包含 \0 的数据）。例如，即使 buf 中包含 \0，len 仍会记录完整长度，保证数据正确读取

3.ZipList 压缩列表

版本说明：ziplist 是 Redis 很重要的历史结构。理解它有助于理解 Redis 的“紧凑存储”思想，但在 Redis 7.0 及以后，很多场景已经被 listpack 替代。

误区：名字叫列表，但其实物理结构和数组没区别。只是逻辑功能上模拟了链表的核心特性比如：

元素按顺序排列
支持从任意节点双向遍历（向前 / 向后访问元素）
支持动态插入 / 删除元素（不依赖固定大小的内存块）

ZipList没有具体的结构体，以宏定义的方式实现

/* ziplist 的整体结构：[zlbytes][zltail][zllen][entries][zlend] */

// 1. zlbytes：4字节，总字节数（包括自身）
#define ZIPLIST_BYTES(zl)       (*((uint32_t*)(zl)))

// 2. zltail：4字节，尾元素（最后一个entry）的偏移量（从ziplist起始地址开始算）
#define ZIPLIST_TAIL(zl)        (*((uint32_t*)((zl) + 4)))

// 3. zllen：2字节，元素个数（entry数量）
#define ZIPLIST_LENGTH(zl)      (*((uint16_t*)((zl) + 8)))

// 4. 头部总大小：zlbytes(4) + zltail(4) + zllen(2) = 10字节
#define ZIPLIST_HEADER_SIZE     10

// 5. 第一个entry的起始地址：头部之后的第一个字节
#define ZIPLIST_ENTRY_HEAD(zl)  ((zl) + ZIPLIST_HEADER_SIZE)

// 6. 尾元素（最后一个entry）的起始地址：zl + zltail（通过zltail偏移量计算）
#define ZIPLIST_ENTRY_TAIL(zl)  ((zl) + intrev32ifbe(ZIPLIST_TAIL(zl)))

// 7. zlend：1字节，结束标识（固定为0xFF），位于整个ziplist的最后一个字节
#define ZIPLIST_ENTRY_END(zl)   ((zl) + intrev32ifbe(ZIPLIST_BYTES(zl)) - 1)

+-----------------------+-----------------------+-----------------------+
| previous_entry_length | encoding              | data                  |
+-----------------------+-----------------------+-----------------------+

1. previous_entry_length（前一个元素的长度）
作用：记录前一个 entry 的总字节数，用于双向遍历（从后往前找元素）。
2. encoding（编码字段）
作用：标识当前 entry 的 data 部分是字符串还是整数，以及 data 的长度
3. data（实际数据）

typedef struct {
    unsigned int prevlen;  // 前一个 entry 的长度
    unsigned int len;      // 当前 entry 的数据长度（字符串长度或整数字节数）
    unsigned int encoding; // 编码类型（字符串/整数）
    unsigned char *p;      // entry 的起始地址
} zipEntry;

补充两个关键细节：

previous_entry_length 不是固定 4 字节。当前一个 entry 长度较小时，只需要 1 字节；较大时会扩展到 5 字节
这也是 ziplist 的核心隐患来源之一：如果某个 entry 变大，后续节点保存的 prevlen 可能从 1 字节扩成 5 字节，触发连锁更新

创建空的ZipList

unsigned char *ziplistNew(void) {
    // 空ziplist的总长度：头部10字节 + zlend 1字节 = 11字节
    unsigned int bytes = ZIPLIST_HEADER_SIZE + 1; 
    unsigned char *zl = zmalloc(bytes);  // 分配11字节的连续内存

    // 初始化zlbytes：总字节数11（转换为小端字节序存储）
    ZIPLIST_BYTES(zl) = intrev32ifbe(bytes); 

    // 初始化zltail：尾元素偏移量为10（空列表中，尾元素位置就是头部结束处）
    ZIPLIST_TAIL(zl) = intrev32ifbe(ZIPLIST_HEADER_SIZE); 

    // 初始化zllen：元素个数0
    ZIPLIST_LENGTH(zl) = 0; 

    // 初始化zlend：最后一个字节设为0xFF
    zl[bytes - 1] = ZIP_END; 

    return zl;
}

问题一：为什么不用普通的双向链表

每个节点包含 prev/next 指针（8 字节 ×2=16 字节），对于小数据（如整数、短字符串），指针开销甚至超过数据本身，内存浪费严重
节点分散存储，不利用 CPU 缓存（局部性差）

思考

资源浪费： 没有指针开销，通过时间换空间
类似数组： 由连续的一块内存组成的顺序数据结构

问题二：和数组什么区别

ziplist 只是物理上是连续内存

元素大小不固定： 数组要求所有元素类型 / 大小相同（如 int[10]），但 ziplist 的 entry 大小由元素内容动态决定（字符串长度、整数类型不同，entry 大小不同）
编码复杂： 数组元素直接存储值，ziplist 的 entry 包含前向长度、编码信息等元数据，用于实现双向遍历和动态操作
功能定位： 数组是通用的连续存储结构，ziplist 则是为“小数据有序集合”设计的专用结构，侧重内存效率和链表式操作，因此更贴近“列表”的逻辑功能
访问复杂度不同： ziplist 虽然连续存储，但它并不支持像普通数组那样按下标 O(1) 随机定位；按位置访问通常仍需要顺序扫描，时间复杂度更接近 O(n)

问题三：如何实现动态插入、删除

先说下普通链表：创建新节点、删除新节点，都是改变头尾指针进行串联。所以在物理层面，并不关心内存是否连续

插入流程

定位前向长度
编码新元素
内存重分配
移动数据
写入新元素
更新元信息
处理连锁更新：更新每个Entry

删除流程

计算删除长度
移动数据：后面的数据往前移，覆盖被删除的 entry
内存收缩
更新元数据
处理连锁更新

总结：和数组的操作极其相似。区别在于：

数组是通过索引快速定位，而zipList是通过头部或者尾部，计算编码找到元素的位置。
数组中，每个元素占用的空间相同，无法优化。比如 int arr[5]，存1和100000都是4个字节。zipList动态决定，存1用1个字节，用100000用2个字节。内存利用率高

问题四：zipList 的核心缺点是什么

中间插入 / 删除成本高： 底层连续内存，移动数据本质上还是 memmove
可能发生连锁更新： 一个节点长度变化，可能导致后续多个节点的 prevlen 扩容
不适合大对象： 元素越多、entry 越长，修改成本越高
因此它适合作为“小而紧凑”的编码，不适合作为通用大列表结构

补充：ListPack 为什么取代 ZipList

listpack 可以看作 ziplist 的后继者，目标并不是改变“紧凑连续存储”这个大方向，而是修正 ziplist 的历史问题。

核心变化可以这样理解：

ziplist 依赖“前一个 entry 的长度”做反向遍历，这会带来连锁更新问题
listpack 改成“每个 entry 末尾记录自身长度”的思路，仍然支持反向遍历，但规避了 ziplist 那种典型的级联扩容问题
Redis 5.0 开始，Stream 底层就使用 listpack
Redis 7.0 起，hash / zset / list 的紧凑编码大量迁移到 listpack
Redis 7.2 起，set 在特定条件下也可以使用 listpack

所以如果你今天阅读线上 Redis 的 OBJECT ENCODING 结果，看到 listpack 往往比看到 ziplist 更常见

哈希表节点（dictEntry）：存储单个键值对

typedef struct dictEntry {
    void *key;                  // 键（如字符串对象SDS）
    union {                     // 值（支持多种类型，节省内存）
        void *val;              // 通用指针（如指向redisObject）
        uint64_t u64;           // 无符号整数（小整数优化）
        int64_t s64;            // 有符号整数
        double d;               // 浮点数
    } v;
    struct dictEntry *next;     // 下一个节点的指针（解决哈希冲突的链表）
} dictEntry;

哈希表（dictht）：管理哈希桶数组

typedef struct dictht {
    dictEntry **table;          // 哈希桶数组（存储dictEntry指针）
    unsigned long size;         // 数组容量（必须是2的幂，如4、8、16...）
    unsigned long sizemask;     // 掩码（size-1，用于计算数组索引）
    unsigned long used;         // 已存储的节点数量（key总数）
} dictht;

哈希表管理结构（dict）：协调哈希表的扩容 / 缩容

typedef struct dict {
    dictType *type;             // 类型特定函数（哈希、复制、比较、销毁键值对）
    void *privdata;             // 类型函数的私有数据（传给type函数的参数）
    dictht ht[2];               // 两个哈希表（ht[0]正常使用，ht[1]用于扩容/缩容）
    long rehashidx;             // 重哈希索引（-1表示未在重哈希，否则表示当前迁移的桶索引）
    unsigned long iterators;    // 当前正在使用的迭代器数量（防止重哈希时迭代器失效）
} dict;

可以先记住一句话：dict 是 Redis 最基础、也最“出镜率最高”的底层结构之一。除了 hash 本身，set、zset、过期字典、数据库 key 空间管理等地方也大量使用了哈希表思想。

问题一：和Java HashMap区别在哪

dict 用两个哈希表（ht[0] 和 ht[1]）实现渐进式扩容，避免一次性迁移的性能波动。当哈希表需要扩容时，若直接将 ht[0] 中的所有数据一次性迁移到 ht[1]，在数据量大的场景（如百万级键值对），会占用大量 CPU 时间，导致 Redis 无法处理其他命令，产生明显的响应延迟。渐进式扩容将迁移工作分散到多次哈希表操作中（如每次查询、插入、删除时顺带迁移一小部分数据），避免单次操作的耗时过长
dict 冲突节点始终以 单链表 存储，不支持像 Java 8+ HashMap 那样在高碰撞桶中树化为红黑树
HashMap 扩容时直接分配新数组（容量翻倍），并一次性将所有节点从旧数组迁移到新数组
dict 支持缩容，常见实现会在负载因子很低时尝试回收空间；很多资料会记成 used / size < 0.1，但更准确地说，它受版本与是否允许 resize 等条件共同影响

问题二：dict 单链表存储，怎么保证长度不会出现无限增长

核心逻辑是： 通过动态调整哈希桶数组容量，将链表长度维持在合理范围，同时从根源减少冲突集中的可能性

扩容机制强制分散链表节点： 通过扩容（哈希桶数组容量翻倍）将原本集中在单个桶的冲突节点，分散到更多桶中，从而缩短链表长度

扩容的触发条件： 由负载因子决定

负载因子 = 已存储节点数（used） / 哈希桶数组容量（size）
默认负载因子阈值为 1（即当节点数超过桶容量时，触发扩容）
特殊场景（如 BGSAVE 持久化时），阈值临时提高到 5（避免扩容影响持久化性能，但仍会在后续触发扩容）

当负载因子超过阈值时，dict 启动渐进式扩容，将桶容量翻倍（始终为 2 的幂）

问题三：渐进式 rehash 具体怎么做

这是 Redis 哈希表最值得掌握的点之一。

需要扩容或缩容时，先创建新表 ht[1]
把 rehashidx 设为 0，表示开始迁移
后续每次执行增删改查时，顺带搬迁若干个桶
查询期间会同时检查 ht[0] 和 ht[1]
新写入的数据优先进入 ht[1]
当 ht[0] 全部迁移完后，令 ht[1] 变成新的 ht[0]

这样做的本质，是把一次性的大迁移拆成许多次小迁移，避免单次阻塞过长

问题四：只有单链表，不怕哈希冲突攻击吗

Redis 不是完全“放任冲突增长”，而是靠几层机制共同控制：

扩容把冲突节点分散到更多桶中
哈希函数设计会尽量让 key 分布均匀
Redis 在不同场景下引入过更抗碰撞的哈希方案，降低恶意构造 key 的风险
Redis 的典型负载模型也和 Java 应用里的 HashMap 不完全一样，它更依赖“负载因子控制 + 渐进式 rehash”来稳住性能

5.QuickList 快速列表

总结：quicklist = 普通双向链表 + 每个节点里放一个紧凑容器

版本说明：在老版本里，这个紧凑容器通常是 ziplist；在 Redis 7.0+ 里，更多情况下可以理解为“链表节点中装着 listpack”。所以 quicklist 更像是一层组织结构，而不只是“ziplist 外再套一层链表”。

typedef struct quicklist {
    quicklistNode *head;  // 头节点指针
    quicklistNode *tail;  // 尾节点指针
    unsigned long count;  // 所有节点中元素的总数量（整个列表的长度）
    unsigned int len;     // 链表的节点数量（quicklistNode 的个数）
    int fill : QL_FILL_BITS;  // 每个节点的 ziplist 最大填充限制（由配置决定）
    unsigned int compress : QL_COMP_BITS;  // 两端节点的压缩深度（由配置决定）
    unsigned int bookmark_count: QL_BM_BITS;  // 书签数量（用于快速定位）
    quicklistBookmark bookmarks[];  // 书签数组（优化遍历性能）
} quicklist;

typedef struct quicklistNode {
    struct quicklistNode *prev; //上一个node节点
    struct quicklistNode *next; //下一个node
    unsigned char *zl;            //保存的数据 压缩前ziplist 压缩后压缩的数据
    unsigned int sz;             /* ziplist size in bytes */
    unsigned int count : 16;     /* count of items in ziplist */
    unsigned int encoding : 2;   /* RAW==1 or LZF==2 */
    unsigned int container : 2;  /* NONE==1 or ZIPLIST==2 */
    unsigned int recompress : 1; /* was this node previous compressed? */
    unsigned int attempted_compress : 1; /* node can't compress; too small */
    unsigned int extra : 10; /* more bits to steal for future usage */
} quicklistNode;

补充：上面这组结构体更适合理解“经典 quicklist 设计”。如果读新版本源码或线上实例，需要把它和 listpack 的版本演进一起看。

问题一：和Java LinkedList 链表有什么区别

LinkedList，每个元素节点，都有头尾指针的内存开销 zipList讲过，紧凑型内存，且逻辑功能上模拟链表 redis的quickList这种批量存储，减少指针开销

java LinkedList 100个数据，对应100个节点，每个节点都有头尾指针，那么就是200个头尾指针
redis quickList 100个数据，假设每个Node节点中的zipList存10个紧凑型，那么只需要10个链表节点，一共才20个头尾指针

问题二：为什么不直接用 zipList

zipList 物理结构和数组一样，只是在逻辑功能上是链表。数组的典型问题在于，每次动态删除插入，要移动数据。数据量越大，效率越慢

分段式理念，把一个大的链表，分成10个小的 zipList，动态删除插入，只需要移动小的zipList即可

quickList 的每个节点大小可配置：

老版本常见配置名：list-max-ziplist-size
新版本常见配置名：list-max-listpack-size

本质都是限制每个紧凑节点的大小，避免单个节点过长导致插入 / 删除性能下降

问题三：如果往中间插元素，超过zipList大小怎么办

头部 / 尾部（高频场景）： 首尾节点的 ziplist 未达配置的大小限制（fill），直接插入

插入到中间位置（低频场景）

定位目标元素所在的 quicklistNode（需遍历节点，找到包含目标位置的节点）
检查该节点的 ziplist 是否有空间
1. 若有空间：直接插入到 ziplist 的对应位置
2. 若空间不足：将该节点的 ziplist 分裂为两个 ziplist，新建一个 quicklistNode 存储后半部分，再插入新元素到前半部分的 ziplist 中

总结：插入超过zipList大小限制，节点分裂，新建一个节点。删除导致zipList太小，合并节点

问题四：QuickList 到底解决了什么矛盾

它本质上是在平衡两件事：

链表的灵活性： 方便在头尾操作，节点拆分 / 合并也容易
连续内存的高利用率： 每个节点内部仍然是紧凑存储，减少大量指针开销

因此 quicklist 不是“最极致的随机访问结构”，而是 Redis 为列表场景做出的工程化折中

6.SkipList 跳表

通用的有序数据结构

跳表节点（zskiplistNode）

typedef struct zskiplistNode {
    sds ele;                // 有序集合的成员（字符串，如"user1"）
    double score;           // 分值（排序的依据，如100.0）
    struct zskiplistNode *backward;  // 后退指针（仅用于从后向前遍历，指向当前节点的前一个节点）
    struct zskiplistLevel {
        struct zskiplistNode *forward;  // 同一层级的前进指针（指向该层的下一个节点）
        unsigned long span;             // 跨度（当前节点到下一个节点之间的元素个数，用于计算排名）
    } level[];              // 柔性数组，存储各层级的索引信息（层级数不固定）
} zskiplistNode;

跳表管理结构（zskiplist）

typedef struct zskiplist {
    struct zskiplistNode *header, *tail;  // 头节点（哨兵，不存数据）和尾节点
    unsigned long length;                 // 跳表中的节点总数（元素个数）
    int level;                            // 跳表当前的最大层级（所有节点的最高层级）
} zskiplist;

总结： 可以把跳表理解成“给有序链表加多层索引”。底层仍然是链表，但高层索引让查找不必每次都从头一个个扫过去。链表节点类型是 zskiplistNode，通过 backward 反向查找，通过 zskiplistLevel.forward 做分层跳跃查询。

底层： zskiplistLevel[0].forward = 节点20 第二层： zskiplistLevel[1].forward = 节点30 第三层： zskiplistLevel[2].forward = NULL

问题一：相比红黑树，有什么优势

跳表红黑树对比.png

结合 Redis 的使用场景，可以记住以下几点：

实现更直观： 插入 / 删除主要是更新多层前进指针，代码可读性通常优于平衡树旋转
范围查询天然顺手： 找到起点后，沿底层链表顺序遍历即可，做区间扫描很自然
排名计算方便： Redis 在 level 中维护 span，可以高效支持按 rank 查询
性能是“期望 O(log n)”： 它不像红黑树那样强调严格最坏情况平衡，但平均性能很好，工程实现简单

所以 Redis 选跳表，不是因为它理论上压倒红黑树，而是因为它在“实现复杂度、范围操作、工程可维护性”之间取得了不错平衡

问题二：skipList 查找步骤

前提： 跳表的有序性，跳表中的所有节点按 score（分值）升序排列

核心逻辑： 从最高层级的索引开始，利用高层指针 “跳跃” 过大量无关节点，逐步降低层级，最终在底层链表中精准定位目标

从跳表的头节点 header 开始（头节点是哨兵，不存实际数据）

先站在当前最高层
看当前节点在这一层的 forward，如果下一个节点的 score 仍然小于目标值，就继续向右跳
当再往右就会超过目标值时，下降一层
重复“向右跳 + 向下走”的过程
到达第 0 层后，就能定位目标节点，或者定位到目标应该插入的位置

如果你把它想成“高速公路 + 地面道路”会很好理解：

高层索引用来快速跨越大段区间
越往下层，步子越小，定位越精确
最底层负责真实有序数据串联

时间复杂度通常记为：

查找：期望 O(log n)
插入：期望 O(log n)
删除：期望 O(log n)
范围遍历：O(log n) + m，其中 m 是返回元素个数

问题三：Redis 的 zset 为什么不是“只用跳表”

这是面试里非常高频的点。

Redis 的有序集合 zset 在大多数版本里，底层并不是只有一个跳表，而是：

dict： 用成员 member -> score 做精确查找，适合判断元素是否存在、按成员直接更新分值
skiplist： 按 score 维护有序关系，适合区间查询、排名查询、按分值遍历

也就是说，Redis 用两个结构分别服务两类访问路径：

“按 member 快速找”交给 dict，平均 O(1)
“按 score 排序 / 范围 / 排名找”交给 skiplist，期望 O(log n)

这就是为什么 zset 能同时兼顾精确查找和有序范围操作

问题四：跳表节点层数是怎么来的

跳表并不是每个节点都有同样高的层数，而是通过随机算法决定层高：

大多数节点只出现在低层
少数节点会被提升到更高层，充当“稀疏索引”
层数越高，节点越少，索引越稀疏

这样就能在不做树旋转的前提下，维持较好的平均查找效率

7.高频总结

1. 一句话串起来

SDS 解决 C 字符串不好用的问题，负责字符串的高效存储和修改
ziplist / listpack 解决“小对象如何更省内存”问题
quicklist 解决“列表既要省内存，又不能让单个连续块太大”的问题
dict 解决高效查找问题，是 Redis 最基础的底层结构之一
skiplist 解决有序范围查询、排名查询问题，主要服务 zset

2. 版本视角一定要带着看

学源码时，先确认 Redis 版本，否则很容易把历史实现和现代实现混在一起
ziplist 适合用来理解设计思想，但现代 Redis 更常见的是 listpack
list 的总体组织结构仍然是 quicklist，只是 quicklist 节点里的紧凑容器发生了演进

3. 面试最容易被追问的点

string 为什么不用原生 char*
embstr 和 raw 的区别是什么
ziplist 为什么省内存，为什么后来又被替换
dict 为什么要渐进式 rehash
quicklist 为什么不是纯链表，也不是单个大 ziplist
zset 为什么同时用 dict 和 skiplist

Redis 底层编码、核心数据结构与版本演进梳理