持久化
RDB
定时 SAVE 或 bgsave fork 子进程写快照。COW 可能导致内存峰值(联系 week04-virtual-memory)。
AOF
每条写命令追加;everysec fsync 平衡性能与安全;AOF rewrite 生成最小命令集。
混合持久化(RDB + AOF 增量)缩短重启时间。
主从复制
一主多从,读写分离。复制延迟导致 从库读旧数据;强一致读走主或跟踪 offset。
断线重连:partial resync 用 replication backlog。
哨兵 Sentinel
监控主从,自动 failover 选举新主;客户端连接哨兵发现当前 master。适合中小规模。
Redis Cluster
去中心化分片,最少 3 主 3 从。不支持多 key 事务跨 slot(除非 hash tag {user}:1 {user}:2 同 slot)。
扩容:迁移 slot,MOVED 引导客户端。
高可用对比
| 方案 | 场景 | |------|------| | 主从 + 哨兵 | 中等 QPS | | Cluster | 大数据量水平扩展 | | 代理 Twemproxy/Codis | 老架构,了解 |
运维要点
maxmemory+ eviction policy。- 慢日志、latency doctor。
- 大 key 扫描与拆分。
与 MQ 衔接
持久化保证 Redis 自身数据;跨服务可靠用 Kafka(week06-kafka-reliability)。
实战巩固与面试表达
本篇属于 8 周冲刺 week06-redis-persistence-cluster 主题。复习时先闭卷回答 frontmatter 中三张 flashcard,再展开口述两个「为什么」:为什么这种方案能 work、边界失败时如何降级。与相邻章节对照:算法篇强调复杂度与模板,Go 篇强调工程默认写法,中间件篇强调线上故障案例。
动手与自检清单
用 25 分钟限时做 1 道相关练习题或画出一张架构/数据结构示意图;用 5 分钟写 STAR 片段说明你在项目里是否用过类似技术。记录 3 个面试追问及你的标准答法,存入 /zh/notebook/master-plan 笔记。若某点不熟,回到对应 /chapters 交互 Lab 重新走一遍流程,比死记卡片更有效。
易错点提醒
避免只背名词不会画图;避免只说优点不谈 trade-off(性能、一致性、运维成本至少提一项);避免把学习 Demo 说成百万 QPS 生产。回答时使用「场景 → 方案 → 结果 → 反思」四段式,体现工程成熟度。
自检
画 failover 时序;说明 Cluster 下执行 MGET 多 slot 问题。面试:Redis 单线程为何还用多 IO 线程?