当前位置: 首页 > news >正文

这可能是目前最全的Redis高可用技术解决方案

转自:https://mp.weixin.qq.com/s/Z-PyNgiqYrm0ZYg0r6MVeQ

原作者:张东洪


常见的使用方式

Redis的几种常见的使用方式包括:

Redis 单副本

Redis多副本(主从)

Redis Sentinel(哨兵)

Redis Cluster

Redis自研

各种使用的优缺点

Redis 单副本

Redis 单副本,采用单个Redis节点部署架构,没有备用节点实时同步数据,不提供数据持久化和备份策略,适用于数据可靠性要求不高的纯缓存业务场景。

优点

  • 架构简单,部署方便。
  • 高性价比:缓存使用时无需备用节点(单实例可用性可以用supervisor或crontab保证),当然为了满足业务的高可用性,也可以牺牲一个备用节点,但同一时刻只有一个实例对外提供服务。
  • 高性能。

缺点

  • 不保证数据的可靠性。
  • 在缓存使用,进程重启后,数据丢失,即使有备用的节点解决高性能,但是仍然不能解决缓存预热问题,因此不适用于数据可靠性要求高的业务。
  • 高性能受限于单核CPU的处理能力(Redis是单线程机制),CPU为主要瓶颈,所以适合操作命令简单,排序,计算较少的场景。也可以考虑用memcached替代。

Redis多副本(主从)

Redis多副本,采用主从(replication)部署结构,相较于单副本而言最大的特点就是主从实例间数据实时同步,并且提供数据持久化和备份策略。

主从实例部署在不同的物理服务器上,根据公司的基础环境配置,可以实现同时对外提供服务和读写分离策略。

优点

  • 高可靠性:一方面,采用双击主备架构,能够在主库出现故障时自动进行主备切换,从库提升为主库提供服务,保证服务平稳运行;另一方面,开启数据持久化功能和配置合理的备份策略,能有效的解决数据误操作和数据异常丢失的问题。
  • 读写分离策略:从节点可以扩展主库节点的读能力,有效应对大并发量的读操作。

缺点

  • 故障恢复复杂,如果没有Redis HA系统(需要开发),当主库节点出现故障时,需要手动将一个从节点晋升为主节点,同时需要通知业务方变更配置,并且需要让其他从库节点去复制新主库节点,整个过程需要人为干预,比较繁琐。
  • 主库的写能力受到单机的限制,可以考虑分片。
  • 主库的存储能力受到单机的限制,可以考虑Pika。
  • 原生复制的弊端在早期的版本中也会比价突出,如:Redis复制中断后,Slave会发起psync ,此时如果同步不成功,则会进行全量同步,主库执行全量备份的同时,可能会造成毫秒或秒级的卡顿。
  • 又由于COW机制,导致极端情况下的主库内存溢出,程序异常退出或宕机;主库节点生成备份文件导致服务器磁盘IO和CPU资源消耗;发送数GB大小的备份文件导致服务器出口带宽暴增,阻塞请求,建议升级到最新版本。

Redis Sentinel(哨兵)

Redis Sentinel是社区版本推出的原生高可用解决方案,其部署架构主要包括两部分:Redis Sentinel集群和 Redis数据集群。

其中Redis Sentinel集群是由若干Sentinel节点组成的分布式集群,可以实现故障发现,故障自动转移,配置中心和客户端通知。Redis Sentinel的节点数量要满足 2n + 1 (n>=1)的奇数个。

优点

  • Redis Sentinel 集群部署简单;
  • 能够解决 Redis 主从模式下的高可用切换问题;
  • 很方便实现 Redis 数据节点的线形扩展,轻松突破 Redis 自身单线程瓶颈,可极大满足 Redis 大容量或高性能的业务需求;
  • 可以实现一套 Sentinel 监控一组 Redis 数据节点或多组数据节点。

缺点

  • 部署相对 Redis 主从模式要复杂一些,原理理解更繁琐;
  • 资源浪费,Redis 数据节点中 slave 节点作为备份节点不提供服务;
  • Redis Sentinel 主要是针对 Redis 数据节点中的主节点的高可用切换,对 Redis 的数据节点做失败判定分为主观下线和客观下线两种,对于 Redis 的从节点有对节点做主观下线操作,并不执行故障转移。
  • 不能解决读写分离问题,实现起来相对复杂。

建议

  • 如果监控同一业务,可以选择一套 Sentinel 集群监控多组 Redis 数据节点的方案,反之选择一套 Sentinel 监控一组 Redis 数据节点的方案。
  • sentinel monitor 配置中的建议设置成 Sentinel 节点的一半加 1,当 Sentinel 部署在多个 IDC 的时候,单个 IDC 部署的 Sentinel 数量不建议超过(Sentinel 数量 – quorum)。
  • 合理设置参数,防止误切,控制切换灵敏度控制:
  1. quorum
  2. down-after-milliseconds 30000
  3. failover-timeout 180000
  4. maxclient
  5. timeout
  • 部署的各个节点服务器时间尽量要同步,否则日志的时序性会混乱。
  • Redis 建议使用 pipeline 和 multi-keys 操作,减少 RTT 次数,提高请求效率。
  • 自行搞定配置中心(zookeeper),方便客户端对实例的链接访问。

Redis Cluster

Redis Cluster 是社区版推出的 Redis 分布式集群解决方案,主要解决 Redis 分布式方面的需求,比如,当遇到单机内存,并发和流量等瓶颈的时候,Redis Cluster 能起到很好的负载均衡的目的。

Redis Cluster 集群节点最小配置 6 个节点以上(3 主 3 从),其中主节点提供读写操作,从节点作为备用节点,不提供请求,只作为故障转移使用。

Redis Cluster 采用虚拟槽分区,所有的键根据哈希函数映射到 0~16383 个整数槽内,每个节点负责维护一部分槽以及槽所映射的键值数据。

优点

  • 无中心架构;
  • 数据按照 slot 存储分布在多个节点,节点间数据共享,可动态调整数据分布;
  • 可扩展性:可线性扩展到 1000 多个节点,节点可动态添加或删除;
  • 高可用性:部分节点不可用时,集群仍可用。通过增加 Slave 做 standby 数据副本,能够实现故障自动 failover,节点之间通过 gossip 协议交换状态信息,用投票机制完成 Slave 到 Master 的角色提升;
  • 降低运维成本,提高系统的扩展性和可用性。

缺点

  • Client 实现复杂,驱动要求实现 Smart Client,缓存 slots mapping 信息并及时更新,提高了开发难度,客户端的不成熟影响业务的稳定性。目前仅 JedisCluster 相对成熟,异常处理部分还不完善,比如常见的“max redirect exception”。
  • 节点会因为某些原因发生阻塞(阻塞时间大于 clutser-node-timeout),被判断下线,这种 failover 是没有必要的。
  • 数据通过异步复制,不保证数据的强一致性。
  • 多个业务使用同一套集群时,无法根据统计区分冷热数据,资源隔离性较差,容易出现相互影响的情况。
  • Slave 在集群中充当“冷备”,不能缓解读压力,当然可以通过 SDK 的合理设计来提高 Slave 资源的利用率。
  • Key 批量操作限制,如使用 mset、mget 目前只支持具有相同 slot 值的 Key 执行批量操作。对于映射为不同 slot 值的 Key 由于 Keys 不支持跨 slot 查询,所以执行 mset、mget、sunion 等操作支持不友好。
  • Key 事务操作支持有限,只支持多 key 在同一节点上的事务操作,当多个 Key 分布于不同的节点上时无法使用事务功能。
  • Key 作为数据分区的最小粒度,不能将一个很大的键值对象如 hash、list 等映射到不同的节点。
  • 不支持多数据库空间,单机下的 redis 可以支持到 16 个数据库,集群模式下只能使用 1 个数据库空间,即db 0 。
  • 复制结构只支持一层,从节点只能复制主节点,不支持嵌套树状复制结构。
  • 避免产生 hot-key,导致主库节点成为系统的短板。
  • 避免产生 big-key,导致网卡撑爆、慢查询等。
  • 重试时间应该大于 cluster-node-time 时间。
  • Redis Cluster 不建议使用 pipeline和multi-keys 操作,减少 max redirect 产生的场景。

Redis自研

Redis 自研的高可用解决方案,主要体现在配置中心、故障探测和 failover 的处理机制上,通常需要根据企业业务的实际线上环境来定制化。

优点

  • 高可靠性、高可用性;
  • 自主可控性高;
  • 贴合业务实际需求,可缩性好,兼容性好。

缺点

  • 实现复杂,开发成本高;
  • 需要建立配套的周边设施,如监控,域名服务,存储元数据信息的数据库等;
  • 维护成本高。

相关文章:

  • FLASH:一种高效的Transformer设计
  • SpringBoot 和 Vue前后端分离在线工具项目实战,源码+超详细讲解
  • 【前端技术】Vue3 技术学习笔记
  • JS中4种常见的内存泄漏
  • 详解Shiro认证流程
  • 金山办公:订阅为王?
  • 【JavaEE】Spring AOP (面向切面)详解
  • java基于ssm的快递物流管理系统
  • SETTLE约束算法中的坐标变换问题
  • 基于python的家政管理系统毕业设计源码071111
  • SpringBoot基础篇 (3)——基础配置
  • springboot基于web的在线问答社区系统设计与实现毕业设计源码061628
  • 神经网络的基本思路包括,神经网络的基本思路是
  • CREO:CREO软件之工程图【创建】以及配置(符合国家标准)的简介及其使用方法(图文教程)之详细攻略
  • Windows与网络基础-4-安装GNS3软件环境
  • 【翻译】babel对TC39装饰器草案的实现
  • 【腾讯Bugly干货分享】从0到1打造直播 App
  • 2017 前端面试准备 - 收藏集 - 掘金
  • Java 多线程编程之:notify 和 wait 用法
  • java概述
  • js操作时间(持续更新)
  • JS基础之数据类型、对象、原型、原型链、继承
  • JS字符串转数字方法总结
  • Mysql数据库的条件查询语句
  • Node + FFmpeg 实现Canvas动画导出视频
  • Python进阶细节
  • Redis在Web项目中的应用与实践
  • 关于Flux,Vuex,Redux的思考
  • 基于Android乐音识别(2)
  • 适配iPhoneX、iPhoneXs、iPhoneXs Max、iPhoneXr 屏幕尺寸及安全区域
  • 资深实践篇 | 基于Kubernetes 1.61的Kubernetes Scheduler 调度详解 ...
  • ​水经微图Web1.5.0版即将上线
  • # Panda3d 碰撞检测系统介绍
  • #define、const、typedef的差别
  • (4)事件处理——(6)给.ready()回调函数传递一个参数(Passing an argument to the .ready() callback)...
  • (9)YOLO-Pose:使用对象关键点相似性损失增强多人姿态估计的增强版YOLO
  • (python)数据结构---字典
  • (附源码)spring boot建达集团公司平台 毕业设计 141538
  • (附源码)springboot课程在线考试系统 毕业设计 655127
  • (附源码)ssm旅游企业财务管理系统 毕业设计 102100
  • (三维重建学习)已有位姿放入colmap和3D Gaussian Splatting训练
  • (转)Google的Objective-C编码规范
  • (转)利用ant在Mac 下自动化打包签名Android程序
  • .NET CF命令行调试器MDbg入门(二) 设备模拟器
  • .net core使用ef 6
  • .NET 动态调用WebService + WSE + UsernameToken
  • .net程序集学习心得
  • @RequestBody与@ResponseBody的使用
  • [Android Studio 权威教程]断点调试和高级调试
  • [C++]STL之map
  • [Gradle] 在 Eclipse 下利用 gradle 构建系统
  • [IM] [Webhook] Webhook实现IM平台机器人
  • [js] 正则表达式
  • [LeetCode]Balanced Binary Tree
  • [LeetCode刷题笔记]1 - 两数之和(哈希表)