当前位置: 首页 > news >正文

【Java面试】二、Redis篇(中)

文章目录

  • 1、Redis持久化
    • 1.1 RDB
    • 1.2 AOF
    • 1.3 RDB与AOF的对比
  • 2、数据过期策略(删除策略)
    • 2.1 惰性删除
    • 2.2 定期删除
  • 3、数据淘汰策略
  • 4、主从复制
    • 4.1 主从全量同步
    • 4.2 增量同步
  • 5、哨兵模式
    • 5.1 服务状态监控
    • 5.2 哨兵选主规则
    • 5.3 哨兵模式下,Redis集群的脑裂
  • 6、分片集群
  • 7、Redis快的原因(IO多路复用 + Redis网络模型)
    • 7.1 用户空间和内核空间
    • 7.2 阻塞IO模型
    • 7.3 非阻塞IO模型
    • 7.4 IO多路复用
  • 8、面试

1、Redis持久化

1.1 RDB

RDB,即Redis Database Backup file,导出数据快照到磁盘。如果Redis实例宕机,也可读取快照文件,恢复数据,一般bgsave,以防文件过大时,阻塞其他请求

在这里插入图片描述
也可根据配置触发RDB:redis.conf

在这里插入图片描述

RDB的执行原理:bgsave开始时,fork主进程得到一个子进程(类似克隆,把存有映射关系的页表拷贝给了子进程),页表中存了分配给进程的内存(虚拟地址)和物理内存(物理地址) 的映射关系。子进程根据页表去读取数据,并写入RDB文件,主进程则继续回去处理客户端请求。

在这里插入图片描述

主进程和子进程之间会使用写时复制(copy-on-write)机制,此时,原内存空间为read-only,主进程如果要进行写操作,会拷贝一份数据,进行写操作,且后面读操作也是基于拷贝的副本去读,因此,basave期间,进行更新的那部分数据,不会同步到快照文件中。

1.2 AOF

Append Only File(追加文件),类似日志文件,记录每一个写命令

在这里插入图片描述
相关配置:redis.conf

在这里插入图片描述
记录写命令到AOF文件,有不同的策略(即刷盘策略)

在这里插入图片描述
在这里插入图片描述

everysec策略适用场景最多。此外,多次set同一个key,没必要重复记录,记录最后一次即可,可用bgrewriteaof命令,让AOF重写,降低文件大小。

在这里插入图片描述

关于触发重写的阈值配置:

在这里插入图片描述

1.3 RDB与AOF的对比

在这里插入图片描述

2、数据过期策略(删除策略)

即数据过期后,何时从内存中删除。

  • 惰性删除
  • 定期删除

2.1 惰性删除

key过期后,不管,直到下次get key,发现过期就删除,否则正常返回

在这里插入图片描述

  • 优点:不多占用CPU
  • 缺点:如果有key过期,但后面没被get过,则这块空间一直得不到释放

2.2 定期删除

每隔一段时间,对一定数量的key进行检查,删除过期的key。有两种模式:

  • SLOW模式:定时任务,执行频率默认10hz,即每个执行周期100ms,每次不超过25ms,可在redis.conf调整
  • FAST模式:频率不固定,但两次间隔不低于2ms,每次耗时不超过1ms

Redis的过期策略是惰性删除 + 定期删除配合。

3、数据淘汰策略

如果缓存过多,内存沾满了,如何处理 ⇒ 根据配置的策略删除一定的数据 ⇒ 数据淘汰策略

  • noeviction:不淘汰,内存满了就不允许写,抛错,是默认的策略
  • volatile-ttl:TTL越小,越先被淘汰
  • allkeys-randon:全体key,随机淘汰
  • volatile-random:设置了TTL的key,随机淘汰
  • allkeys-lru:全体key,按LRU算法淘汰
  • volatile-lru:设置了TTL的key,按LRU淘汰
  • allkeys-lfu:全体key,按LFU算法淘汰
  • volatile-lfu:设置了TTL的key,按LFU淘汰

在这里插入图片描述
数据库有 1000 万数据 ,Redis 只能缓存 20w 数据,如何保证 Redis 中的数据都是热点数据?

⇒ allkeys-lru策略,挑选最近没怎么使用的数据淘汰,留下热点数据。且如果有指定的需求,可以用volatile-lru + 置顶数据不设置过期时间,以保证这些数据永不被删除

4、主从复制

Redis的三种模式:

  • 单机模式
  • 集群模式
  • 哨兵模式
    在这里插入图片描述

单节点的Redis并发能力有上限,切为Redis主从集群,实现读写分离,提高并发能力(如下,一台服务器又查又写,并为一台写两台查,查的并发上限翻倍):
在这里插入图片描述
读写分离后,数据的同步方案:

4.1 主从全量同步

  • Replication Id:即replid,数据集的标记,该ID相同则说明对应的数据集是同一个,每个master有唯一的replid,slave会继承master的replid。

  • offset:偏移量,repl_baklog文件记录的数据越多,offset越大

全量同步时,如果master和slave的replid不相等,则master执行basave生成快照给slave去同步。根据前面的写时复制机制,basave期间,master接收到的写请求不会同步到快照文件中,因此,slave加载完快照文件后,还要执行从master收到的repl_baklog文件,该文件记录了basave期间,master额外收到的写指令。
在这里插入图片描述

如果replid相等,但master的offset为80,slave的offset为50,则slave把repl_baklog文件50-80的这一段命令再执行一下

4.2 增量同步

常用于slave节点重启后。slave发送自己的replid和offset到master,如果replid不一致,则是第一次同步,后续同全量。
在这里插入图片描述

如果replid一致,则不是第一次同步。根据offset发送对应片段的repl_baklog的命令到slave

在这里插入图片描述

5、哨兵模式

上面的主从集群,并不能实现高可用,master一挂,丧失写的能力 ⇒ 引入哨兵机制实现主从集群自动故障恢复。哨兵做为Redis集群的一个节点,其作用:

  • 节点状态监控:不断检查master、各个slave的健康状况
  • 自动故障恢复:如果master故障,则从slave中提升一个出来当master,即使后面master再恢复,也以新的master为主节点
  • 通知:集群故障转移后,将新的master、slave信息推到Redis客户端
    在这里插入图片描述

5.1 服务状态监控

哨兵Sentinel基于心跳机制监测节点状态,每1秒向集群每个节点发送ping命令:

  • 主观下线:某一个Sentienl发现某节点在规定时间未响应回pong到Sentinel,认为该节点主观下线
  • 客观下线:指定数量(常设为Sentienl数量的一半)的Sentintl都认为这个节点主观下线,则该节点客观下线

在这里插入图片描述

5.2 哨兵选主规则

  • 排除不在线的、响应慢的
  • 排除与主节点断开时间长的(断开时间长,读写分离下,数据不全)
  • 根据优先级、offset。若slave-prority一样,offset越大,优先级越高
  • 看运行ID,越小优先级越高

5.3 哨兵模式下,Redis集群的脑裂

下面是一个正常的哨兵模式架构:

在这里插入图片描述

如下,假如Sentinel、master、slave处于不同的网络环境,当Sentinel因网络原因连不上master时,其会去重新选举出一个master。但原来的master客户端是可以连接通的,此时就出现了两个master,即发生了脑裂。

在这里插入图片描述

再到后来,网络恢复,原来的master会被降为slave(前面提到的,恢复后,以新master为主节点),并从新的master去同步数据。即清空自己的数据,导入新master的快照文件,如此,脑裂期间,客户端写到master的数据就会丢失。

关于集群脑裂问题的解决,可配置这两个参数:

//最少的slave节点为1个
min-replicas-to-write 1
//数据复制和同步的延迟不能超过5秒
min-replicas-max-lag 5

如此,脑裂时,往旧的master写数据,因其slave数量为0,就会写入失败。且网络恢复后,数据同步也会因延迟过大而报错。

6、分片集群

主从(主写从读)集群和哨兵,解决了高可用、高并发读的问题,但存在两个问题:

  • 海量数据的存储问题
  • 高并发的问题

由此 ⇒ Redis分片集群,特点:

  • 集群中有多个master,每个master保存不同的数据,由此,每加一个master,并发写的能力就加一段(如从2n到3n)⇒ 解决高并发写
  • 每个master有多个slave ⇒ 解决高并发读
  • master之间互相ping,以检测健康状态,起到了哨兵的作用。如果多个master都认为某个master挂了,那这个master客观下线 ⇒ 类似哨兵
  • 客户端可请求访问集群的任意节点,最终都会被转发到正确的节点上去查写

在这里插入图片描述

至于客户端的请求会被转发到正确的节点上去,是通过哈希槽实现。Redis集群引入哈希槽的概念,整个集群有16384个哈希槽。

set或者get某个key ⇒ 这个key通过CRC16校验后,对16384取模来决定放哪个槽 ⇒ 集群每个master负责一定范围的槽

在这里插入图片描述

除了key去决定放哪个槽,也可以在key前加个{有效部分},如上面{aaa},如此,这些key就都可以被分到同一个master节点

7、Redis快的原因(IO多路复用 + Redis网络模型)

Redis是单线程的,但为什么还那么快?

  • 纯内存操作,执行速度快
  • 单线程下,避免了上下文切换,以及线程安全问题的考虑和实现
  • 使用了I/O多路复用模型,是非阻塞IO

7.1 用户空间和内核空间

Linux系统中一个进程使用的内存有两部分:

  • 用户空间:权限低,不能直接调用系统资源(只能通过内核提供的接口来调用)
  • 内核空间:可调用一切系统资源

在这里插入图片描述

关于以上空间的理解:用户A打开微信给其好友B,发生了一条消息message1。启动微信,即开了一个进程,编辑信息message1,相当于在服务器的用户空间,想发送message1,就要过网卡然后发给用户B。

而用户空间不能直接调用系统资源(硬件网卡),因此整个流程为:把用户缓冲区数据拷贝到内核缓冲区 ⇒ 写入硬件设备。用户B给A回复后,读数据则是:从网卡设备读到内核缓冲区,再拷贝到用户缓冲区。

以上,影响性能的有两个点:

  • 用户空间读数据时,要等待内核空间给它,内核空间数据未就绪,就一直空等
  • 数据来回拷贝

7.2 阻塞IO模型

用户进程在以下两个阶段都被阻塞:

  • 阶段1:等待内核从系统硬件资源中去准备数据
  • 阶段2:数据从内核空间拷贝到用户空间

在这里插入图片描述

7.3 非阻塞IO模型

用户进程,在阶段一不会被阻塞,如果内核空间没数据,会返回一个异常给用户进程,用户进程可以过会儿再去读。但阶段二,从内核空间拷贝到用户空间的时候,依然阻塞

在这里插入图片描述

7.4 IO多路复用

单个线程去监听多个Socket,监听的过程,用户线程是阻塞的,但只要出现一个Socket可读或可写,用户线程就会收到通知去干活儿
在这里插入图片描述

IO多路复用,监听Socket有多种实现:

  • select
  • poll
  • epoll

在这里插入图片描述
以点餐为例,select和poll就像:吧台有一盏灯,底下一群顾客,人手一个按钮,想好吃什么时,按下按钮,吧台灯亮。但此时吧台显示不出具体是哪个顾客要点餐,只是知道有人要点餐了。服务员就得挨个去问,是不是你要点餐?

epoll则是:顾客的按钮不再控制吧台的灯,而是控制吧台的计算机屏幕,顾客按一下,屏幕显示顾客桌号

select 和 poll 只会通知用户进程有 Socket 就绪,但不确定具体是哪个Socket ,需要用户进程逐个遍历 Socket 来确认

epoll 则会在通知用户进程 Socket 就绪的同时,把已就绪的 Socket 写入用户空间

最后,Redis的网络模型,有IO多路复用,用来监听客户端的连接Socket,但每个Socket下做的事可能不一样,有读请求、写请求,因此,Redis再用事件派发机制,转发到对应的处理器

在这里插入图片描述

8、面试

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • VMware ESXi 7.0U3q macOS Unlocker OEM BIOS 集成网卡驱动和 NVMe 驱动 (集成驱动版)
  • Elasticsearch开启安全认证
  • Helm安装kafka3.7.0无持久化(KRaft 模式集群)
  • FTP协议——BFTPD基本操作(Ubuntu+Win)
  • PHP之fastadmin系统配置分组增加配置和使用
  • 【java】常见面试题目
  • Modular military character
  • 全球AI新闻速递527
  • nginx代理前端html
  • 【Docker实战】进入四大数据库的命令行模式
  • C++的数论相关算法
  • 05.爬虫---urllib与requests请求实战(GET)
  • 【机器学习结合AI绘画工具】——开启艺术创作的新纪元
  • Vue 子组件向父组件传值
  • ros 学习记录(四)仿真环境中键盘控制turtlebot3运动
  • ES6指北【2】—— 箭头函数
  • JS中 map, filter, some, every, forEach, for in, for of 用法总结
  • [笔记] php常见简单功能及函数
  • 【跃迁之路】【735天】程序员高效学习方法论探索系列(实验阶段492-2019.2.25)...
  • JavaScript对象详解
  • Linux Process Manage
  • MySQL-事务管理(基础)
  • Node.js 新计划:使用 V8 snapshot 将启动速度提升 8 倍
  • PHP 程序员也能做的 Java 开发 30分钟使用 netty 轻松打造一个高性能 websocket 服务...
  • Python中eval与exec的使用及区别
  • SpiderData 2019年2月13日 DApp数据排行榜
  • Web标准制定过程
  • 关于Flux,Vuex,Redux的思考
  • 实战:基于Spring Boot快速开发RESTful风格API接口
  • ​如何防止网络攻击?
  • $.proxy和$.extend
  • (pytorch进阶之路)扩散概率模型
  • (附源码)ssm基于web技术的医务志愿者管理系统 毕业设计 100910
  • (算法)N皇后问题
  • (完整代码)R语言中利用SVM-RFE机器学习算法筛选关键因子
  • (转)EXC_BREAKPOINT僵尸错误
  • .equal()和==的区别 怎样判断字符串为空问题: Illegal invoke-super to void nio.file.AccessDeniedException
  • .NET 4.0网络开发入门之旅-- 我在“网” 中央(下)
  • .NET Core跨平台微服务学习资源
  • .NET MAUI Sqlite数据库操作(二)异步初始化方法
  • .NET 读取 JSON格式的数据
  • .NET 解决重复提交问题
  • .NET 设计模式初探
  • .net 中viewstate的原理和使用
  • .net网站发布-允许更新此预编译站点
  • .NET中两种OCR方式对比
  • .secret勒索病毒数据恢复|金蝶、用友、管家婆、OA、速达、ERP等软件数据库恢复
  • /tmp目录下出现system-private文件夹解决方法
  • @ModelAttribute使用详解
  • @Repository 注解
  • [ 常用工具篇 ] POC-bomber 漏洞检测工具安装及使用详解
  • [20171102]视图v$session中process字段含义
  • [23] GaussianAvatars: Photorealistic Head Avatars with Rigged 3D Gaussians
  • [C++参考]拷贝构造函数的参数必须是引用类型
  • [CISCN2019 华北赛区 Day1 Web2]ikun