当前位置：首页 > news >正文

【Redis】Redis 典型应用 - 缓存 (Cache) 原理与策略

news 来源：原创 2024/9/19 5:30:21

- Redis 典型应⽤ - 缓存 (cache)
- - 什么是缓存
  - 使⽤ Redis 作为缓存
  - 缓存的更新策略
  - - 1)定期⽣成
    - 2)实时生成
  - 缓存预热，缓存穿透，缓存雪崩和缓存击穿
  - - 关于缓存预热 (Cache preheating)
    - - 什么是缓存预热
    - 关于缓存穿透 (Cache penetration)
    - 什么是缓存穿透
    - - 为何产⽣
      - 如何解决
    - 关于缓存雪崩 (Cache avalanche)
    - - 什么是缓存雪崩
      - 为何产⽣
      - 如何解决
    - 关于缓存击穿 (Cache breakdown)
    - - 什么是缓存击穿
      - 如何解决

Redis 典型应⽤ - 缓存 (cache)

什么是缓存

缓存 (cache) 是计算机中的⼀个经典的概念，在很多场景中都会涉及到。

核⼼思路就是把⼀些常⽤的数据放到触⼿可及(访问速度更快)的地⽅，⽅便随时读取。

举个例⼦：

⽐如我需要去⾼铁站坐⾼铁. 我们知道坐⾼铁是需要反复刷⾝份证的 (进⼊⾼铁站，检票，上⻋，乘⻋过程中，出站…)

正常来说，我的⾝份证是放在⽪箱⾥的(⽪箱的存储空间⼤，⾜够能装). 但是每次刷⾝份证都需要开⼀次⽪箱找⾝份证，就⾮常不⽅便。

因此我就可以把⾝份证先放到⾐服⼝袋⾥。⼝袋虽然空间⼩，但是访问速度⽐⽪箱快很多。

这样的话每次刷⾝份证我只需要从⼝袋⾥掏⾝份证就⾏了，就不必开⽪箱了。

此时 “口袋” 就是 “皮箱” 的缓存. 使用缓存能够⼤提⾼访问效率

这⾥所说的 “触⼿可及” 是个相对的概念

我们知道，对于硬件的访问速度来说，通常情况下：

CPU 寄存器 > 内存 > 硬盘 > ⽹络。可以用速度快的设备作为速度慢的设备的缓存。

那么硬盘相对于⽹络是 “触⼿可及的”，就可以使⽤硬盘作为⽹络的缓存。

内存相对于硬盘是 “触⼿可及的”，就可以使⽤内存作为硬盘的缓存。

CPU 寄存器相对于内存是 “触⼿可及的”，就可以使⽤ CPU 寄存器作为内存的缓存。

对于计算机硬件来说，往往访问速度越快的设备，成本越⾼，存储空间越⼩。

缓存是更快，但是空间上往往是不⾜的. 因此⼤部分的时候，缓存只放⼀些 热点数据 (访问频繁的数据)，就⾮常有⽤了。

关于 “⼆⼋定律”

20% 的热点数据，能够应对 80% 的访问场景。

因此只需要把这少量的热点数据缓存起来，就可以应对⼤多数场景，从⽽在整体上有明显的性能提升

使⽤ Redis 作为缓存

在⼀个⽹站中，我们经常会使⽤关系型数据库 (⽐如 MySQL) 来存储数据。

关系型数据库虽然功能强⼤，但是有⼀个很⼤的缺陷，就是性能不⾼。(换⽽⾔之，进⾏⼀次查询操作消耗的系统资源较多)。

为什么说关系型数据库性能不⾼?

数据库把数据存储在硬盘上，硬盘的 IO 速度并不快。尤其是随机访问。
如果查询不能命中索引，就需要进⾏表的遍历，这就会⼤增加硬盘 IO 次数。
关系型数据库对于 SQL 的执⾏会做⼀系列的解析，校验，优化⼯作。
如果是⼀些复杂查询，⽐如联合查询，需要进⾏笛卡尔积操作，效率更是降低很多。
…

因此，如果访问数据库的并发量⽐较⾼，对于数据库的压⼒是很⼤的，很容易就会使数据库服务器宕机。

为什么并发量⾼了就会宕机?

服务器每次处理⼀个请求，都是需要消耗⼀定的硬件资源的. 所谓的硬件资源包括不限于 CPU，内存，硬盘，⽹络带宽…

⼀个服务器的硬件资源本⾝是有限的。⼀个请求消耗⼀份资源，请求多了，⾃然把资源就耗尽了。后续的请求没有资源可⽤，⾃然就⽆法正确处理. 更严重的还会导致服务器程序的代码出现崩溃。

如何让数据库能够承担更⼤的并发量呢? 核⼼思路主要是两个：

开源：引⼊更多的机器，部署更多的数据库实例，构成数据库集群。(主从复制，分库分表等…)
节流：引⼊缓存，使⽤其他的⽅式保存经常访问的热点数据，从⽽降低直接访问数据库的请求数量

实际开发中，这两种⽅案往往是会搭配使⽤的

Redis 就是⼀个⽤来作为数据库缓存的常⻅⽅案

Redis 访问速度⽐ MySQL 快很多。或者说处理同⼀个访问请求， Redis 消耗的系统资源⽐ MySQL 少很多。因此 Redis 能⽀持的并发量更⼤

Redis 数据在内存中，访问内存⽐硬盘快很多
Redis 只是⽀持简单的 key-value 存储，不涉及复杂查询的那么多限制规则

就像⼀个 “护盾” ⼀样，把 MySQL 给罩住了

客⼾端访问业务服务器，发起查询请求
业务服务器先查询 Redis，看想要的数据是否在 Redis 中存在
- 如果已经在 Redis 中存在了，就直接返回。此时不必访问 MySQL 了
- 如果在 Redis 中不存在，再查询 MySQL

按照上述讨论的 “⼆⼋定律” ，只需要在 Redis 中放 20% 的热点数据，就可以使 80% 的请求不再真正查询数据库了。

当然，实践中究竟是 “⼆⼋”，还是 “⼀九”，还是 “三七”，这个情况可能会根据业务场景的不同，存在差异。但是⾄少绝⼤多数情况下，使⽤缓存都能够⼤提升整体的访问效率，降低数据库的压⼒。

注意!

缓存是⽤来加快 “读操作” 的速度的。如果是 “写操作”，还是要⽼老实实写数据库，缓存并不能提⾼性能。

缓存的更新策略

接下来还有⼀个重要的问题，到底哪些数据才是 “热点数据” 呢?

1)定期⽣成

每隔⼀定的周期(⽐如⼀天/⼀周/⼀个⽉)，对于访问的数据频次进⾏统计。挑选出访问频次最⾼的前 N%的数据。

以搜索引擎为例

⽤⼾在搜索引擎中会输⼊⼀个 “查询词”，有些词是属于⾼频的，⼤家都爱搜(鲜花，蛋糕，同城交友，不孕不育…). 有些词就属于低频的，⼤家很少搜。

搜索引擎的服务器会把哪个⽤⼾什么时间搜了啥词，都通过⽇志的⽅式记录的明明⽩白。然后每隔⼀段时间对这期间的搜索结果进⾏统计 (⽇志的数量可能⾮常巨⼤，这个统计的过程可能需要使⽤ hadoop 或者 spark 等⽅式完成)。从⽽就可以得到 “⾼频词表” 。

步骤：

完成统计热词的过程
根据热词，找到搜索结果的数据（广告数据）
把得到缓存数据同步到缓存服务器上
控制这些缓存服务器自动重启

优点是实现容易，过程可控。但这种做法实时性较低，对于⼀些突然情况应对的并不好。

⽐如春节期间， “春晚” 这样的词就会成为⾮常⾼频的词。⽽平时则很少会有⼈搜索 “春晚”

2)实时生成

先给缓存设定容量上限（可以通过 Redis 配置⽂件的 maxmemory 参数设定）

接下来把⽤⼾每次查询：

如果在 Redis 查到了，就直接返回
如果 Redis 中不存在，就从数据库查，把查到的结果同时也写⼊ Redis

如果缓存已经满了(达到上限)，就触发缓存淘汰策略，把⼀些 “相对不那么热⻔” 的数据淘汰掉。

按照上述过程，持续⼀段时间的“动态平衡”之后，Redis 内部的数据⾃然就是 “热⻔数据” 了。

通⽤的淘汰策略主要有以下⼏种：

下列策略并⾮局限于 Redis，其他缓存也可以按这些策略展开。

FIFO (First In First Out) 先进先出

把缓存中存在时间最久的 (也就是先来的数据) 淘汰掉

LRU (Least Recently Used) 淘汰最久未使⽤的

记录每个 key 的最近访问时间。把最近访问时间最⽼的 key 淘汰掉。

LFU (Least Frequently Used) 淘汰访问次数最少的

记录每个 key 最近⼀段时间的访问次数。把访问次数最少的淘汰掉。

Random 随机淘汰

从所有的 key 中抽取幸运⼉被随机淘汰掉。

理解上述⼏种淘汰策略：

想象你是个皇帝，有后宫佳丽三千。虽然你是 “真⻰天⼦”，但是经常宠幸的妃⼦也就那么寥寥数⼈(精⼒有限)。

后宫佳丽三千，相当于数据库中的全量数据。经常宠幸的妃⼦相当于热点数据，是放在缓存中的

今年选秀的⼀批新的⼩主，其中有⼀个被你看上了。宠信新⼈，⾃然就需要有旧⼈被冷落。到底谁是要被冷落的⼈呢?

FIFO：皇后是最先受宠的，现在已经年⽼⾊衰了，皇后失宠。
LRU：统计最近宠幸时间。皇后(⼀周前)，熹妃(昨天)，安答应(两周前)，华妃(⼀个⽉前)。华妃失宠。
LFU：统计最近⼀个⽉的宠幸次数，皇后(3次)，熹妃(15次)，安答应(1次)，华妃(10次)。安答应失宠。
Random：随机挑⼀个妃⼦失宠。

这⾥的淘汰策略，我们可以⾃⼰实现。当然 Redis 也提供了内置的淘汰策略，也可以供我们直接使⽤。

Redis 内置的内存淘汰策略如下：

volatile-lru 当内存不⾜以容纳新写⼊数据时，从设置了过期时间的key中使⽤ LRU（least recently used 最近最少使⽤）算法进⾏淘汰
allkeys-lru 当内存不⾜以容纳新写⼊数据时，从所有key中使⽤ LRU（最近最少使⽤）算法进⾏淘汰
volatile-lfu 4.0版本新增，当内存不⾜以容纳新写⼊数据时，在过期的key中，使⽤ LFU（least frequently used 最不经常使用）算法进⾏删除key
allkeys-lfu 4.0版本新增，当内存不⾜以容纳新写⼊数据时，从所有key中使⽤ LFU 算法进⾏淘汰
volatile-random 当内存不⾜以容纳新写⼊数据时，从设置了过期时间的key中，随机淘汰数据
allkeys-random 当内存不⾜以容纳新写⼊数据时，从所有key中随机淘汰数据
volatile-ttl 在设置了过期时间的key中，根据过期时间进⾏淘汰，越早过期的优先被淘汰(相当于 FIFO，只不过是局限于过期的 key)
noeviction 默认策略，当内存不⾜以容纳新写⼊数据时，新写⼊操作会报错。（不适用于实时更新缓存）