当前位置：首页 > news >正文

一文掌握MySQL的索引(认真排版、简洁易懂)

news 来源：原创 2024/5/19 1:10:03

由于现在企业基本上都使用innodb引擎，所以本文讲的是innodb引擎上的索引。

先思考一个问题，为什么在数据库上加了索引后查询速度变得这么快？

索引是什么？

索引是按照一定结构存放在磁盘里的数据。这种做据结构，是一种能高效检索数据的数据结构。
想象一下，磁盘上那么多数据，要如何快速找到想要的某些数据呢？是不是得像图书馆的书一样，对它们进行编排，比如想要在茫茫书海里找到沈从文的《边城》，我们会走到文学区，再找到中国文学的货架。mysql的索引也类似，但更高级。

二叉平衡树

(1) 我们可以先想象一下，有很多号码球放在地上，你要如何归类摆放，以后才能快速找到某个号码。先思考一会儿再往下看。大家可能会想到二分法，按顺序分成两大份，每份里面又分成两份。

(2) 先来看一种简单的树据结构，二叉平衡树。便于后面理解索引使用的B+树。
在这里插入图片描述
如上图，每个号码球下面分两个叉，左边的球小，右边的球大。如果我们要寻找5号球在哪里，先从入口球4号开始往下寻找，5比4大走右下方遇到6，5比6小往左下方遇到5，就找到了。两三步就准确的找到了。

(3) 看起来，感觉检索数据的能力还不错。但这里有个严重的问题，如果数据量特别大的时候，比如有100万个号码球，这颗树会特别高，枝繁叶茂，检索数据就会一层一层往下检索，很慢很慢。

对应到数据库，上面的数字可以理解成数据库里表的主键id，每个id背后存放了对应的一行数据。

B树：

再来看看B树，它其实是一颗多叉树。也是左边的数字小，右边的数字大。
在这里插入图片描述

如果想找到8，从入口7开始，8比7大往右下方走，遇到9和11采用二分法，8比9小，往左下方，找到了8

现在能存不少的数据量了，树的高度也大大缩减了。看似已经很好了，然而，大神们认为还有优化的空间。
(1) 这个树据结构不支持数据的范围查找，比如要找大于等于7 且小于等于12的所有数据，就只能每个值重新从头开始一个节点一个节点寻找，性能很差。

(2) 由于每个节点都存储了用户的每行数据，所以树的高度，还是会比较高，能不能哪怕是百万千万行甚至是亿级别的数据，树的高度都控制在三四层？

B+树：

最后，找到了完美的方案，树够矮，也支持按范围查询。
在这里插入图片描述
(1) 大家有没有发现什么不一样，长得跟B树好像一样，你再认真瞅瞅。是不是发现了里面出现了重复的数字，并且最下面一排是从小到大连续的所有数字。所以就是说数据库表的最下面一排包含了所有主键id，我们就可以把id对应一行的数据全部存到最下面一排，上面不存数据，只存索引值(主键id)。

(2) 现在来说说刚才B树的两个问题，这里得到了解决。
我们把最下面一排称为叶子节点。由于非叶子节点没存放数据，所以它能存放的索引值就更多，而且是很多很多，树的高度问题解决了。

范围查询的问题，一看便知，最下面一排是连续的，所以当然支持范围查询。

最终索引长这样(一级索引)

如下图，这就是mysql的索引，我们称它为一级索引(也可以叫主键索引、聚集索引)。这也是B+树的样子，也是mysql存放的数据的样子
在这里插入图片描述

二级索引

现在来讲讲二级索引，也就是非主键索引，比如你在user表的username字段加了索引，这索引在底层的结构将长这样：
在这里插入图片描述
它按照英文字母的顺序从左到右排列，最下面是主键id。比如要查找 username = ‘ella’，按上面讲到的原理，最终获取到的不是具体数据，而是主键id，然后通过主键id再去一级索引里查找到最终的数据。因为索引也是一张表，所以这就叫回表。

什么是联合索引

(1) 举个例子，给用户表创建一个联合索引，以 name age position三个字段的联合索引

ALTER TABLE `user` ADD INDEX `n_a_p`(`name`,`age`,`position`) USING BTREE;

先用我们日常生活语言来解释下，比如一个公司，把所有员工叫过来，请大家先按姓名的字母顺序从左到右站成一排，如果姓名相同，年龄小的站左边，如果年龄也相同，职位(按英文字母排序)小的站左边。

(2) 现在来看图，就很好理解了。联合索引长这样：
在这里插入图片描述

(3) 现在能明白最左原则是什么了吧？

这个会走索引：select * from user where name='bill' and age=30;，因为按照约定的规律，很快就能找到名字叫bill并且30岁的人。

这个不走索引：select * from user where age=30 and position='manager';你想找到年龄是30岁且职位是manager的人，只能从头到尾一个一个去查，没有规律。

索引，差不多讲完了。准备收尾。

优点：

(1) 减少磁盘IO操作，检索数据快。因为在磁盘中检索数据的次数少。
(2) order by、group by 时，速度快。因为数据结构决定，排好序了。
(3) 支持范围查询。原因同上。

缺点：

(1) 硬盘上多占了空间，数据库变得更大。因为索引也是一份数据，存在磁盘上的数据；
(2) 插入和更新数据时，效率变低。因为同时也需要维护索引数据。

不建议建索引的情况

(1) 数据重复度高的字段，比如性别、发货状态
(2) 数据量少的表
(3) where 条件使用不到的字段

为什么建议主键使用自增整型？

回想一下上面说的索引、B+树，它是按顺序排列好的一组数据。如果你的主键是UUID，插入一条数据时，按照从小到大从左到右的判断后，这个主键会被插入B+树的中间，就会导致树分裂、重新排序，性能就很差。自增整型不会使B+树分裂，每新增一个值的时候就往最右下方安放。

尽量减少索引的数量

千万别说，我每个字段都建了索引，怎么还是这么慢呢？

尽量少用或不用 join 联表

数据库底层对联表的算法很复杂，性能很不好。建议不能超过3个join

十、mongodb分片集群运维相关

每日十(?)题之20220903

2.数据结构与算法进阶知识

下载JDK8 JVM源码

基于某钉探索针对CEF框架的一些逆向思路

C++迭代器

关联容器(字典)map

欧拉函数——最大公约数（gcd+筛质数+欧拉函数）

【小程序】网络请求API介绍及网络请求的封装

ALTERA FPGA IPCORE核之单口RAM详细教程

Windows与网络基础-17-组策略应用

Python机器学习-多元分类的5种模型

k8s之client-go和ctrl的各种k8s client

排序1：快速排序(三种)、归并排序、计数排序

LeetCode每日一题——1582. 二进制矩阵中的特殊位置

[ JavaScript ] 数据结构与算法 —— 链表

30天自制操作系统-2

Create React App 使用

CSS实用技巧

js 实现textarea输入字数提示

leetcode378. Kth Smallest Element in a Sorted Matrix

markdown编辑器简评

PHP 程序员也能做的 Java 开发 30分钟使用 netty 轻松打造一个高性能 websocket 服务...

vagrant 添加本地 box 安装 laravel homestead

vue+element后台管理系统，从后端获取路由表，并正常渲染

如何在 Tornado 中实现 Middleware

入门级的git使用指北

扫描识别控件Dynamic Web TWAIN v12.2发布，改进SSL证书

详解移动APP与web APP的区别

译自由幺半群

微龛半导体获数千万Pre-A轮融资，投资方为国中创投 ...

ubuntu16.04 fastreid训练过程

LeetCode解法汇总2670. 找出不同元素数目差数组

#控制台大学课堂点名问题_课堂随机点名

（1）(1.13) SiK无线电高级配置（六）

（1）虚拟机的安装与使用,linux系统安装

(iPhone/iPad开发)在UIWebView中自定义菜单栏

（LeetCode C++）盛最多水的容器

(Matlab)使用竞争神经网络实现数据聚类

（PHP）设置修改 Apache 文件根目录 (Document Root)（转帖）

（pytorch进阶之路）CLIP模型实现图像多模态检索任务

（TOJ2804）Even? Odd?

（多级缓存）多级缓存

（附源码）ssm基于jsp高校选课系统毕业设计 291627

（附源码）ssm考生评分系统毕业设计 071114

（免费领源码）python#django#mysql公交线路查询系统85021- 计算机毕业设计项目选题推荐

（三） prometheus + grafana + alertmanager 配置Redis监控

（十七）Flask之大型项目目录结构示例【二扣蓝图】

(转)Groupon前传：从10个月的失败作品修改，1个月找到成功

(转)关于pipe()的详细解析

.NET CORE Aws S3 使用

.NET 应用架构指导 V2 学习笔记（一）软件架构的关键原则

.NET/C# 避免调试器不小心提前计算本应延迟计算的值

.NET关于跳过SSL中遇到的问题

[1204 寻找子串位置] 解题报告