当前位置: 首页 > news >正文

面试官:我看你简历上写了MySQL,对MySQL InnoDB引擎的索引了解吗?

面试官我看你简历上写了MySQL,对MySQL InnoDB引擎的索引了解吗?

候选者:嗯啊,使用索引可以加快查询速度,其实上就是将无序的数据变成有序(有序就能加快检索速度)

选者:在InnoDB引擎中,索引的底层数据结构是B+树

面试官那为什么不使用红黑树或者B树呢?

候选者:MySQL的数据是存储在硬盘的,在查询时一般是不能「一次性」把全部数据加载到内存中

候选者:红黑树是「二叉查找树」的变种,一个Node节点只能存储一个Key和一个Value

候选者:B和B+树跟红黑树不一样,它们算是「多路搜索树」,相较于「二叉搜索树」而言,一个Node节点可以存储的信息会更多,「多路搜索树」的高度会比「二叉搜索树」更低。

候选者:了解了区别之后,其实就很容易发现,在数据不能一次加载至内存的场景下,数据需要被检索出来,选择B或B+树的理由就很充分了(一个Node节点存储信息更多(相较于二叉搜索树),树的高度更低,树的高度影响检索的速度)

候选者:B+树相对于B树而言,它又有两种特性。

候选者:一、B+树非叶子节点不存储数据,在相同的数据量下,B+树更加矮壮。(这个应该不用多解释了,数据都存储在叶子节点上,非叶子节点的存储能存储更多的索引,所以整棵树就更加矮壮)

候选者:二、B+树叶子节点之间组成一个链表,方便于遍历查询(遍历操作在MySQL中比较常见)

d19b18d153554562992b5491d6b14635.png 

候选者:我稍微解释一下吧,你可以脑补下画面

候选者:我们在MySQL InnoDB引擎下,每创建一个索引,相当于生成了一颗B+树。

候选者:如果该索引是「聚集(聚簇)索引」,那当前B+树的叶子节点存储着「主键和当前行的数据」

候选者:如果该索引是「非聚簇索引」,那当前B+树的叶子节点存储着「主键和当前索引列值」

候选者:比如写了一句sql:select * from user where id >=10,那只要定位到id为10的记录,然后在叶子节点之间通过遍历链表(叶子节点组成的链表),即可找到往后的记录了。

候选者:由于B树是会在非叶子节点也存储数据,要遍历的时候可能就得跨层检索,相对麻烦些。

候选者:基于树的层级以及业务使用场景的特性,所以MySQL选择了B+树作为索引的底层数据结构。

候选者:对于哈希结构,其实InnoDB引擎是「自适应」哈希索引的(hash索引的创建由InnoDB存储引擎引擎自动优化创建,我们是干预不了)

面试官:嗯…那我了解了,顺便想问下,你知道什么叫做回表吗?

候选者:所谓的回表其实就是,当我们使用索引查询数据时,检索出来的数据可能包含其他列,但走的索引树叶子节点只能查到当前列值以及主键ID,所以需要根据主键ID再去查一遍数据,得到SQL 所需的列

候选者:举个例子,我这边建了给订单号ID建了个索引,但我的SQL 是:select orderId,orderName from orderdetail where orderId = 123

候选者:SQL都订单ID索引,但在订单ID的索引树的叶子节点只有orderId和Id,而我们还想检索出orderName,所以MySQL 会拿到ID再去查出orderName给我们返回,这种操作就叫回表

49fe181f636e47e6ac7b70dbf17209aa.png 

候选者:想要避免回表,也可以使用覆盖索引(能使用就使用,因为避免了回表操作)。

候选者:所谓的覆盖索引,实际上就是你想要查出的列刚好在叶子节点上都存在,比如我建了orderId和orderName联合索引,刚好我需要查询也是orderId和orderName,这些数据都存在索引树的叶子节点上,就不需要回表操作了。

面试官既然你也提到了联合索引,我想问下你了解最左匹配原则吗?

候选者:嗯,说明这个概念,还是举例子比较容易说明

候选:如有索引 (a,b,c,d),查询条件 a=1 and b=2 and c>3 and d=4,则会在每个节点依次命中a、b、c,无法命中d

候选者:先匹配最左边的,索引只能用于查找key是否存在(相等),遇到范围查询 (>、<、between、like左匹配)等就不能进一步匹配了,后续退化为线性查找

候选者:这就是最左匹配原则

b43b3ecd7e7047fda7edee1f6ec72725.png 

面试官嗯嗯,我还想问下你们主键是怎么生成的?

候选者:主键就自增的

面试官那假设我不用MySQL自增的主键,你觉得会有什么问题呢?

候选者:首先主键得保证它的唯一性和空间尽可能短吧,这两块是需要考虑的。

候选者:另外,由于索引的特性(有序),如果生成像uuid类似的主键,那插入的的性能是比自增的要差的

候选者:因为生成的uuid,在插入时有可能需要移动磁盘块(比如,块内的空间在当前时刻已经存储满了,但新生成的uuid需要插入已满的块内,就需要移动块的数据)

面试官:OK…

50ed3dcb7e7e44a29d50ece582991f4e.png 

本文总结

  • 为什么B+树?数据无法一次load到内存,B+树是多路搜索树,只有叶子节点才存储数据,叶子节点之间链表进行关联。(树矮,易遍历)

  • 什么是回表?非聚簇索引在叶子节点只存储列值以及主键ID,有条件下尽可能用覆盖索引避免回表操作,提高查询速度

  • 什么是最左匹配原则?从最左边为起点开始连续匹配,遇到范围查询终止

  • 主键非自增会有什么问题?插入效率下降,存在移动块的数据问题

相关文章:

  • 微信小程序SEO指南
  • steam搬砖项目一直很稳定,部分反馈
  • Python调试指南
  • ICE常见编译和运行(异常)错误
  • 【职场成长】一篇文章,讲清复盘!
  • java面向对象解释
  • 基于SpringBoot+Vue的公益互助系统的设计与实现
  • 不怕问题多,就怕不复盘,超详细复盘步骤呈上,建议收藏
  • 神经网络模式识别方法,神经网络模式识别代码
  • DOM--事件响应链(冒泡目标捕获)
  • 测试人生 | 做了低薪运营6年,妹纸靠什么转行拿下 20W 年薪?
  • 获取Optimism 代币OP的五种方式
  • bugku misc disordered_zip
  • JVM面试常考的4个问题详解
  • 画画用电容笔还是触控笔?电容笔10大品牌排行榜
  • [笔记] php常见简单功能及函数
  • 【剑指offer】让抽象问题具体化
  • Less 日常用法
  • Node项目之评分系统(二)- 数据库设计
  • python 装饰器(一)
  • Sequelize 中文文档 v4 - Getting started - 入门
  • SpriteKit 技巧之添加背景图片
  • Travix是如何部署应用程序到Kubernetes上的
  • use Google search engine
  • webpack4 一点通
  • 百度小程序遇到的问题
  • 分布式事物理论与实践
  • 欢迎参加第二届中国游戏开发者大会
  • 前端相关框架总和
  • 前端性能优化——回流与重绘
  • 验证码识别技术——15分钟带你突破各种复杂不定长验证码
  • 在Docker Swarm上部署Apache Storm:第1部分
  • ​如何使用ArcGIS Pro制作渐变河流效果
  • $.type 怎么精确判断对象类型的 --(源码学习2)
  • (C#)一个最简单的链表类
  • (pojstep1.3.1)1017(构造法模拟)
  • (Python) SOAP Web Service (HTTP POST)
  • (附源码)python房屋租赁管理系统 毕业设计 745613
  • (紀錄)[ASP.NET MVC][jQuery]-2 純手工打造屬於自己的 jQuery GridView (含完整程式碼下載)...
  • (欧拉)openEuler系统添加网卡文件配置流程、(欧拉)openEuler系统手动配置ipv6地址流程、(欧拉)openEuler系统网络管理说明
  • (十二)devops持续集成开发——jenkins的全局工具配置之sonar qube环境安装及配置
  • (一)RocketMQ初步认识
  • (一)Thymeleaf用法——Thymeleaf简介
  • (原創) 如何安裝Linux版本的Quartus II? (SOC) (Quartus II) (Linux) (RedHat) (VirtualBox)
  • (转)es进行聚合操作时提示Fielddata is disabled on text fields by default
  • ***详解账号泄露:全球约1亿用户已泄露
  • **PyTorch月学习计划 - 第一周;第6-7天: 自动梯度(Autograd)**
  • .“空心村”成因分析及解决对策122344
  • .htaccess配置重写url引擎
  • .Net 6.0 处理跨域的方式
  • .net framework profiles /.net framework 配置
  • @ 代码随想录算法训练营第8周(C语言)|Day53(动态规划)
  • @angular/cli项目构建--http(2)
  • [ vulhub漏洞复现篇 ] GhostScript 沙箱绕过(任意命令执行)漏洞CVE-2019-6116
  • [ vulhub漏洞复现篇 ] Jetty WEB-INF 文件读取复现CVE-2021-34429