当前位置: 首页 > news >正文

Mysql索引学习

mysql索引-自学版

  • 1 索引语法
  • 2 索引类别
  • 3 索引原理
    • 磁盘IO与预读
    • 索引数据结构 B+树
      • B+树的前生今世
      • B+ 树代码(进阶)
  • 4 索引使用策略及优化
    • 优化索引的几种方法
  • 索引常见面试题
    • 面经实战

1 索引语法

索引的语法:创建、修改、增加、删除等操作,查询此链接:
菜鸟教程-MySQL 索引
or
Mysql索引(一篇就够le)

2 索引类别

mysql使用较多的存储引擎:InnoDB、MyISAM等,其中InnoDB支持的索引是B+树索引、Hash索引、全文索引,MyISAM使用的是Hash索引。
有关 mysql 所有的索引类型参考官网:
官网

我们可以按照四个角度来分类索引。

按「数据结构」分类:B+tree索引、Hash索引、Full-text索引。
按「物理存储」分类:聚簇索引(主键索引)、二级索引(辅助索引)。
按「字段特性」分类:主键索引、唯一索引、普通索引、前缀索引。
按「字段个数」分类:单列索引、联合索引。

3 索引原理

以下内容(磁盘IO与预读、索引数据结构 B+树、索引使用策略及优化)学自此文章的前半部分内容:
MySQL索引原理及慢查询优化

数据库数据保存在磁盘上,且为了提高性能,每次只将部分数据读入内存,众所周知,访问磁盘的成本是访问内存的十万倍左右,因此,我们需要一种高效的搜索方式。

磁盘IO与预读

为什么访问磁盘的成本很高?访问磁盘的操作有哪几步?它们所用的时间?
考虑到磁盘IO是非常高昂的操作,操作系统做了哪些优化?

索引数据结构 B+树

根据磁盘IO的特点,我们的诉求:每次查找数据时将磁盘的IO次数控制在很小的数量级,最好是常数数量级,于是 B+ 树应运而生。

B+树的前生今世

想要介绍 B+ 树,就不得不提起二叉查找/排序树(BST)、平衡二叉树(AVL) 和 B 树这三种数据结构。B+ 树就是从它们三个演化而来的。见此文章。
二叉树、平衡二叉树、B-Tree、B+Tree 说明

此文章也讲了一系列树的演变,并且还讲解了B树的结点定义、插入、删除等的过程,以及R树,可补充看:
从B树、B+树、B*树谈到R 树

B+ 树代码(进阶)

B+树重要性不用多说,一起来研究B+树的源码

4 索引使用策略及优化

创建索引的几大原则:
1.最左前缀匹配原则,非常重要的原则,mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配,比如a = 1 and b = 2 and c > 3 and d = 4 如果建立(a,b,c,d)顺序的索引,d是用不到索引的,如果建立(a,b,d,c)的索引则都可以用到,a,b,d的顺序可以任意调整。

2.=和in可以乱序,比如a = 1 and b = 2 and c = 3 建立(a,b,c)索引可以任意顺序,mysql的查询优化器会帮你优化成索引可以识别的形式。

3.尽量选择区分度高的列作为索引,区分度的公式是count(distinct col)/count(*),表示字段不重复的比例,比例越大我们扫描的记录数越少,唯一键的区分度是1,而一些状态、性别字段可能在大数据面前区分度就是0,那可能有人会问,这个比例有什么经验值吗?使用场景不同,这个值也很难确定,一般需要join的字段我们都要求是0.1以上,即平均1条扫描10条记录。

4.索引列不能参与计算,保持列“干净”,比如from_unixtime(create_time) = ’2014-05-29’就不能使用到索引,原因很简单,b+树中存的都是数据表中的字段值,但进行检索时,需要把所有元素都应用函数才能比较,显然成本太大。所以语句应该写成create_time = unix_timestamp(’2014-05-29’)。

5.尽量的扩展索引,不要新建索引。比如表中已经有a的索引,现在要加(a,b)的索引,那么只需要修改原来的索引即可。

优化索引的几种方法

源自:优化索引的几种方法

  1. 前缀索引优化;
  2. 覆盖索引优化;
  3. 主键索引最好是自增的;
  4. 防止索引失效;

索引常见面试题

来自 索引常见面试题

  1. 什么是索引?
  2. 索引的分类?(从四个角度进行分类)
  3. B+树索引原理?查找过程?
  4. 为什么 MySQL InnoDB 选择 B+tree 作为索引的数据结构?(B+树的优势)
  5. 联合索引?
  6. 什么时候需要 / 不需要创建索引?
  7. etc.

面经实战

  1. MySQL的 InnoDB 索引数据结构
  2. mysql中 inoodb 的索引有哪些种类
  3. B+树索引具体是怎么实现的
  4. B树与B+树的区别
  5. 为什么B+树的中间节点不储存数据?
  6. 给一个索引,在有的查询过程中他没有走索引查询,说说你能想到的原因
  7. 聚簇索引、非聚簇索引
  8. 聚簇索引比非聚簇索引的优点

相关文章:

  • Unity(第十七部)Unity自带的角色控制器
  • 数据结构与算法:堆
  • Carla自动驾驶仿真九:车辆变道路径规划
  • 基于ssm江苏融汇房地产营销策划有限公司的宣传网站
  • 蓝桥杯算法题汇总
  • mysql使用连接池
  • 6、wuzhicms代码审计
  • 【JSON2WEB】07 Amis可视化设计器CRUD增删改查
  • 把简单留给用户,把复杂交给 AI
  • 新形势下第三方支付公司如何盈利
  • 小白学视觉 | 详解遗传算法 GA(Python实现代码)
  • 软件测试测试文档编写
  • 多线程(进阶四:线程安全的集合类)
  • 【JavaSE】时间类相关API以及使用
  • c++基础知识补充4
  • 03Go 类型总结
  • angular组件开发
  • ES6系列(二)变量的解构赋值
  • HashMap ConcurrentHashMap
  • Laravel Telescope:优雅的应用调试工具
  • Laravel 中的一个后期静态绑定
  • PaddlePaddle-GitHub的正确打开姿势
  • Quartz初级教程
  • Redash本地开发环境搭建
  • SpriteKit 技巧之添加背景图片
  • Synchronized 关键字使用、底层原理、JDK1.6 之后的底层优化以及 和ReenTrantLock 的对比...
  • 从0到1:PostCSS 插件开发最佳实践
  • 第三十一到第三十三天:我是精明的小卖家(一)
  • 构建二叉树进行数值数组的去重及优化
  • 基于Volley网络库实现加载多种网络图片(包括GIF动态图片、圆形图片、普通图片)...
  • 开源中国专访:Chameleon原理首发,其它跨多端统一框架都是假的?
  • 使用docker-compose进行多节点部署
  • 微信如何实现自动跳转到用其他浏览器打开指定页面下载APP
  • 译有关态射的一切
  • ​​​​​​​Installing ROS on the Raspberry Pi
  • ​一帧图像的Android之旅 :应用的首个绘制请求
  • #NOIP 2014# day.1 T3 飞扬的小鸟 bird
  • (done) NLP “bag-of-words“ 方法 (带有二元分类和多元分类两个例子)词袋模型、BoW
  • (笔试题)分解质因式
  • (个人笔记质量不佳)SQL 左连接、右连接、内连接的区别
  • (转)Android学习笔记 --- android任务栈和启动模式
  • (轉貼) 2008 Altera 亞洲創新大賽 台灣學生成果傲視全球 [照片花絮] (SOC) (News)
  • (最完美)小米手机6X的Usb调试模式在哪里打开的流程
  • * CIL library *(* CIL module *) : error LNK2005: _DllMain@12 already defined in mfcs120u.lib(dllmodu
  • .htaccess配置重写url引擎
  • .NET “底层”异步编程模式——异步编程模型(Asynchronous Programming Model,APM)...
  • .Net 8.0 新的变化
  • .net core 实现redis分片_基于 Redis 的分布式任务调度框架 earth-frost
  • .NET 同步与异步 之 原子操作和自旋锁(Interlocked、SpinLock)(九)
  • .netcore 获取appsettings
  • .NET开发者必备的11款免费工具
  • /var/log/cvslog 太大
  • ::前边啥也没有
  • @Autowired @Resource @Qualifier的区别
  • @Transactional类内部访问失效原因详解