当前位置：首页 > news >正文

【面试题】MySQL的聚簇索引与非聚簇索引与主键索引：深入理解与应用

news 来源：原创 2024/9/20 10:41:57

文章目录

- - - 引言
    - 基础知识
    - 核心概念
    - 引擎上的区别
    - - InnoDB
      - MyISAM
    - 示例演示
    - 实际应用
    - 深入与最佳实践
    - 常见问题解答
    - 结语
    - 学习资源
    - 互动环节

引言

聚簇索引、非聚簇索引和主键索引的有什么区别你知道吗

在数据库设计中，索引是提高查询性能的关键。MySQL中的聚簇索引和非聚簇索引是两种不同的索引类型，它们在数据存储和检索方面有着显著的差异。理解这些差异对于优化数据库性能至关重要。

基础知识

聚簇索引（Clustered Index）：数据行的物理顺序与索引顺序相同的索引。
非聚簇索引（Non-Clustered Index）：数据行的物理顺序与索引顺序不同的索引。

核心概念

数据存储：聚簇索引将数据存储与索引结构结合在一起，非聚簇索引则将数据存储与索引分开。
查询性能：聚簇索引通常在查询时提供更快的访问速度，非聚簇索引可能需要额外的查找步骤。

聚簇索引、非聚簇索引和主键索引的主要区别
在于它们的存储方式、数据组织结构以及查询效率。‌

‌聚簇索引‌（Clustered Index）：

聚簇索引实际上并不是一种单独的索引类型，而是一种数据存储方式。在InnoDB存储引擎中，聚簇索引的叶子节点包含了完整的记录行，这意味着表的数据行都存放在索引树的叶子页中。
由于聚簇索引决定了表中数据的物理存储顺序，因此一张表只能有一个聚簇索引。InnoDB的聚簇索引实际上是将索引和数据保存在同一个B-Tree中，如果没有定义主键，InnoDB会选择一个合适的列作为聚簇索引，如果找不到合适的列，会使用一列隐藏的列DB_ROW_ID作为聚簇索引‌.

非聚簇索引‌（ n-clustered Index）：

非聚簇索引，也称为二级索引或辅助索引，其叶子节点仅包含主键值，而不包含完整的记录信息。通过非聚簇索引查找记录时，需要先通过非聚簇索引找到主键值，然后再通过主键值到聚簇索引中找到对应的记录行，这个过程称为回表查询。由于非聚簇索引的逻辑顺序与磁盘上行的物理存储顺序不同，因此一个表中可以拥有多个非聚簇索引。非聚簇索引的叶子节点中保存的不是指向行的物理指针，而是行的主键值，这有助于减少移动数据或分裂时维护非聚簇索引的开销‌

主键索引‌：

主键索引是一种特殊的聚簇索引，它确保了数据的唯一性。在关系数据库中，主键是唯一标识表中每一行的列。当为表设置主键时，MySQL会自动为该主键创建一个聚簇索引。因此，主键索引既是聚簇索引的一种，也是数据库表中数据组织的核心‌

面试常问：聚簇索引不一定是主键索引，而主键索引一定是聚簇索引。

可以理解成在聚簇索引上建立的索引，都是非聚簇索引（也称为二级索引或辅助索引）。因为一个表中只能有一个聚簇索引，其他都是非聚簇索引。

引擎上的区别

InnoDB

使用的是聚簇索引，比如若使用“where id=5“的条件查找主键，则按照B+树的检索算法，即可查找到对应的叶子节点，之后获得行数据。

若对employee_name 列进行条件搜索，则需要两个步骤：
1.在辅助索引B+树中检索非主键列（eg：employee_name ），到达其叶子节点获取对应的主键。
2.用主键在主索引B+树种再执行一次B+树检索操作，最终到达叶子节点获取整行数据。（重点在于通过其他键需要建立辅助索引）

聚簇索引默认是主键，若表中无定义主键，InnoDB会选择一唯一且非空的索引代替。若无这样的索引，InnoDB会隐式定义一个主键（类似 oracle中的Rowld，使用一列隐藏的列DB_ROW_ID作为聚簇索引‌)作为聚簇索引。

若已设了主键为聚簇索引又希望再单独设置聚簇索引，必须先删除原主键，然后添加，最后恢复设置主键即可。

MyISAM

便用的是非聚簇索引，只是存储的内容不同，主键索引B+树的节点存储了主键，辅助键索引IB+树存储了辅助键。

表数据存储在独立的地方（MYN文件），这两颗B+树的叶子节点都使用一个地址指向真正的表数据，对于表数据来说，这两个键没有任何差别。
由于索引树是独立的，通过辅助键检索无需访问主键的索引树。

示例演示

聚簇索引的使用：

CREATE TABLE employees (employee_id INT PRIMARY KEY,employee_name VARCHAR(100),department_name VARCHAR(100)
);

在这个例子中，employee_id是聚簇索引，因为它直接存储了数据行。

非聚簇索引的使用：
```
CREATE INDEX idx_department ON employees (department_name);
```
idx_department是非聚簇索引，因为它指向数据行的位置。

实际应用

查询优化：使用聚簇索引可以减少查询时的数据访问次数。
数据插入：聚簇索引可以减少数据插入时的页分裂。

深入与最佳实践

选择合适的索引类型：根据查询模式和数据访问模式选择合适的索引类型。
避免过度索引：过多的索引会降低数据修改的性能。

常见问题解答

Q: 为什么聚簇索引通常比非聚簇索引更快？
A: 聚簇索引的数据存储与索引结构结合在一起，减少了额外的数据查找步骤。
Q: 我应该在什么情况下使用非聚簇索引？
A: 当你需要基于非主键列进行频繁查询时，非聚簇索引是一个好的选择。

结语

聚簇索引和非聚簇索引在MySQL中有着不同的应用场景和性能特点。了解它们的差异和最佳实践，可以帮助你更好地设计数据库索引，提高查询性能。

学习资源

MySQL官方文档：Indexes

互动环节

分享你在数据库索引设计和优化方面的经验。

北京网站建设多少钱？

辽宁网页制作哪家好_网站建设

高端品牌网站建设_汉中网站制作

智能手机、汽车新应用，星纪魅族幸运星号”卫星即将发射

【LeetCode】03.无重复字符的最长子串

javascript利用for循环输出0-100的数

针对STM32串口输出乱码错误问题

心得与体会

JavaWeb JavaScript 9.正则表达式

【匈牙利汽车产业考察，开启新机遇】

学习Halcon可以从以下几个方面入手

数论——中国剩余定理（CRT）

AI自动采集教学行为——用AI来做机器学习部分和深度学习部分（含torch和cuda）包含机器学习模型和bert模型的使用

坐牢第三十五天（c++）

HTTP和HTTPS的区别？哪一个更适合你的网站？

Java核心知识体系-并发与多线程：线程基础

2024.9.2

中国剩余定理和扩展中国剩余定理（模板）

ES6指北【2】—— 箭头函数

hexo+github搭建个人博客

“大数据应用场景”之隔壁老王（连载四）

「前端」从UglifyJSPlugin强制开启css压缩探究webpack插件运行机制

【mysql】环境安装、服务启动、密码设置

【技术性】Search知识

CAP理论的例子讲解

eclipse的离线汉化

es6要点

Java反射-动态类加载和重新加载

leetcode-27. Remove Element

Linux链接文件

Promise面试题，控制异步流程

Python学习之路13-记分

React as a UI Runtime(五、列表)

Stream流与Lambda表达式（三）静态工厂类Collectors

Vue学习第二天

vue中实现单选

排序算法学习笔记

前端 CSS : 5# 纯 CSS 实现24小时超市

前端自动化解决方案

实战｜智能家居行业移动应用性能分析

为视图添加丝滑的水波纹

STM32通过SPI硬件读写W25Q64

iOS实时查看App运行日志

一些不规范的GTID使用场景

（03）光刻——半导体电路的绘制

（12）Linux 常见的三种进程状态

（LeetCode 49）Anagrams

（PHP）设置修改 Apache 文件根目录 (Document Root)（转帖）

（Redis使用系列） SpringBoot中Redis的RedisConfig 二

（超详细）语音信号处理之特征提取

（附源码）ssm户外用品商城毕业设计 112346

(附源码)计算机毕业设计ssm-Java网名推荐系统

(几何:六边形面积)编写程序，提示用户输入六边形的边长，然后显示它的面积。

（十）c52学习之旅-定时器实验

(转载)hibernate缓存

.net core docker部署教程和细节问题