当前位置: 首页 > news >正文

以后面试官问你 为啥不建议使用Select *,请你大声回答他!

前言



不建议使用 select  * 

这几个字眼,做开发的都不陌生吧。

阿里的开发手册上面也是有提到:


昨晚收到一个小兄弟的反馈:

(称呼打码了,这是我的隐私,不可能让你们知道的)


随后也问了下学习群里的兄弟们,

不敢吱声的:

 好像派:

 

 离谱的:

那么,我作为一个出手侠, 我必然要出手了。


出手侠:
习惯用语,等到xxxxx的时候,我就会出手。
 

正文

其实阿里巴巴手册上说明的三点了:



1) 增加查询分析器解析成本

什么是分析器成本,什么东西,我随手画个简图,大家知道一下:

 

就是这个分析器,这里会去解析你的sql的语法,词法。

举例,如果是select * from  user , 看到 * ,就会去看看是哪个表 user,然后
Query Table Metadata For Columns,把所有列值给你支楞出来,

填充成类似  select id ,name ,age,phone form user 这样子。(当然还有其他分析了,例如如语法的判断, 字段的判断, 表名等等)

说实话。这个分析器的成本....你要是说增加了解析成本,我确实能理解。

但是我感觉成本也不是很大.... 除非是个大表,大到查询完所有列值? 

so,我能接受,但是接受得不多。

2) 增减字段,容易与resultMap 配置不一致 

这一点我不想说。说实在的,有时候写select *(需要查表所有列值的时候), 我实体加了字段,我改了resultMap ,我sql还不用动。

这一点属于是平时使用规范上的规避点了,不多言。

3)无用字段增加网络消耗、磁盘IO开销

这一点有讲究。 

可以看到我第一点里面画的简图, 如果说

不考虑缓存 存在的时候: 

 

最终会走到执行器,然后执行器后面其实是引擎层

 引擎层这里我就不展开了,引擎层里面其实包括了各种日志(undo、redo、binlog等)的记录,

  还有就是在内存里找数据。

  简单点归纳,其实这种查询操作就是刷盘操作,从磁盘刷入内存,涉及到的 磁盘IO开销。

那么在刷盘操作的时候,是不是真的selec *  就真的会 增加 磁盘IO开销呢?

答案,肯定是的。 但是 增大的影响程度,我必须说一下。

如果你说 ,表里面就三字段 , id ,name ,age  ,

本来查 id ,name ; 因为 select * ,变成查多了一个 age , 增大磁盘IO开销 ? 
 

我觉得是增大了,但是几乎不用理。 因为这些都是正常的数据类型,开销增大不了多少。

所以,真正隐藏的雷是什么?

有大字段
例如 
tinytext、text、mediumtext、longtext  

tinybob、blob、mediumblob、longblob

这些家伙,在mysql上,就是当做一个独立的对象处理

这时候就真的要谨慎了。

如果你是个比较多字段的表,例如什么意见反馈表,留言不确定长度,用了text ,还有回复留言字段也用了text ;

又例如博客文本表,为了存content,用了这些大字段。

本来想查询一下 意见的反馈人名 ,或者是 查询博客的标题,
结果因为懒或者不注意,写了select *., 查询的时候带出来这些 大字段。

那么显然,这时候读取的内容数据就是真的比原先初衷要大很多(没准业主小丹投诉保安,意见反馈的留言给你写了篇小论文), 这时候因为读取的内容多,磁盘IO开销多,然后返回数据包给客户端量也多, 这样 就真的是有影响了。

4) 补充,其实也是我首当其冲想说的一点

无法使用索引覆盖

ps:今天学习成语了吗? 不要乱用成语。

select * 基本告别索引覆盖了

什么是索引覆盖? 

举例 :

给name字段 建索引, 查询的时候,只用到了 索引的字段,这就是索引覆盖 。

也就是直接通过查询索引,拿出来的数据就已经满足了查询返回的字段数据。 无需额外其他查询操作了,也就是索引覆盖了。 这样肯定快。

如果初衷是查 name, 结果写成了 select * , 变成查多了其他字段, 那其他字段不是索引,肯定无法触发索引覆盖使用场景了,也就是需要额外的回表查询操作了,那这样就慢了。

ps: 对回表不了解的,可以看看这篇先
MySql 索引失效、回表解析_小目标青年的博客

回归正题,因为写成select * ,变成查多了其他字段, 其他字段不是索引,导致回表,慢。

 问题出在哪里?  出在其他字段不是索引?

那么给其他字段都建索引呗,完事了兄弟们。

你们千万不要这么乱搞,索引的维护成本一定是不能忽视的。

涉及到修改新增删除数据时索引的维护成本,索引页的分裂合并等等。

索引也是需要存起来的,也是需要占用磁盘空间的。

而且如果N个字段都是索引, 随便改动一行数据,需要维护N个索引。

什么概念,就像咱们平时写word文档,搞了个目录,然后底下的2级标题

3级标题,正文啥的,什么分页啥的,乱七八糟操作的编辑,都需要去刷新一下目录。

那么这个索引覆盖影响真的非常大吗?

记得我是手里有200W数据的男人吗?

Mysql 我随手造200W条数据,给你们讲讲分页优化。

拿出200W数据的表,删除全部索引,给 platform_sn 单独加索引 :

然后先试试索引覆盖的查询,看看用时,0.02秒 :

 接着换成select * :

当然这是 200W 数据的场景下, 不过可以看出,时间差距还是很明显。 

0.02  到 0.179 .... 

如果我们再加几个大字段? Text ... 那估计就真的离谱了 。 


 

客观总结:
 

1. 如果表里有大字段,TEXT 、BLOB系列类型字段, 使用 SELECT * 需要注意

2. 如果本来只查询某1,2个比较常用的字段的,可以给这些字段建单个索引或者组合索引 ,这时候查询就避免 使用 SELECT *,尽量能触发索引覆盖是最好的了

3. 如果表字段不多,也没啥特殊字段类型, 而且肯定是查多列的,无法触发索引覆盖的情况下,

   我觉得 使用 SELECT *  也无妨   ,或者写个<select cloum> 里面列出所有字段,这样copy代码      也方便(因为会存在一种情况就是,数据库里面有这个字段,但是不能查出来,这种情况select * 就是不如写成 select <select cloum> 这种方式方便了,只需要在<select cloum>  提除某个字段就 可以)。

相关文章:

  • Springboot 导入导出Excel ,一对多关系,复合表格、合并单元格数据
  • 怎么清晰地理解、表达 IaaS 、 PaaS 、 SaaS ?
  • UML类图的六大关系,最佳学习理解方式
  • Springboot 整合 Socket 实战案例 ,实现 单点发送、广播群发,1对1,1对多
  • Springboot Mybatis 、JPA 调用存储过程,实战教程
  • 写代码的七八九十宗罪,多图、胆小慎入!
  • Springboot byte[] 转 MultipartFile ,InputStream 转 MultipartFile
  • Springboot 最细节全面的接口传参接参介绍,总有你喜欢的一种方式
  • Springboot 整合RabbitMq ,用心看完这一篇就够了
  • 用过Apifox这个API接口工具后,确实感觉postman有点鸡肋......
  • ClickHouse 挺快,esProc SPL 更快
  • 苹果6sp内存可以扩展吗_饮用苹果醋可以减肥吗?
  • tcpdump抓两个网卡的包_Kubernetes 疑难杂症排查分享:神秘的溢出与丢包
  • 使用vim的重不重要_如何优雅地使用 Vim?
  • hbase 使用disruptor_HBase和Kryo混合使用时出现的jar包冲突
  • [译]CSS 居中(Center)方法大合集
  • 【挥舞JS】JS实现继承,封装一个extends方法
  • AHK 中 = 和 == 等比较运算符的用法
  • Angular4 模板式表单用法以及验证
  • DataBase in Android
  • EventListener原理
  • Fastjson的基本使用方法大全
  • Hibernate【inverse和cascade属性】知识要点
  • Otto开发初探——微服务依赖管理新利器
  • windows下使用nginx调试简介
  • 创建一种深思熟虑的文化
  • 从@property说起(二)当我们写下@property (nonatomic, weak) id obj时,我们究竟写了什么...
  • 多线程 start 和 run 方法到底有什么区别?
  • 开发基于以太坊智能合约的DApp
  • 开放才能进步!Angular和Wijmo一起走过的日子
  • 强力优化Rancher k8s中国区的使用体验
  • 要让cordova项目适配iphoneX + ios11.4,总共要几步?三步
  • 自定义函数
  • ​低代码平台的核心价值与优势
  • ​力扣解法汇总1802. 有界数组中指定下标处的最大值
  • # centos7下FFmpeg环境部署记录
  • # 再次尝试 连接失败_无线WiFi无法连接到网络怎么办【解决方法】
  • (C语言)strcpy与strcpy详解,与模拟实现
  • (过滤器)Filter和(监听器)listener
  • (顺序)容器的好伴侣 --- 容器适配器
  • (四)Linux Shell编程——输入输出重定向
  • (转)如何上传第三方jar包至Maven私服让maven项目可以使用第三方jar包
  • (转载)PyTorch代码规范最佳实践和样式指南
  • * CIL library *(* CIL module *) : error LNK2005: _DllMain@12 already defined in mfcs120u.lib(dllmodu
  • .NET CORE Aws S3 使用
  • .Net 高效开发之不可错过的实用工具
  • .Net 垃圾回收机制原理(二)
  • .NET/C# 使用反射调用含 ref 或 out 参数的方法
  • .Net的DataSet直接与SQL2005交互
  • .NET实现之(自动更新)
  • .sdf和.msp文件读取
  • @Pointcut 使用
  • @Responsebody与@RequestBody
  • @Transactional 详解
  • [ 网络基础篇 ] MAP 迈普交换机常用命令详解