当前位置: 首页 > news >正文

【数据库】MySql深度分页SQL查询优化

问题描述

mysql中,使用limit+offset实现分页难免会遇到深度分页问题,即页码数越大,性能越差。

select * from student order by id limit 200000,10;

如上语句,其实我们希望查询第20000页的10条数据,实际执行会发现耗时比获取第1页的10条慢很多。

原因分析

参考https://blog.csdn.net/cschmin/article/details/123148092解释的limit+offset实现原理,便可知道,mysql引擎层其实是把offset+limit条记录,全部返回给server层了,server层再过滤掉前offset条记录,把最后10条记录返回给客户端。显而易见,由于引擎层的“懒惰”,给server层造成了巨大的压力,以及数据传输带来的资源消耗。

优化方法

(1)子查询优化

select * 
from student t1, (select id from student order by id limit 200000,10) t2 
where t1.id=t2.id;

网上挺多文章说这种优化是借助了select只选择id一个列,符合了覆盖索引规则,所以快速跳过了前200000条记录,亦或是说避免了回表操作,两种说法都是扯蛋。这个子查询优化的本质是大大减少了引擎层返回给server的数据量而已。假如student表的列很少且很小,例如只有id、name两个字段,你再试试这个优化,基本没有效果。所以这个子查询优化的应用场景是表的行很大时,可以优化引擎层返给server层的数据量,数据条数并没有减少。而且由于子查询的存在,引擎层和server层的交互多了一次(第一次是子查询返回给server层200010个id,第二次返回给server层10条完整记录)。

(2)不使用limit+offset

改用标记法来实现分页,这也是企业级业务上比较常用的方法。标记法每次查询都携带着起始条件:

select * from student where id>200000 limit 10;

其中200000就是调用者当前页的起始位置。

优点:

  • 直接规避了深度分页问题

缺点:

  • 需要调用者自己维护标记(例如当前页起始于20,结束于29,那么调用者要自己算出下一页起始是30);
  • 不太容易通过页码直接跳转了(例如从第3页跳到第20000页);

(3)使用ElasticSearch

考虑将mysql数据同步到ES,然后借助ES来实现分页查询。不过,ES也会遇到深度分页的问题 ,只是没有mysql来的那么早而已。 例如我司在做某个文件管理库时,由于文件太多了,即便做了分表,数据量依然很大,查询负担太大,于是上层通过ES用于一些查询。

案例测试

---------------------------------------------------------------
-- 创建一个测试表
---------------------------------------------------------------
CREATE TABLE `student` (`id` int(11) NOT NULL AUTO_INCREMENT,`name` varchar(40) COLLATE utf8mb4_bin DEFAULT NULL,`age` int DEFAULT NULL,`feild_1` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_2` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_3` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_4` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_5` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_6` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_7` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_8` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_9` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_10` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_11` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_12` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_13` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_14` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_15` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_16` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_17` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_18` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_19` char(255) COLLATE utf8mb4_bin DEFAULT NULL,`feild_20` char(255) COLLATE utf8mb4_bin DEFAULT NULL,PRIMARY KEY (`id`) USING BTREE,KEY `idx_name` (`name`)
) ENGINE=InnoDB AUTO_INCREMENT=208505 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;---------------------------------------------------------------
-- 随机生成20万记录
---------------------------------------------------------------
DELIMITER //
CREATE PROCEDURE insert_student(IN n INT)
BEGINDECLARE i INT DEFAULT 0;WHILE i < n DOINSERT INTO student (age, name) VALUES (FLOOR(RAND() * 100), LEFT(UUID(), 8));SET i = i + 1;END WHILE;
END //
DELIMITER ;CALL insert_student(200000);select count(*) from student;---------------------------------------------------------------
-- 深度分页耗时测试
---------------------------------------------------------------
select * from student limit 200000,10;  -- 977msselect id,feild_1,feild_2,feild_3,feild_4,feild_5,feild_6,feild_7,feild_8,feild_9 from student order by id limit 200000,10  -- 475msselect id,feild_1 from student order by id limit 200000,10  -- 138msselect id from student limit 200000,10;  -- 65msselect * 
from student t1, (select id,feild_1,feild_2,feild_3,feild_4,feild_5,feild_6,feild_7,feild_8,feild_9 from student order by id limit 200000,10) t2 
where t1.id=t2.id;    -- 443msselect * 
from student t1, (select id from student order by id limit 200000,10) t2 
where t1.id=t2.id;  -- 60ms

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 前端JS总结(下)之DOM
  • LVS原理——详细介绍
  • dos 常用命令整理
  • 微信小程序的广告变现收益怎么样?
  • 如何高效记录并整理编程学习笔记—笔记工具选择?
  • Windows Server 使用Docke部署挂载问题(安装后无限重启崩溃迁移镜像到D盘打包镜像)
  • SSH、FTP、SFTP相关协议详解
  • Android Framework之Pkms详解
  • fatal: The current branch master has no upstream branch.
  • 【最小生成树】(三) Prim 算法
  • 某通用系统0day审计过程
  • Leetcode - 周赛409
  • glTF的基本结构
  • 【OpenHarmony】openharmony移植到RK3568------搭建开发环境
  • Spring——Second
  • [NodeJS] 关于Buffer
  • 「前端早读君006」移动开发必备:那些玩转H5的小技巧
  • 【vuex入门系列02】mutation接收单个参数和多个参数
  • 【个人向】《HTTP图解》阅后小结
  • 【刷算法】求1+2+3+...+n
  • Apache Zeppelin在Apache Trafodion上的可视化
  • C学习-枚举(九)
  • Date型的使用
  • JWT究竟是什么呢?
  • PHP面试之三:MySQL数据库
  • Python连接Oracle
  • tab.js分享及浏览器兼容性问题汇总
  • vue自定义指令实现v-tap插件
  • webpack+react项目初体验——记录我的webpack环境配置
  • 第13期 DApp 榜单 :来,吃我这波安利
  • 动态规划入门(以爬楼梯为例)
  • 浮动相关
  • 学习使用ExpressJS 4.0中的新Router
  • 怎样选择前端框架
  • Spring第一个helloWorld
  • zabbix3.2监控linux磁盘IO
  • ​zookeeper集群配置与启动
  • "无招胜有招"nbsp;史上最全的互…
  • #基础#使用Jupyter进行Notebook的转换 .ipynb文件导出为.md文件
  • (0)Nginx 功能特性
  • (23)Linux的软硬连接
  • (Java)【深基9.例1】选举学生会
  • (非本人原创)史记·柴静列传(r4笔记第65天)
  • (附源码)基于ssm的模具配件账单管理系统 毕业设计 081848
  • (更新)A股上市公司华证ESG评级得分稳健性校验ESG得分年均值中位数(2009-2023年.12)
  • (机器学习-深度学习快速入门)第三章机器学习-第二节:机器学习模型之线性回归
  • (算法)大数的进制转换
  • 、写入Shellcode到注册表上线
  • ../depcomp: line 571: exec: g++: not found
  • .bat批处理(一):@echo off
  • .Net CoreRabbitMQ消息存储可靠机制
  • .net on S60 ---- Net60 1.1发布 支持VS2008以及新的特性
  • .NET分布式缓存Memcached从入门到实战
  • .NET下ASPX编程的几个小问题
  • /usr/local/nginx/logs/nginx.pid failed (2: No such file or directory)