当前位置: 首页 > news >正文

2008 SQL Server优化(2)-改善SQL语句

二、改善SQL 语句

  很多人不知道SQL 语句在SQL SERVER 中 是如何执行的,他们担心自己所写的SQL 语句会被SQL SERVER 误解。比如:

select * from table1 where name=’zhangsan’ and tID > 10000

和执行:

select * from table1 where tID > 10000 and name=’zhangsan’

  一些人不知道以上两条语句的执行效率是否一样,因为如果简单的从语句先后上看,这两个语句的确是不一 样,如果tID 是一个聚合索引,那么后一句仅仅从表的10000 条以后的记录中查找就行了;而前一 句则要先从全表中查找看有几个name=’zhangsan’ 的,而后再根据限制条件条件tID>10000 来 提出查询结果。

  事实上,这样的担心是不必要的。SQL SERVER 中有一个“查询分析优 化器”,它可以计算出where 子句中的搜索条件并确定哪个索引能缩小表扫描的搜索空间,也就是说,它能实现自动优化。

  虽然查询优化器可以根据where 子句自动的进行查询优化,但大家仍然有必 要了解一下“查询优化器”的工作原理,如非这样,有时查询优化器就会不按照您的本意进行快速查询。

  在查询分析阶段,查询优化器查看查询的每个阶段并决定限制需要扫描的数据量是否有用。如果一个阶段可以 被用作一个扫描参数(SARG ),那么就称之为可优化的,并且可以利用索引快速获得所需数据。

  SARG 的定义:用于限制搜索的一个操作,因为它通常是指一个特定的匹配, 一个值得范围内的匹配或者两个以上条件的AND 连接。形式如下:

列名 操作符 < 常数 或 变量>

< 常数 或 变量> 操作符列名

列名可以出现在操作符的一边,而常数或变量出现在操作符的另一边。如:

Name= ’ 张三 ’

价格>5000

5000< 价格

Name= ’ 张三 ’ and 价格>5000

  如果一个表达式不能满足SARG 的形式,那它就无法限制搜索的范围了,也就 是SQL SERVER 必须对每一行都判断它是否满足WHERE 子句中的所有条件。所以一个索引对 于不满足SARG 形式的表达式来说是无用的。

  介绍完SARG 后,我们来总结一下使用SARG 以 及在实践中遇到的和某些资料上结论不同的经验:

1 、Like 语 句是否属于SARG 取决于所使用的通配符的类型

如:name like ‘ 张% ’ , 这就属于SARG

而:name like ‘ % 张 ’ , 就不属于SARG 。

原因是通配符% 在字符串的开通使得索引无法使用。

2 、or 会 引起全表扫描

Name= ’ 张三 ’ and 价格>5000 符号SARG ,而:Name= ’ 张 三 ’ or 价格>5000 则不符 合SARG 。使用or 会引起全表扫描。

3 、非操作符、函数引起的 不满足SARG 形式的语句

  不满足SARG 形式的语句最典型的情况就是包括非操作符的语句,如:NOT 、!= 、<> 、!< 、!> 、NOT EXISTS 、NOT IN 、NOT LIKE 等,另外还有函数。下面就是几个不 满足SARG 形式的例子:

ABS( 价格)<5000

Name like ‘ % 三 ’

有些表达式,如:

WHERE 价格*2>5000

SQL SERVER 也会认为是SARG ,SQL SERVER 会将此式转化为:

WHERE 价格>2500/2

  但我们不推荐这样使用,因为有时SQL SERVER 不能保证这种转化与原 始表达式是完全等价的。

4 、IN 的 作用相当与OR

语句:

Select * from table1 where tid in (2,3)

Select * from table1 where tid=2 or tid=3

是一样的,都会引起全表扫描,如果tid 上有索引,其索引也会失效。

5 、尽量少用NOT

6 、exists 和 in 的执行效率是一样的

  很多资料上都显示说,exists 要比in 的执 行效率要高,同时应尽可能的用not exists 来代替not in 。但事实上,我试验了一下, 发现二者无论是前面带不带not ,二者之间的执行效率都是一样的。因为涉及子查询,我们试验这次用SQL SERVER 自带的pubs 数据库。运行前我们可以把SQL SERVER 的statistics I/O 状态打开。

(1 )select title,price from titles where title_id in (select title_id from sales where qty>30)

该句的执行结果为:

表 ’sales’ 。扫描计数 18 ,逻辑读 56 次,物理读 0 次,预读 0 次。

表 ‘titles’ 。扫描计数 1 ,逻辑读 2 次,物理读 0 次,预读 0 次。

   

(2 )select title,price from titles where exists (select * from sales where sales.title_id=titles.title_id and qty>30)

第二句的执行结果为:

表 ’sales’ 。扫描计数 18 ,逻辑读 56 次,物理读 0 次,预读 0 次。

表 ‘titles’ 。扫描计数 1 ,逻辑读 2 次,物理读 0 次,预读 0 次。

我们从此可以看到用exists 和用in 的执行效率 是一样的。

7 、用函数charindex() 和 前面加通配符% 的LIKE 执行效率一样

  前面,我们谈到,如果在LIKE 前面加上通配符% , 那么将会引起全表扫描,所以其执行效率是低下的。但有的资料介绍说,用函数charindex() 来代替LIKE 速 度会有大的提升,经我试验,发现这种说明也是错误的:

select gid,title,fariqi,reader from tgongwen where charindex(‘ 刑侦支队‘,reader)>0 and fariqi>’2004-5-5′

用时:7 秒,另外:扫描计数 4 ,逻辑读 7155 次,物理读 0 次,预读 0 次。

select gid,title,fariqi,reader from tgongwen where reader like ‘%’ + ‘ 刑侦支队‘ + ‘%’ and fariqi>’2004-5-5′

用时:7 秒,另外:扫描计数 4 ,逻辑读 7155 次,物理读 0 次,预读 0 次。

8 、union 并 不绝对比or 的执行效率高

  我们前面已经谈到了在where 子句中使用or 会 引起全表扫描,一般的,我所见过的资料都是推荐这里用union 来代替or 。事实证明,这种说法对 于大部分都是适用的。

select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi=’2004-9-16′ or gid>9990000

用时:68 秒。扫描计数 1 ,逻辑读 404008 次,物理读 283 次,预读 392163 次。

select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi=’2004-9-16′

union

select gid,fariqi,neibuyonghu,reader,title from Tgongwen where gid>9990000

用时:9 秒。扫描计数 8 ,逻辑读 67489 次,物理读 216 次,预读 7499 次。

看来,用union 在通常情况下比用or 的效率要高 的多。

但经过试验,笔者发现如果or 两边的查询列是一样的话,那么用union 则 反倒和用or 的执行速度差很多,虽然这里union 扫描的是索引,而or 扫 描的是全表。

select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi=’2004-9-16′ or fariqi=’2004-2-5′

用时:6423 毫秒。扫描计数 2 ,逻辑读 14726 次,物理读 1 次,预读 7176 次。

select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi=’2004-9-16′

union

select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi=’2004-2-5′

用时:11640 毫秒。扫描计数 8 ,逻辑读 14806 次,物理读 108 次,预读 1144 次。

9 、字段提取要按照“需多 少、提多少”的原则,避免“select * ”

我们来做一个试验:

select top 10000 gid,fariqi,reader,title from tgongwen order by gid desc

用时:4673 毫秒

select top 10000 gid,fariqi,title from tgongwen order by gid desc

用时:1376 毫秒

select top 10000 gid,fariqi from tgongwen order by gid desc

用时:80 毫秒

由此看来,我们每少提取一个字段,数据的提取速度就会有相应的提升。提升的速度还要看您舍弃的字段的大小来 判断。

10 、count(*) 不 比count( 字段) 慢

某些资料上说:用* 会统计所有列,显然要比一个世界的列名效率低。这种说法其实 是没有根据的。我们来看:

select count(*) from Tgongwen

用时:1500 毫秒

select count(gid) from Tgongwen

用时:1483 毫秒

select count(fariqi) from Tgongwen

用时:3140 毫秒

select count(title) from Tgongwen

用时:52050 毫秒

从以上可以看出,如果用count(*) 和用count( 主 键) 的速度是相当的,而count(*) 却比其他任何除主键以外的字段汇总速度要快,而且字段越 长,汇总的速度就越慢。我想,如果用count(*) , SQL SERVER 可能会自动查找最小 字段来汇总的。当然,如果您直接写count( 主键) 将会来的更直接些。

11 、order by 按聚集索引列排序效率最高

我们来看:(gid 是主键,fariqi 是聚合索引 列)

select top 10000 gid,fariqi,reader,title from tgongwen

用时:196 毫秒。 扫描计数 1 ,逻辑读 289 次,物理读 1 次,预读 1527 次。

select top 10000 gid,fariqi,reader,title from tgongwen order by gid asc

用时:4720 毫秒。 扫描计数 1 ,逻辑读 41956 次,物理读 0 次,预读 1287 次。

select top 10000 gid,fariqi,reader,title from tgongwen order by gid desc

用时:4736 毫秒。 扫描计数 1 ,逻辑读 55350 次,物理读 10 次,预读 775 次。

select top 10000 gid,fariqi,reader,title from tgongwen order by fariqi asc

用时:173 毫秒。 扫描计数 1 ,逻辑读 290 次,物理读 0 次,预读 0 次。

select top 10000 gid,fariqi,reader,title from tgongwen order by fariqi desc

用时:156 毫秒。 扫描计数 1 ,逻辑读 289 次,物理读 0 次,预读 0 次。

从以上我们可以看出,不排序的速度以及逻辑读次数都是和“order by 聚 集索引列” 的速度是相当的,但这些都比“order by 非聚集索引列”的查询速度是快得多的。

同时,按照某个字段进行排序的时候,无论是正序还是倒序,速度是基本相当的。

12 、高效的TOP

事实上,在查询和提取超大容量的数据集时,影响数据库响应时间的最大因素不是数据查找,而是物理的I/0 操 作。如:

select top 10 * from (

select top 10000 gid,fariqi,title from tgongwen

where neibuyonghu=’ 办公室‘

order by gid desc) as a

order by gid asc

  这条语句,从理论上讲,整条语句的执行时间应该比子句的执行时间长,但事实相反。因为,子句执行后返回 的是10000 条记录,而整条语句仅返回10 条语句,所以影响数据库响应时间最大的因素是物理I/O 操 作。而限制物理I/O 操作此处的最有效方法之一就是使用TOP 关键词了。TOP 关 键词是SQL SERVER 中经过系统优化过的一个用来提取前几条或前几个百分比数据的词。经笔者在实践中的应用,发现TOP 确 实很好用,效率也很高。但这个词在另外一个大型数据库ORACLE 中却没有,这不能说不是一个遗憾,虽然在ORACLE 中 可以用其他方法(如:rownumber )来解决。在以后的关于“实现千万级数据的分页显示存储过程”的讨论中,我们就将用到TOP 这 个关键词。

  到此为止,我们上面讨论了如何实现从大容量的数据库中快速地查询出您所需要的数据方法。当然,我们介绍的这些方法都是“软”方法, 在实践中,我们还要考虑各种“硬”因素,如:网络性能、服务器的性能、操作系统的性能,甚至网卡、交换机等。

转载于:https://www.cnblogs.com/Gaojier/archive/2010/04/08/2783561.html

相关文章:

  • ScrollView子控件高度设置无效
  • Python字典
  • 彻底搞清楚C/C++中日期和时间 time_t与struct tm,time(NULL),ctime;strftime
  • 修改博客园主题
  • Expression Blend实例中文教程(13) - 控件模板快速入门ControlTemplates
  • 微软Azure 文档地址
  • [转]优化MySQL数据库性能的八大“妙手”
  • 罗湖致力打造智慧城市标杆区
  • 转:Win32 同步机制摘要
  • create raid5
  • 简析几何叉乘与安培力的内在逻辑
  • Windows下svn客户端TortoiseSVN的安装和操作
  • SNF快速开发平台MVC-名片管理(实际名片样式)
  • 掌握 Ajax,第 2 部分: 使用 JavaScript 和 Ajax 发出异步请求
  • Look-and-Say 数列
  • 深入了解以太坊
  • 【JavaScript】通过闭包创建具有私有属性的实例对象
  • CSS魔法堂:Absolute Positioning就这个样
  • CSS选择器——伪元素选择器之处理父元素高度及外边距溢出
  • Docker容器管理
  • Git 使用集
  • JDK 6和JDK 7中的substring()方法
  • Laravel 中的一个后期静态绑定
  • Linux编程学习笔记 | Linux IO学习[1] - 文件IO
  • Linux后台研发超实用命令总结
  • Lucene解析 - 基本概念
  • macOS 中 shell 创建文件夹及文件并 VS Code 打开
  • MySQL用户中的%到底包不包括localhost?
  • windows-nginx-https-本地配置
  • windows下使用nginx调试简介
  • 解析带emoji和链接的聊天系统消息
  • 蓝海存储开关机注意事项总结
  • 每个JavaScript开发人员应阅读的书【1】 - JavaScript: The Good Parts
  • 因为阿里,他们成了“杭漂”
  • 原生js练习题---第五课
  • 《TCP IP 详解卷1:协议》阅读笔记 - 第六章
  • Nginx实现动静分离
  • Spring Batch JSON 支持
  • ​DB-Engines 11月数据库排名:PostgreSQL坐稳同期涨幅榜冠军宝座
  • ​secrets --- 生成管理密码的安全随机数​
  • (zt)最盛行的警世狂言(爆笑)
  • (八十八)VFL语言初步 - 实现布局
  • (附源码)springboot炼糖厂地磅全自动控制系统 毕业设计 341357
  • (附源码)计算机毕业设计ssm本地美食推荐平台
  • (附源码)计算机毕业设计SSM疫情下的学生出入管理系统
  • (解决办法)ASP.NET导出Excel,打开时提示“您尝试打开文件'XXX.xls'的格式与文件扩展名指定文件不一致
  • (原創) 如何安裝Linux版本的Quartus II? (SOC) (Quartus II) (Linux) (RedHat) (VirtualBox)
  • (转)shell调试方法
  • .jks文件(JAVA KeyStore)
  • .Net IE10 _doPostBack 未定义
  • .NET 编写一个可以异步等待循环中任何一个部分的 Awaiter
  • .net 使用ajax控件后如何调用前端脚本
  • .NET平台开源项目速览(15)文档数据库RavenDB-介绍与初体验
  • .Net中间语言BeforeFieldInit
  • /3GB和/USERVA开关