当前位置: 首页 > news >正文

深入详解SQL中的Null

虽然熟练掌握SQL的人对于Null不会有什么疑问,但总结得很全的文章还是很难找,看到一篇英文版的, 感觉还不错。

Tony Hoare 在1965年发明了 null 引用, 并认为这是他犯下的“几十亿美元的错误”. 即便是50年后的今天, SQL中的 null 值还是导致许多常见错误的罪魁祸首.

我们一起来看那些最令人震惊的情况。

 

Null不支持大小/相等判断

下面的2个查询,不管表 users 中有多少条记录,返回的记录都是0行:

1
2
3
select * from users where deleted_at = null ;
– result: 0 rows
select * from users where deleted_at != null ;
– result: 0 rows

 

怎么会这样子? 一切只因为 null 是表示一种“未知”的类型。也就是说,用常规的比较操作符(normal conditional operators)来将 null 与其他值比较是没有意义的。 Null 也不等于 Null(近似理解: 未知的值不能等于未知的值,两者间的关系也是未知,否则数学和逻辑上就乱套了)。

– 注意: 下面的SQL适合于MySQL,如果是Oracle,你需要加上 … from dual;

1
2
3
4
5
6
7
8
9
10
select null > 0;
– result: null
select null < 0;
– result: null
select null = 0;
– result: null
select null = null ;
– result: null
select null != null ;
– result: null

 

将某个值与 null 进行比较的正确方法是使用 is 关键字, 以及 is not 操作符:

1
2
3
select * from users
where deleted_at is null ;
– result: 所有被标记为删除的 users

 

如果想要判断两列的值是否不相同,则可以使用 is distinct from:

1
2
3
select * from users
where has_address is distinct from has_photo
– result: 地址(address)或照片(photo)两者只有其一的用户

 

not in 与 Null

子查询(subselect)是一种很方便的过滤数据的方法。例如,如果想要查询没有任何包的用户,可以编写下面这样一个查询:

1
2
select * from users
where id not in ( select user_id from packages)

 

但此时假若 packages 表中某一行的 user_id 是 null 的话,问题就来了: 返回结果是空的! 要理解为什么会发生这种古怪的事情, 我们需要理解SQL编译器究竟干了些什么. 下面是一个更简单的示例:

1
2
select * from users
where id not in (1, 2, null )

 

这个SQL语句会被转换为:

1
2
select * from users
where id != 1 and id != 2 and id != null

 

我们知道,id != null 结果是个未知值, null. 而任意值和 null 进行 and 运算的结果都是 null, 所以相当于没有其他条件. 那么出这种结果的原因就是 null 的逻辑值不为 true.

如果条件调换过来, 查询结果就没有问题。 现在我们查询有package的用户.

1
2
select * from users
where id in ( select user_id from packages)

 

同样我们可以使用简单的例子:

1
2
select * from users
where id in (1, 2, null )

 

这条SQL被转换为:

1
2
select * from users
where id = 1 or id = 2 or id = null

因为 where 子句中是一串的 or 条件,所以其中某个的结果为 null 也是无关紧要的。非真(non-true)值并不影响子句中其他部分的计算结果,相当于被忽略了。

 

Null与排序

在排序时, null 值被认为是最大的. 在降序排序时(descending)这会让你非常头大,因为 null值排在了最前面。

下面这个查询是为了根据得分显示用户排名, 但它将没有得分的用户排到了最前面!

1
2
3
4
select name , points
from users
order by 2 desc ;
– points 为 null 的记录排在所有记录之前!

 

解决这类问题有两种思路。最简单的一种是用 coalesce 消除 null的影响:

1
2
3
4
5
6
– 在输出时将 null 转换为 0 :
select name , coalesce (points, 0)  from users
order by 2 desc ;
– 输出时保留 null , 但排序时转换为 0 :
select name , points  from users
order by coalesce (points, 0) desc ;

 

还有一种方式需要数据库的支持,指定排序时将 null 值放在最前面还是最后面:

1
2
3
select name , coalesce (points, 0)
from users
order by 2 desc nulls last ;

当然, null 也可以用来防止错误的发生,比如处理除数为0的数学运算错误。

 

被 0 除

除数为0是一个非常 egg-painfull 的错误。昨天还运行得好好的SQL,突然被0除一下子就出错了。一个常用的解决方法是先用 case 语句判断分母(denominator)是否为0,再进行除法运算。

1
2
select case when num_users = 0 then
else total_sales/num_users end ;

 

ase 语句的方式其实很难看,而且分母被重复使用了。如果是简单的情况还好,如果分母是个很复杂的表达式,那么悲剧就来了: 很难读,很难维护和修改,一不小心就是一堆BUG.

这时候我们可以看看 null 的好处. 使用 nullif 使得分母为0时变成 null. 这样就不再报错, num_users = 0 时返回结果变为 null.

1
2
select total_sales/ nullif (num_users, 0);
nullif 是将其他值转为 null , 而Oracle的 nvl 是将 null 转换为其他值。

 

如果不想要 null,而是希望转换为 0 或者其他数, 则可以在前一个SQL的基础上使用 coalesce函数:

1
2
select coalesce (total_sales/ nullif (num_users, 0), 0);
null 再转换回0

 

 

Conclusion

Tony Hoare 也许会后悔自己的错误, 但至少 null 存在的问题很容易地就解决了. 那么快去练练新的大招吧,从此远离 null 挖出来的无效大坑(nullifying)!

转载于:https://www.cnblogs.com/cyjaysun/p/4422036.html

相关文章:

  • 博客迁移
  • STM32 USB虚拟串口(转)
  • leetcode------Gas Station
  • 实用的JS代码段(表单篇)
  • 【VMCloud云平台】SCAP(四)连接公有云(二)
  • easytouch使用方法
  • Django从安装到目录创建
  • Liam的C# 学习历程(五):正则表达式(Regular Expressions)
  • 收集谷歌替代网站
  • fsync与数据库日志刷新
  • 第十六次课:Servlet实现商品用户评价
  • Canvas绘画功能(待补充)
  • RabbitMQ(六)远程连接
  • FileInputStream与FileOutputStream类
  • Octopus系列之数据上传格式要求说明
  • [译] React v16.8: 含有Hooks的版本
  • 【React系列】如何构建React应用程序
  • 0x05 Python数据分析,Anaconda八斩刀
  • 2017 年终总结 —— 在路上
  • 2018以太坊智能合约编程语言solidity的最佳IDEs
  • 2019.2.20 c++ 知识梳理
  • JAVA多线程机制解析-volatilesynchronized
  • JS正则表达式精简教程(JavaScript RegExp 对象)
  • mongo索引构建
  • Netty源码解析1-Buffer
  • node入门
  • SpringBoot几种定时任务的实现方式
  • webgl (原生)基础入门指南【一】
  • XML已死 ?
  • 大主子表关联的性能优化方法
  • 给初学者:JavaScript 中数组操作注意点
  • 关于字符编码你应该知道的事情
  • 力扣(LeetCode)965
  • 你真的知道 == 和 equals 的区别吗?
  • 深度学习在携程攻略社区的应用
  • 手写双向链表LinkedList的几个常用功能
  • 双管齐下,VMware的容器新战略
  • 微信开源mars源码分析1—上层samples分析
  • 用jQuery怎么做到前后端分离
  • PostgreSQL之连接数修改
  • 新海诚画集[秒速5センチメートル:樱花抄·春]
  • ​​快速排序(四)——挖坑法,前后指针法与非递归
  • ​MySQL主从复制一致性检测
  • # 日期待t_最值得等的SUV奥迪Q9:空间比MPV还大,或搭4.0T,香
  • #pragma预处理命令
  • (iPhone/iPad开发)在UIWebView中自定义菜单栏
  • (M)unity2D敌人的创建、人物属性设置,遇敌掉血
  • (Python第六天)文件处理
  • (二) Windows 下 Sublime Text 3 安装离线插件 Anaconda
  • (附源码)springboot 智能停车场系统 毕业设计065415
  • (考研湖科大教书匠计算机网络)第一章概述-第五节1:计算机网络体系结构之分层思想和举例
  • (三) diretfbrc详解
  • (四)Controller接口控制器详解(三)
  • (一)Linux+Windows下安装ffmpeg
  • (转)setTimeout 和 setInterval 的区别