NULL值有哪些语法影响
我们使用mysql时,使用 xx !='aa'
这种条件为什么无法筛选出值为NULL的字段呢。
是的,MySQL 中null 值确实无法通过这种条件筛选出来,因为 null 值的定义就跟普通值不一样。
拿官网的例子来说:
mysql> INSERT INTO my_table (phone) VALUES (NULL);
mysql> INSERT INTO my_table (phone) VALUES ('');
第一条 SQL 表达的意思是:不知道这个人的手机号码,用 null 表示未知。
第二条 SQL 表达的意思是:这个人就是没有手机号码,所以存了一个空字符串。
按照这个角度去看待群里同学的提问,其实不难理解为什么 xx!=‘xx’ 查询不出 null 的数据了。
因为 null 值表示未知,它的值可能是任意你能想到的值,目前还不能定义它。
看到有同学可能不服:我不管它到底等于什么,反正从目前来看它是 null,它就 !=‘xx’,所以应该查得出来。
额…怎么说呢,人家规矩就是这样定的,在人家的地盘上就得按人家的规矩办事。
MySQL 说:
To look for NULL values, you must use the IS NULL 。
所以,事情就是这样,也没啥好纠结的点,查 null 的语法就不一样。
不仅如此,看官网介绍,其实 null 还有其它不一样的地方。
When using DISTINCT, GROUP BY, or ORDER BY, all NULL values are regarded as equal.
当使用 DISTINCT, GROUP BY, 或者 ORDER BY 时候,null 值都会被认为是相等的,这个可以理解。
还有排序的时候,null 值默认会排在最前面,如果想放在最后面,用 DESC。
Aggregate (group) functions such as COUNT(), MIN(), and SUM() ignore NULL values
聚合函数,比如 count、min、max、sum 等,会忽略统计 null 值的字段。
比如现在有一个表 user,一共有 5 条数据,其中1条的reward是 null。
当执行 select count(reward) from user;
结果只会返回 4。
所以,如果你实际的需求是统计行数的话,记得用 count(*),而不是某个可能为 null 的字段。
提炼下一些日常工作容易出错的点:
- null 值的过滤需要利用 is null 和 is not null,无法用 !=、<> 之类的来判断。
- 聚合函数统计需要注意使用可能为 null 字段的统计不一定是你想要的结果。
- 空指针,聚合函数使用可能为 null 字段时,可能返回值就是 null
还有,如果表中存在可能为 null 的字段,那么在实际存储上每条记录也会多花一个字节来表示当前记录目前某列是否为 null。
因此如果表内字段能确定一定不为 null,为了节省空间,都应该设为 not null。
怎么存储 NULL 的
MySQL 怎么存储,其实问的是 InnoDB 怎么存储,如果你清楚 InnoDB 存储引擎一行记录的格式,那么关于 NULL 值怎么存放这个问题,其实还是很简单的。
InnoDB 逻辑存储结构
详情请参考这篇《MySQL | 知识 | 从底层看清 InnoDB 数据结构》
首先,Compact 行格式的首部是一个非 NULL 变长字段(varchar)的长度列表,并且这个长度列表是按照列的顺序逆序放置的:
- 当列的长度 < 255 字节,用 1 个字节标识
- 当列的长度 > 255 字节,用 2 个字节标识
举个例子,比如有四个字段 (id, name, age, address),name 和 address 都是变长类型,有两行记录:
name 列的长度分别是 3 和 5,十六进制表示 0x03 和 0x05
address 列的长度分别是 11 和 6,十六进制表示 0xB 和 0x06
这两行记录对应的 Compact 格式如下图所示:
第二个部分就是 NULL 标识位,用于指示这行数据中是否有 NULL 值,若有的话,则将对应的比特位置为 1。具体来说,每个列对应一个二进制位(bit),二进制位同样按照列的顺序逆序排列。
比如有一行记录 id = 1, name = “admin”, age = NULL,那么这行记录对应的 NULL 标位就是 100(逆序排放,[age, name, id]),然后在高位补 0,最终就是 0000 0100
第三部分是记录头信息(record header),固定占用 5 个字节(40 位),主要就是包含比如该行是否已被删除、页中下一条记录的相对位置等等之类的