浅谈为什么Mysql数据库尽量避免NULL
在Mysql中很多表都包含可为NULL(空值)的列,即使应用程序并不需要保存NULL也是如此,这是因为可为NULL是列的默认属性。但我们常在一些Mysql性能优化的书或者一些博客中看到观点:在数据列中,尽量不要用NULL值,使用0,-1或者其他特殊标识替换NULL值,除非真的需要存储NULL值,那到底是为什么?如果替换了会有什么好处?同时又有什么问题呢?那么就看下面:
(1)如果查询中包含可为NULL的列,对Mysql来说更难优化,因为可为NULL的列使得索引,索引统计和值比较都更复杂。
(2)含NULL复合索引无效.
(3)可为NULL的列会使用更多的存储空间,在Mysql中也需要特殊处理。
(4)当可为NULL的列被索引时,每个索引记录需要一个额外的字节,在MyISAM里甚至还可能导致固定大小的索引(例如只有一个整数列的索引)变成可变大小的索引。
理由佐证
理由1不需要佐证
首先新建环境,sql语句如下
createtablenulltesttable( idintprimarykey, name_not_nullvarchar(10)notnull, name_nullvarchar(10) )ENGINE=InnoDBDEFAULTCHARSET=utf8AUTO_INCREMENT=1; altertablenulltesttableaddindexidx_nulltesttable_name_not_null(name_not_null); altertablenulltesttableaddindexidx_nulltesttable_name_null(name_null); explainselect*fromnulltesttablewherename_not_null='name';//explain1 explainselect*fromnulltesttablewherename_null='name';//explain2
从sql执行可以看出,explain1中key_len=32,explain2中key_len=33
explain1的32由来:10(字段长度)*3(utf8字符编码占用长度)+2(varchar标识为变长占用长度)
explain2的32由来:10(字段长度)*3(utf8字符编码占用长度)+2(varchar标识为变长占用长度)+1(null标识位占用长度)
两个字符串拼接,如果包含null值,则返回结果为null.
insertintonulltesttable(id,name_not_null,name_null)values(1,'one',null); insertintonulltesttable(id,name_not_null,name_null)values(2,'two','three'); selectconcat(name_not_null,name_null)fromnulltesttablewhereid=1;--out:null selectconcat(name_not_null,name_null)fromnulltesttablewhereid=2;--out:twothree
如果字段允许null值,且这个字段被索引.如下的查询可能会返回不正确的结果
select*fromnulltesttablewherename_null<>'three'--out:null selectcount(name_null)fromnulltesttable--out:1
通常把可为NULL的列改为NOTNULL带来的性能提升比较小,所以(调优时)没有必要首先在现有schema中查找并修改掉这种情况,除非确定这会导致问题。但是,如果计划在列上建索引,就应该尽量避免设计成可为NULL的列。
当确实需要标识未知值时也不要害怕使用NULL。在一些场景中,使用NULL可能会比某个神奇常数更好。从特定类型的值域中选择一个不可能的值,例如用-1代表一个未知数,可能导致代码复杂的多,并容易引入BUG,还可能让事情变得一团糟(注:Mysql会在索引中存储NULL值,Oracle不会)。
当然也有例外,InnoDB使用单独的位(bit)来存储NULL值,所以对于稀疏数据(很多值位NULL,只有少数行的列有非NULL值)由很好的空间效率,这一点不适用于MyISAM。
所以任何的设计和考虑请注意关注实际需求
到此这篇关于浅谈为什么Mysql数据库尽量避免NULL的文章就介绍到这了,更多相关Mysql避免NULL内容请搜索毛票票以前的文章或继续浏览下面的相关文章希望大家以后多多支持毛票票!