一起养成写作习惯!这是我参与「掘金日新计划 · 4 月更文挑战」的第10天,点击查看活动详情。
分享一些平时在做db设计时,积累了一些经验,整理一下
表的主键
表必须有INT/BIGINT unsigned NOT NULL AUTO_INCREMENT类型的主键
当表的预估数据量在42亿条以内,使用INT UNSIGNED;
当表的预估数据量超过42亿条,使用BIGINT UNSIGNED;
数据增删比较频繁或者不确定行数的表,使用BIGINT UNSIGNED;
为什么选择自增id作为主键?
- 主键自增,数据行写入可以提高插入性能,可以避免page分裂,因此降低了表碎片率,提高了磁盘空间利用率。
- 自增型主键设计(int,bigint)可以降低二级索引的空间,提升二级索引的内存命中率;
- 主键要选择较短的数据类型, Innodb引擎普通索引都会保存主键的值,较短的数据类型可以有效的减少索引的磁盘空间,提高索引的缓存效率;
- 无主键的表删除,在row模式的主从架构,会导致备库夯住。
避免null
所有字段都是必须用NOT NULL DEFAULT 属性,避免字段存在NULL值,不便于计算与比较;
数值类型使用:NOT NULL DEFAULT 0
字符类型使用:NOT NULL DEFAULT ""
为什么要使用NOT NULL属性?
- NULL的列使索引/索引统计/值比较都更加复杂,对MySQL来说更难优化;
- NULL这种类型MySQL内部需要进行特殊处理,增加数据库处理记录的复杂性;同等条件下,表中有较多空字段的时候,数据库的处理性能会降低很多;
- NULL值需要更多的存储空,无论是表还是索引中每行中的null的列都需要额外的空间来标识;
- 对NULL 的处理时候,只能采用is null或is not null,而不能采用=、in、<、<>、!=、not in这些操作符号。如:where name!=’bilibili’,如果存在name为null值的记录,查询结果就不会包含name为null值的记录。
- 表关联或者where字段判断时,有NULL值会导致返回结果跟实际结果不一致。
创建时间和更新时间
所有表必须携带ctime(创建时间),mtime(最后修改时间)这两个字段,便于数据分析以及故障排查
ctime DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间'
mtime DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '最后修改时间'
强烈建议
对于CHAR(N)/VARCHAR(N)类型,在满足够用的前提下,尽可能小的选择N的大小,并且建议N<255,用于节省磁盘空间和内存空间;
使用TINYINT代替ENUM类型,新增ENUM类型需要在DDL操作,对于TINYINT类型在数据库字段COMMENT和程序代码中做好备注信息,避免混淆
强烈建议不要在数据库中进行排序,特别是大数据量的排序,可考虑在程序中设计排序;
强烈建议不要对数据做真正意义的物理删除(DELETE…),可考虑逻辑删除,即在表中设计一个is_deleted字段标记该字段是否删除,防止毁灭性事件的发生;
强烈建议每张表数据量控制在千万级别以下,如果预估超过千万级别,请在设计时考虑归档,日志系统,数据分析平台等方案;
强烈建议索引选择时,选择区分度高以及使用频率高的字段,组合索引将其优先放在前面。
尽量避免
尽量避免使用浮点型类型,计算机处理整型比浮点型快N倍,如果必须使用,请将浮点型扩大N倍后转为整型;
尽量避免在数据库中做计算,减轻数据库压力;
尽量避免JOIN查询,请尽可能的使用单表查询,减少查询复杂度,减轻数据库压力。
尽量避免出现冗余索引,如索引(a) 和索引(a,b),此时索引(a) 为冗余索引。
绝对禁止
生产环境中,表一旦设计好,字段只允许增加(ADD COLUMN),禁止减少(DROP COLUMN),禁止改名称(CHANGE/MODIFY COLUMN);
禁止使用 insert into select 句式,这种sql会导致锁表。
禁止使用UPDATE ... LIMIT ...和DELETE ... LIMIT ...操作,因为你无法得知自己究竟更新或者删除了哪些数据,请务必添加ORDER BY进行排序,如:
UPDATE tb SET col1=value1 ORDER BY id LIMIT n;
DELETE FROM tb ORDER BY id LIMIT n;
禁止超过2张表的JOIN查询;
禁止使用子查询;
禁止回退表的DDL操作;
禁止在数据库中使用视图、存储过程、函数、触发器、事件;
禁止使用外键,外键的逻辑应当由程序去控制;外键会导致表与表之间耦合,UPDATE与DELETE操作都会涉及相关联的表,十分影响SQL 的性能,甚至会造成死锁。高并发情况下容易造成数据库性能,大数据高并发业务场景数据库使用以性能优先。
禁止在添加字段时使用after/before属性,避免数据偏移。
参考资料: imysql.com/2014/09/14/…