数据库开发规范

758 阅读10分钟

1、数据库命名规范

1.所有数据库对象名称必须使用小写字母并用下划线分割

不同的数据库名 DbName dbname 
不同的表名 Table table tabLe 

2.所有数据库对象名称禁止使用MySQL保留关键字

select id,username,from,age from tb_user from是关键字 ,但是可以用单引号括起来 

3.数据库对象的命名要见名识义,并且最好不要超过32个字符

例如 用户数据库mc_userdb 用户账号表 user_account 

4.临时库表必须以tmp为前缀并以日期为后缀

5.备份库、备份表必须以bak为前缀并以日期为前缀

6.所有存储相同数据的列名和列类型必须一致

比如两张表中有相同的数据,那么他们列名和列类型必须是一致的 

2、数据库基本设计规范

1、所有表必须使用Innodb存储引擎,mysql 5.6后默认存储引擎,支持事务,行级锁,更好的恢复性,高并发下性能更好

2、数据库和表的字符集统一使用UTF8,避免由于字符集转换产生的乱码

mysql中utf8字符集汉字占3个字节,ASCII码占用1个字节 

3、所有表和字段都需要添加注释,使用comment从句添加表和列的备注

4、尽量控制单表数据量的大小,建议控制在500万以内,500万并不是mysql数据库的限制,

mysql最多可以存储多少万数据?目前没有做限制,这种限制取决于存储设置和文件系统 可以用历史数据归档,分库分表等手段来控制数据量大小 

5、谨慎使用mysql分区表

分区表在物理上表现为多个文件没在逻辑上表现为一个表 
谨慎选择分区键,跨分区查询效率可能更低 
建议采用物理分表的方式管理大数据 

6、尽量做到冷热数据分离,减小表的宽度

mysql限制最多存储4096列,为了是减少磁盘IO,保证热数据的内存缓存命中率,利用更有效的利用缓存,避免读入无用的冷数据 经常使用的列放在一个表中 

7、禁止在表中建立预留字段

预留字段的命名很难做到见名识义 
预留字段无法确认存储的数据类型,所以无法选择合适的类型 
对预留字段类型的修改,会对表进行锁定,修改字段类型的成本往往大于增加 

8、禁止在数据库中存储图片、文件等二进制数据

9、禁止在线上做数据库压力测试

10、禁止从开发环境,测试环境直连生产环境数据库

3、数据库索引设计规范

索引对数据库的查询性能来说非常重要,查询、更新,禁止滥用索引

1、限制每张表上的索引数量,建议单张表索引不超过5个

索引并不是越多越好的,索引可以提高效率同样可以降低效率 
索引可以增加查询效率,但同样也会降低插入和更新的效率 

2、禁止给表中的每一列都建立单独的索引

3、Innodb是按照主键索引的顺序来组织表的

4、每个Innodb表必须有一个主键

不使用更新频繁的列作为主键,不使用多列主键 
不使用uuid、MD5、hash,字符串列作为主键 
主键建议使用主键自增 

5、常见的索引列建议:

select、update、delete语句的where从句中的列 
包含在order by、group by 、destinct中的字段 
多表join的关联列 

6、如何选择索引列的顺序:

联合索引是从左到右的顺序来实现的

1、区分度最高的列放在联合索引的最左侧
2、尽量把字段长度小的列放在联合索引的最左侧
3、使用最频繁的列放到联合索引的左侧
4、避免建立冗余索引和重复索引
重复索引:如 primary key(id)、index(id)、unique index(id) 
冗余索引:如 index(a,b,c) index(a,b) index(a) 
5、对于频繁的查询优先使用覆盖索引
覆盖索引:就是包括了所有查询字段的索引 
优点:避免Innodb表进行索引的二次查找,可以把随机IO变为顺序IO加快查询效率 
6、尽量避免使用外键
不建议使用外键约束,但一定在表与表之间的关联键上建立索引 
外键可用于保证数据的参照完整性,但建议在业务端实现 
外键会影响父表和子表的写操作从而降低性能 

4、数据库字段设计规范

1、优先选择符合存储需要的最小的数据类型

将字符串转化为数字类型存储 
对于非负数据采用无符号整形进行存储 
signed int -2147483648-2147483648 
unsigned int 0-2147483648 
有符号比无符号多出一倍的存储空间 
varchar(n) n代表字符数,不是字节数,varchar(255)=765个字节 
过大的长度会消耗更多的内存 

2、避免使用text\BLOB数据类型

建议text\BLOB列分离到单独的扩展表中 
text\BLOB类型只能使用前缀索引 

3、避免使用enum数据类型

修改enum需要使用alter语句 
enum类型的order by操作效率低,需要额外操作 
禁止使用数值作为enum的枚举值 

4、尽可能把所有列定义为not null

索引null列需要额外的空间来保存,所以要占用更多的空间 
进行比较和计算时要对null值做特别的处理 

5、禁止字符串存储日期型的数据

缺点1:无法用日期函数进行计算和比较 
缺点2:用字符串存储日期要占用更多的空间 
使用timestamp或datetime类型存储时间,timestamp存储空间更小 

6、财务的相关金额使用decimal类型

decimal类型为精准浮点数,在计算时不会丢失精度 
float、double非精准浮点数 

5、数据库SQL开发规范

1、建议使用预编译语句进行数据库操作

好处:只传参数,比传递SQL语句更高效 
相同语句可以一次解析,多次使用,提高处理效率 

2、避免数据类型的隐式转换

隐式转换会导致索引失效 

3、利用表上已经存在的索引

避免使用双%号的查询条件。如 a like%123%
个 SQL 只能利用到复合索引中的一列进行范围查询
使用 eft join 或 not exists 来优化 not in 操作

4、禁止连接不同的数据库使用不同的账号,禁止垮库查询

为数据库迁移和分库分表留出余地 
减低业务耦合度 
避免权限过大而产生的安全风险 

5、禁止使用select * 必须用select 字段列表 查询

消耗更多的CPU和io以及网络带宽资源 
无法使用覆盖索引 
可减少表结构变更带来的影响 

6、禁止使用不含字段列表的insert语句

如,insert into t values(‘a’,’b’,’c’) 

7、避免使用子查询,可以把子查询优化为join操作

子查询的结果集无法使用索引 
子查询会产生临时表,如果子查询数据量大则严重影响效率 
消耗过多的CPU和io资源 

8、避免使用join关联太多的表

每join一个表会多占用一部分内存join_buffer_size 
会产生临时表操作,影响查询效率 
mysql最多关联61个表,建议不超过5个 

9、减少同数据库的交互次数

10、禁止使用order by rand()进行随机排序

11、where从句中禁止对列进行函数转换和计算

对列进行函数转换和计算会导致无法使用索引 
如: where date(createtime)=’20160901’ 
优化后:where createtime>=’20160901’ 
在明显不会有重复值时使用 UNION ALL 而不是 JNION
UNION 会把所有数据放到临时表中后再进行去重操作 UNION ALL 不会再对结果集进行去重操作

12、拆分复杂的大 SQL 为多个小 SQL

MYSQL-个 SQL 只能使用一个 CPU 进行计算
SQL 拆分后可以通过并行执行来提高处理效率

6、数据库操作行为规范

超 100 万行的批量写操作,要分批多次进行操作

大批量操作可能会造成严重的主从延退

binlog 日志为 row 格式时会产生大量的日志避免产生大事务操作

对大表数据结构的修改一定要谨慎,会造成严重的锁表操作。尤其是生产环境,是不能忍受的

对于大表使用 pt-online- schema- changes 修改表结枃
避免大表修改产生的主从延迟

禁止为程序使用的账号赋予 supert 权限

当达到最大连接数限制时,还允许 1 个有 super 权限的用户连接

supert 权限只能留给 DBA 处理问题的账号使用


对于程序连接数据库账,遵循权限最小原则 程序使用数据库账号只能在一个 DB 下使用不准跨库

程序上使用的账号原则上不允许有drop的权限

7、Sql书写优化性能建议

  • 避免嵌套连接。例如:A = B AND B = C AND C = D
  • WHERE条件中尽量减少使用常量比较,改用主机变量
  • 系统可能选择基于规则的优化器,所以将结果集返回数据量小的表作为驱动表(FROM后边最后一个表)
  • 大量的排序操作影响系统性能,所以尽量减少ORDER BY和GROUP BY排序操作。如必须使用排序操作,请遵循如下规则: 排序尽量建立在有索引的列上 如结果集不需唯一,使用UNION ALL代替UNION
  • 索引的使用 尽量避免对索引列进行计算 尽量注意比较值与索引列数据类型的一致性 对于复合索引,SQL语句必须使用主索引列 索引中,尽量避免使用NULL 对于索引的比较,尽量避免使用!= 查询列和排序列与索引列次序保持一致
  • 尽量避免相同语句由于书写格式的不同,而导致多次语法分析
  • 尽量使用共享的SQL语句
  • 查询的WHERE过滤原则,应使过滤记录数最多的条件放在最前面
  • 任何对列的操作都将导致表扫描,它包括数据库函数、计算表达式等等,查询时要尽可能将操作移至等号右边
  • IN、OR子句常会使用工作表,使索引失效;如果不产生大量重复值,可以考虑把子句拆开;拆开的子句中应该包含索引

本篇文章由一文多发平台ArtiPub自动发布