数据库的一些小知识持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第12天，点击查看活动详情今天分

持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第12天，点击查看活动详情今天分享一些数据库的一些小知识。

orm N+1的问题

在生成列表页面时,首先执行一次

select * from class limited 0,N

然后逐条获取class.name,又需要执行N次

select name from user where id = class_id

所以N+1问题其实应该叫做1+N 问题,这只是一个数据库设计模式的问题.但是会对数据库带来很大的压力,一个简单的列表页可能会有几百次数据库查询

N+1问题并不是ORM独有,只是使用orm的时候,数据库表中的行变成一个对象,于是很自然的就容易使用上面的方法来进行查询不使用orm进行编程的情况,一般直接用子查询或者inner join

select a.*,c.name from class a,user b where a.class_id = b.id

子查询或者inner join对数据库来说,也是很费资源的操作,因为需要锁表,高并发的情况下很容易锁死

要解决1+N问题一般有3种方法

数据库反范式设计,说直白点,就是把表合并,设计成冗余表,这可能会带来两个问题所以,这种方案显然存储效率不高,但是如果针对这两种情况进行优化,也算是是一种不错的解决办法, MongoDB就是这样干的

把N+1次查询变成2次查询简单说先执行 select *,category_id from article limited 0,N然后遍历结果列表,取出所有的category_id,去掉重复项再执行一次 select name from category where id in (category id list)

把子查询/join查询分成两次,是高并发网站数据库调优中非常有效的常见做法,虽然会花费更多的cpu时间,但是避免了系统的死锁,提高了并发响应能力

数据库本身处理不了高并发,因为我们只能保证单个数据项的操作是原子的,而数据库的查询是以列表为基本单元,这是个天然矛盾,无解

数据库设计范式不在web framework能力范围内,所以django的ORM 只支持后面两种做法

以我个人的使用经验, 我觉得多次简单查询对比关联查询有以下好处:

有效使用数据库缓存
关联的表多了,且没有用好索引, 一次查询的时间就更长. 这种并发查询多了, 就会导致数据库压力骤增. 例如:一次查询要 100ms,那么在未来很可能成为慢查询,进而可能导致雪崩.
减少锁的竞争
尽量降低数据库压力, 毕竟数据库的扩容比服务器扩容难多了. 在开发时,就让 sql 足够简单, 未来一旦出现数据库瓶颈, 大部分的代码不用考虑 sql 优化了, 直接升级数据库吧.
随着数据量的增加, mysql 的执行逻辑也会变化. 虽然开发时不是慢查询,但以后可能就会变成慢查询. 但并不是所有的关联查询都拆分, 对于效率非常高的关联查询, 还是不要拆分.