十二条sql优化技巧

125 阅读3分钟

1. 一些常见的SQL实践

1.1. 负向条件查询不能使用索引

#not in/not exists都不是好习惯
select * from order where status!=0 and stauts!=1
​
#可以优化为in查询
select * from order where status in(2,3)

1.2. 前导模糊查询不能使用索引

#前导模糊查询
select * from order where desc like '%XX'
​
#非前导模糊查询
select * from order where desc like 'XX%'

1.3. 数据区分度不大的字段不宜使用索引

#重复数据多
select * from user where sex=1
-- 原因:性别只有男,女,每次过滤掉的数据很少,不宜使用索引-- 经验上,能过滤80%数据时就可以使用索引。对于订单状态,如果状态值很少,不宜使用索引,如果状态值很多,能够过滤大量数据,则应该建立索引

1.4. 在属性上进行计算不能命中索引

#不能使用索引
select * from order where YEAR(date) < = '2020'-- 即使date上建立了索引,也会全表扫描
​
#可优化为值计算:
select * from order where date < = CURDATE()
select * from order where date < = '2020-01-01'

2. 并非周知的SQL实践

2.1. 如果业务大部分是单条查询,使用Hash索引性能更好,例如用户中心

#sql语句
select * from user where uid=?
select * from user where login_name=?
​
#原因:
B-Tree索引的时间复杂度是O(log(n))
Hash索引的时间复杂度是O(1)

2.2. 允许为null的列,查询有潜在大坑

#单列索引不存null值,复合索引不存全为null的值,如果列允许为null,可能会得到“不符合预期”的结果集
-- select * from user where name != 'yhh'
-- 如果name允许为null,索引不存储null值,结果集中不会包含这些记录
--所以,请使用not null约束以及默认值

2.3. 复合索引最左前缀,并不是指SQL语句的where顺序要和复合索引一致

#用户中心建立了(login_name, passwd)的复合索引
select * from user where login_name=? and passwd=?
select * from user where passwd=? and login_name=?
​
-- 都能够命中索引select * from user where login_name=?
-- 也能命中索引,满足复合索引最左前缀select * from user where passwd=?
-- 不能命中索引,不满足复合索引最左前缀

2.4.使用ENUM而不是字符串

#ENUM保存的是TINYINT,别在枚举中搞一些“中国”“北京”“技术部”这样的字符串,字符串空间又大,效率又低

3. 小众但有用的SQL实践

3.1. 如果明确知道只有一条结果返回,limit 1能够提高效率

#如果明确知道只有一条结果返回,limit 1能够提高效率
select * from user where login_name=?
​
#可以优化成
select * from user where login_name=? limit 1#原因
你知道只有一条结果,但数据库并不知道,明确告诉它,让它主动停止游标移动

3.2. 把计算放到业务层而不是数据库层,除了节省数据的CPU,还有意想不到的查询缓存优化效果

#这不是一个好的SQL实践:
select * from order where date < = CURDATE()
​
#应该优化为
$curDate = date('Y-m-d');
$res = mysql_query(
    'select * from order where date < = $curDate'
);
​
#原因:
释放了数据库的CPU。多次调用,传入的SQL相同,才可以利用查询缓存

3.3. 强制类型转换会全表扫描

#索引失效
select * from user where phone=13800001234-- 你以为会命中phone索引么?大错特错了!!!

3.4. **不要使用select ***

#不要使用select *
--只返回需要的列,能够大大的节省数据传输量,与数据库的内存使用量