数据结构与算法｜青训营笔记这是我参与「第四届青训营」笔记创作活动的第1天（数据结构算法｜青训营笔记）关于SQL查询优化器

这是我参与「第四届青训营」笔记创作活动的第1天

截屏2022-07-24 10.37.03.png

查询优化器的分类：
- top—down optimizer：从目标开始从上往下遍历计划树，找出完整的最优执行计划（eg：SQLServer)
- Bottom-up optimizer:从零开始，由下往上遍历计划树，找到完整的执行计划
- Rule-based optimizer(RBO)：根据关系代数的等价语义重写查询，基于启发式规则，会访问表的catalog但不会涉及具体的data（实现简单，优化速度快但是不保证能得到最优的执行计划）
- - 运算符&等价变换
- - 优化原则：Read data less and faster(I/O);transfer data less and faster(Network);process data less and faster(CPU&/Memory) eg:
- - 列裁剪：从上往下扫描，计算project需要哪些列，依次传递，最终得到所有的列的集合，scan时只需要扫描几列
- - 谓词下推
- -传递闭包
- - runtime filter（产生新的filter，用在join的查询端）
- Cost-based optimizer(CBO)：实用模型估算并选择代价最小的执行计划（贪心算法/动态规划）
- -统计信息：
- - - 原始表统计信息：表/分区级别；列级别
- - - 推导统计信息：selectivity；cardinality
- - 统计信息的收集方式：在数据库里面制定需要收集的统计信息；手动执行explain analyze statement；动态采样
- - 统计信息推导规则：