第三十七讲内部临时表内部临时表 union中的临时内存表应用（ sql1 ）union （sql2）语义是，取这两

内部临时表

（ sql1 ）union （sql2）语义是，取这两个子查询结果的并集。并集的意思就是这两个集合加起来，重复的行只保留一行。union改成union all的话，就没有了“去重”的语义。在对子查询的结果集做union的时候，使用了临时表(Using temporary)

select id%10 as m, count(*) as c from t1 group by m;

语句的执行流程是这样的：

如果你的需求并不需要对结果进行排序，那你可以在SQL语句末尾增加order by null。

内存临时表的大小是有限制的，参数tmp_table_size就是控制这个内存大小的，默认是16M。如果超过，mysql就会把内存临时表转成磁盘临时表，磁盘临时表默认使用的引擎是InnoDB。数据量很大，很可能这个查询需要的磁盘临时表就会占用大量的磁盘空间。

group by的语义逻辑，是统计不同的值出现的个数。但是，由于每一行的id%10的结果是无序的，所以我们就需要有一个临时表，来记录并统计结果。如果可以确保输入的数据是有序的，那么计算group by的时候，就只需要从左到右，顺序扫描，依次累加。（用索引解决）

在group by语句中加入SQL_BIG_RESULT这个提示（hint），就可以告诉优化器：这个语句涉及的数据量很大，请直接用磁盘临时表。MySQL优化器会判断磁盘临时表是B+树存储，存储效率不如数组来得高，于是MySQL优化器就直接用数组来存。

select SQL_BIG_RESULT id%100 as m, count(*) as c from t1 group by m;

SQL_BIG_RESULT的执行流程：

MySQL什么时候会使用内部临时表？

如果语句执行过程可以一边读数据，一边直接得到结果，是不需要额外内存的，否则就需要额外的内存，来保存中间结果；
join_buffer是无序数组，sort_buffer是有序数组，临时表是二维表结构；
如果执行逻辑需要用到二维表特性，就会优先考虑使用临时表。比如我们的例子中，union需要用到唯一索引约束， group by还需要用到另外一个字段来存累积计数。