MySQL优化GROUP BY方案
执行GROUPBY子句的最一般的方法:先扫描整个表,然后创建一个新的临时表,表中每个组的所有行应为连续的,最后使用该临时表来找到组并应用聚集函数(如果有聚集函数)。在某些情况中,MySQL通过访问索引就可以得到结果,而不用创建临时表。此类查询的EXPLAIN输出显示Extra列的值为Usingindexforgroup-by。
一。松散索引扫描
1.满足条件
查询针对一个表。
GROUPBY使用索引的最左前缀。
只可以使用MIN()和MAX()聚集函数,并且它们均指向相同的列。
2.示例
表t1(c1,c2,c3,c4)有一个索引idx(c1,c2,c3):
SELECTc1,c2FROMt1GROUPBYc1,c2; SELECTDISTINCTc1,c2FROMt1; SELECTc1,MIN(c2)FROMt1GROUPBYc1; SELECTc1,c2FROMt1WHEREc1<constGROUPBYc1,c2; SELECTMAX(c3),MIN(c3),c1,c2FROMt1WHEREc2>constGROUPBYc1,c2; SELECTc2FROMt1WHEREc1<constGROUPBYc1,c2; SELECTc1,c2FROMt1WHEREc3=constGROUPBYc1,c2;
不满足条件示例:
1.除了MIN()或MAX(),还有其它累积函数,例如:
SELECTc1,SUM(c2)FROMt1GROUPBYc1;
2.GROUPBY子句中的域不引用索引开头,例如:
SELECTc1,c2FROMt1GROUPBYc2,c3;
3.查询引用了GROUPBY部分后面的关键字的一部分,并且没有等于常量的等式,例如:
SELECTc1,c3FROMt1GROUPBYc1,c2;
二。紧凑索引扫描
如果不满足松散索引扫描条件,执行GROUPBY仍然可以不用创建临时表。如果WHERE子句中有范围条件,该方法只读取满足这些条件的关键字。
否则,进行索引扫描。该方法读取由WHERE子句定义的范围。
1.GROUPBY中有一个漏洞,但已经由条件c2='a'覆盖。
SELECTc1,c2,c3FROMt1WHEREc2='a'GROUPBYc1,c3;
2.GROUPBY不是满足最左前缀,但是有一个条件提供该元素的常量:
SELECTc1,c2,c3FROMt1WHEREc1='a'GROUPBYc2,c3;