详解Mysql多表联合查询效率分析及优化
1.多表连接类型
1.笛卡尔积(交叉连接)在MySQL中可以为CROSSJOIN或者省略CROSS即JOIN,或者使用',' 如:
SELECT*FROMtable1CROSSJOINtable2 SELECT*FROMtable1JOINtable2 SELECT*FROMtable1,table2
由于其返回的结果为被连接的两个数据表的乘积,因此当有WHERE,ON或USING条件的时候一般不建议使用,因为当数据表项目太多的时候,会非常慢。一般使用LEFT[OUTER]JOIN或者RIGHT[OUTER]JOIN
2. 内连接INNERJOIN在MySQL中把INNERJOIN叫做等值连接,即需要指定等值连接条件在MySQL中CROSS和INNERJOIN被划分在一起。join_table:table_reference[INNER|CROSS]JOINtable_factor[join_condition]
3.MySQL中的外连接,分为左外连接和右连接,即除了返回符合连接条件的结果之外,还要返回左表(左连接)或者右表(右连接)中不符合连接条件的结果,相对应的使用NULL对应。
例子:
user表:
id|name
———
1|libk
2|zyfon
3|daodao
user_action表:
user_id|action
—————
1|jump
1|kick
1|jump
2|run
4|swim
sql:
selectid,name,actionfromuserasu leftjoinuser_actionaonu.id=a.user_id
result:
id|name |action
——————————–
1 |libk |jump ①
1 |libk |kick ②
1 |libk |jump ③
2 |zyfon |run ④
3 |daodao|null ⑤
分析:
注意到user_action中还有一个user_id=4,action=swim的纪录,但是没有在结果中出现,
而user表中的id=3,name=daodao的用户在user_action中没有相应的纪录,但是却出现在了结果集中
因为现在是leftjoin,所有的工作以left为准.
结果1,2,3,4都是既在左表又在右表的纪录,5是只在左表,不在右表的纪录
工作原理:
从左表读出一条,选出所有与on匹配的右表纪录(n条)进行连接,形成n条纪录(包括重复的行,如:结果1和结果3),如果右边没有与on条件匹配的表,那连接的字段都是null.然后继续读下一条。
引申:
我们可以用右表没有on匹配则显示null的规律,来找出所有在左表,不在右表的纪录,注意用来判断的那列必须声明为notnull的。
如:
sql:
selectid,name,actionfromuserasu leftjoinuser_actionaonu.id=a.user_id wherea.user_idisNULL
注意:
1.列值为null应该用isnull而不能用=NULL
2.这里a.user_id列必须声明为NOTNULL的.
上面sql的result:
id|name|action
————————–
3|daodao|NULL
——————————————————————————–
一般用法:
a.LEFT[OUTER]JOIN:
除了返回符合连接条件的结果之外,还需要显示左表中不符合连接条件的数据列,相对应使用NULL对应
SELECTcolumn_nameFROMtable1LEFT[OUTER]JOINtable2ONtable1.column=table2.column b.RIGHT[OUTER]JOIN:
RIGHT与LEFTJOIN相似不同的仅仅是除了显示符合连接条件的结果之外,还需要显示右表中不符合连接条件的数据列,相应使用NULL对应
SELECTcolumn_nameFROMtable1RIGHT[OUTER]JOINtable2ONtable1.column=table2.column
Tips:
1.ona.c1=b.c1等同于using(c1)
2.INNERJOIN和,(逗号)在语义上是等同的
3.当MySQL在从一个表中检索信息时,你可以提示它选择了哪一个索引。
如果EXPLAIN显示MySQL使用了可能的索引列表中错误的索引,这个特性将是很有用的。
通过指定USEINDEX(key_list),你可以告诉MySQL使用可能的索引中最合适的一个索引在表中查找记录行。
可选的二选一句法IGNOREINDEX(key_list)可被用于告诉MySQL不使用特定的索引。如:
mysql>SELECT*FROMtable1USEINDEX(key1,key2) ->WHEREkey1=1ANDkey2=2ANDkey3=3; mysql>SELECT*FROMtable1IGNOREINDEX(key3) ->WHEREkey1=1ANDkey2=2ANDkey3=3;
2.表连接的约束条件
添加显示条件WHERE,ON,USING
1.WHERE子句
mysql>
SELECT*FROMtable1,table2WHEREtable1.id=table2.id;
2.ON
mysql>
SELECT*FROMtable1LEFTJOINtable2ONtable1.id=table2.id; SELECT*FROMtable1LEFTJOINtable2ONtable1.id=table2.id LEFTJOINtable3ONtable2.id=table3.id;
3.USING子句,如果连接的两个表连接条件的两个列具有相同的名字的话可以使用USING
例如:
SELECTFROMLEFTJOINUSING()
连接多于两个表的情况举例:
mysql>
SELECTartists.Artist,cds.title,genres.genre FROMcds LEFTJOINgenresNcds.genreID=genres.genreID LEFTJOINartistsONcds.artistID=artists.artistID;
或者mysql>
SELECTartists.Artist,cds.title,genres.genre FROMcds LEFTJOINgenresONcds.genreID=genres.genreID LEFTJOINartists->ONcds.artistID=artists.artistID WHERE(genres.genre='Pop');
--------------------------------------------
另外需要注意的地方在MySQL中涉及到多表查询的时候,需要根据查询的情况,想好使用哪种连接方式效率更高。
1.交叉连接(笛卡尔积)或者内连接[INNER|CROSS]JOIN
2.左外连接LEFT[OUTER]JOIN或者右外连接RIGHT[OUTER]JOIN注意指定连接条件WHERE,ON,USING.
3.MySQL如何优化LEFTJOIN和RIGHTJOIN
在MySQL中,ALEFTJOINBjoin_condition执行过程如下:
1)· 根据表A和A依赖的所有表设置表B。
2)· 根据LEFTJOIN条件中使用的所有表(除了B)设置表A。
3)· LEFTJOIN条件用于确定如何从表B搜索行。(换句话说,不使用WHERE子句中的任何条件)。
4)· 可以对所有标准联接进行优化,只是只有从它所依赖的所有表读取的表例外。如果出现循环依赖关系,MySQL提示出现一个错误。
5)·进行所有标准WHERE优化。
6)·如果A中有一行匹配WHERE子句,但B中没有一行匹配ON条件,则生成另一个B行,其中所有列设置为NULL。
7)·如果使用LEFTJOIN找出在某些表中不存在的行,并且进行了下面的测试:WHERE部分的col_nameISNULL,其中col_name是一个声明为NOTNULL的列,MySQL找到匹配LEFTJOIN条件的一个行后停止(为具体的关键字组合)搜索其它行。
RIGHTJOIN的执行类似LEFTJOIN,只是表的角色反过来。
联接优化器计算表应联接的顺序。LEFTJOIN和STRAIGHT_JOIN强制的表读顺序可以帮助联接优化器更快地工作,因为检查的表交换更少。请注意这说明如果执行下面类型的查询,MySQL进行全扫描b,因为LEFTJOIN强制它在d之前读取:
SELECT* FROMa,bLEFTJOINcON(c.key=a.key)LEFTJOINdON(d.key=a.key) WHEREb.key=d.key;
在这种情况下修复时用a的相反顺序,b列于FROM子句中:
SELECT* FROMb,aLEFTJOINcON(c.key=a.key)LEFTJOINdON(d.key=a.key) WHEREb.key=d.key;
MySQL可以进行下面的LEFTJOIN优化:如果对于产生的NULL行,WHERE条件总为假,LEFTJOIN变为普通联接。
例如,在下面的查询中如果t2.column1为NULL,WHERE子句将为false:
SELECT*FROMt1LEFTJOINt2ON(column1)WHEREt2.column2=5;
因此,可以安全地将查询转换为普通联接:
SELECT*FROMt1,t2WHEREt2.column2=5ANDt1.column1=t2.column1;
这样可以更快,因为如果可以使查询更佳,MySQL可以在表t1之前使用表t2。为了强制使用表顺序,使用STRAIGHT_JOIN。
以上就是本文的全部内容,希望对大家的学习有所帮助。