您的位置:首页 > 数据库 > MySQL

mysql高级---explain详解

2018-03-05 18:01 232 查看
一、Mysql Query Optimizer
二、Mysql 瓶颈分析CPU:CPU在饱和的时候,一般发生在数据装入内存或从磁盘上读取数据的时候(从磁盘到内存)

IO:磁盘I/O瓶颈发生在装入数据远大于内存容量的时候(装入数据>内存容量)

服务器硬件的性能瓶颈:top,free,iostat和vmstat来查看系统的性能状态

三、Explain(查询执行计划)假设mysql未出现瓶颈,且优化分析也未出现问题,那么就可以应用explain来分析sql查询执行计划
3.1是什么?(模拟、执行、分析)定义:使用exlain关键字可以模拟优化器执行SQL查询语句,从而知道MySql是如何处理你的SQL语句的。然后根据结果分析查询语句或是表结构的性能瓶颈。

3.2 能干什么?表的读取顺序(id:id越大,执行越早)
数据读取操作的操作类型(select_type)
哪些索引可以使用(possible_keys)
哪些索引被实际使用(key)
表之间的引用(ref)
每张表有多少行被优化器查询(rows)

3.3 怎么用?语法:explain + sql语句
举例:EXPLAIN SELECT * from tb_item a left join tb_item_desc b on a.id = b.item_id;
执行计划包含信息:

3.4 各字段解释说明
字段信息:
3.4.1、id (关键指标)select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的读取和加载顺序
三种情况说明情况一:id相同,执行顺序由上至下
情况二:id不同的情况,若是子查询,id的序号会递增,id值越大优先级越高,越先被执行。即,括号最里层的查询最先执行
情况三:id相同和不同,同时存在的情况。id如果相同,可以认为是一组,从上往下顺序执行;
在所有组中,id值越大,优先级越高,越先执行

图解:s1是一张衍生虚表
衍生=DERIVED
derived2表示衍生表, id=2的衍生虚表
图中的 id=2先执行,然后再顺序执行id=1的多条语句。

3.4.2、select_type表示数据读取操作的操作类型(查询类型),主要用于区分普通查询、联合查询、子查询等的复杂查询

注:临时表会增加系统的负担
3.4.3、table显示这行数据是属于哪张表的
3.4.4、type(关键指标)
概要:显示了查询使用了何种类型,一共有8种值,从最好到最差依次如下:常用类型
工作中常用的 system>const>eq_ref>ref>range>index>all>null
实际的最好到最差排序情况
          
详细说明:system:表只有一条记录(等于系统表),是const的特例,平时很少出现,可以忽略

const:表示通过索引一次就找到数据,用于primary key或者唯一索引
    说明:因为只匹配一行数据,所以很快,如将主键置于where列表中,MySQL就能将该查询转换为一个常量。    案例:       eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配,常用于主键索引和唯一性索引
    1、正例     EXPLAIN select * from tb_content_category a right join  tb_content b on a.id=b.category_id        说明:以b表为驱动表,对于a表来说,将b.category_id传递给a.id的关联结果是唯一的        2、反例 (理论上有用到索引,但是实际中未用到索引,索引失效 )    EXPLAIN select * from tb_content_category a left join  tb_content b on a.id=b.category_id    
    说明:不能用a表做为驱动表 ,因为对于b来说,将a.id传递给b.category_id的关联结果 不唯一    

    3、强关联的情况,会自动判断用哪个表做为驱动表    EXPLAIN select * from tb_content_category a , tb_content b where b.category_id=a.id    EXPLAIN select * from  tb_content b,tb_content_category a  where b.category_id=a.id    以上两句SQL的查询执行计划结果一致     
   重要结论:从以上的1、2两个案例可以看出,右连接的情况,左表 的关联字段要有建唯一索引,这样唯一索引才会生效(如1);左连接的情况,右表的关联字段不是唯一索引,                所以会出现索引失效的情况(如2)。问题:左连接的场景,给b表建了单值索引,但是分析结果还是一样的未用到此单值索引,这又是为啥呢?    
ref:非唯一性索引扫描,常用的一种查询类型
    返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,    然而,它可能会找到多个符合条件的行,所以它应该 属于查找和扫描的混合体。    案例:    

range:只检索给定范围的行,使用一个索引来选择行,key列显示使用了哪个索引。
    说明:一般就是在你的where语句中出现了between、<、>、in等的查询,这种范围扫描索引,要比扫描要好,    因为它只需要开始于索引的某一个点,而结束于另一个点,不用扫描全部索引。        案例:        
index:全索引扫描,只遍历索引树。
    说明:这个通常比all快,因为索引文件通常比数据文件小,也就是说虽然all和index都是读全表,但是index是从索引文件中读取的,而all是从硬盘中读取的数据    所以index比较快。    案例:        all:表示全表扫描,从硬盘中的数据文件中读取数据,若表数据量大(百万条数据)的时候就要考虑优化了
       总结:一般来说至少要达到range级别,最好能达到ref级别    3.4.5、possible_keys显示可能应用在这张表中的索引,一个或多个查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被实际使用

3.4.6、key(关键指标)说明:显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值。1、实际使用到的索引,如果为null,表示未使用到索引(未建索引或索引失效)
2、查询中若使用了覆盖索引,则该索引只出现在key列表中(type:index,说明只遍历索引树,extra:using index)换句话说:select语句查询的列的个数和顺序,跟表所建的复合索引的列的个数和顺序一致的情况,索引只出现在key列表中
3.4.7 key_len
说明:表示索引使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好。key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出来的。

3.4.8 ref 说明:查询中与其它表关联的字段,外键关系建立索引
案例:

个人理解:在关联查询的时候,谁是主表,那么就引用谁的 主键索引,如下例的情况eg 1:右连接,b 是主表,EXPLAIN SELECT * from tb_item a right join tb_item_desc b on a.id = b.item_id;

eg 2:左连接,a 是主表,EXPLAIN SELECT * from tb_item a left join tb_item_desc b on a.id = b.item_id;
注:以上操作的前提是a.id是唯一索引,且b.item_id在b表中也是唯一不重复的情况。换句话说,即a,b表是一对一的关系 
3.4.9 rows (关键指标)说明:根据表统计信息及索引选用的情况,大致估算出查出满足条件的结果,所需要读取的行数
案例:
3.4.10 extra#说明:包含不适合在其他列中显示,但十分重要的额外信息#详解:1、using fileort:说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。mysql中无法利用索引完成的排序操作称为“文件排序”。
前一条SQL用文件排序,比较慢;而后一条SQL用了索引排序,所以效率更高注:前一条SQL用了col3排序,而col2不确定的情况下,索引失效,而后一句SQL已确认col1的值,所以按col2,col3排序时,组合索引排序是有效的

2、using temporary:使用了临时表保存中间结果,mysql在对查询结果排序时使用临时表。常见于排序order by和分组查询group by
小结:当sql语句中有排序或分组时,排序和分组的列的顺序最好按照表所创建的 复合索引的列的顺序一致 。否则会额外用到文件索引或临时表,大大影响了sql的执行效率案例一中如果col1没有使用范围而是常量,则不会出现临时表和filesort
3、using index:从索引中检索表示相应的select操作中使用了覆盖索引(covering index),避免访问了表的数据行,效率不错!如果同时出现using where,表明索引被用来执行索引键值的查找;

如果没有同时出现using where,表明索引用来读取数据而非执行查找动作。

案例说明:
什么是覆盖索引?个人理解:select 查询的数据列跟复合索引的顺序个数不超过的情况,不必读取硬盘中数据文件中的数据行,可直接从索引文件中读取。★理解方式一:就是select的数据列只用从索引中就能够取得,不必读取数据行,mysql可以利用索引返回select列表中的字段,而不必根据索引再次读取数据文件,换句话说:查询列要被所建的索引覆盖。理解方式二:索引是高效找到行的一个方法,但是一般数据库也能使用索引找到一个列的数据,因此不必读取整个行。毕竟索引叶子节点存储了它们索引的数据;当能通过读取索引就可以得到想要的数据,那就不需要读取行了。一个索引包含了(或覆盖了)满足查询结果的数据就叫做覆盖索引。
补充纠正:select 列表中只取有创建索引的列(顺序要匹配,那个数是否都要匹配?个数超过索引肯定不行,若个数小于组合索引中列的个数呢?也可以称为覆盖索引吗?)——————————回答:是的,个数从索引中能取得就行,可以小于。

4、using where:使用了where 过滤条件
5、using join buffer:使用连接缓存
6、impossible where :where子句的值是false,不能用来获取任何元组。
7、select tables optimized away在没有group by子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段再进行计算,查询执行计划生成阶段即完成优化。
8、distinct:优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作。

3.5 热身case
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: