MySQL执行计划(explain)分析
EXPLAIN支持对SELECT、UPDATE、INSERT、REPLACE、DELETE分析
执行计划能知道:
SQL如何使用索引
联接查询的执行顺序
查询扫描的数据行数
ID列:
表示执行SELECT语句的顺序
ID相同时,执行顺序由上至下
ID越大优先级越高,越优先被执行
SELECT_TYPE列:
SIMPLE:不包含子查询或是UNION操作的查询
PRIMARY:查询中包含任何子查询,那么最外层的查询则被标记为PRIMARY
SUBQUERY:SELECT列表中的子查询
DEPENDENT SUBQUERY:依赖外部结果的子查询
UNION:UNION操作的第二个或是之后的查询的值为UNION
DEPENDENT UNION:当UNION作为子查询时,第二或是第二个后的查询的SELECT_TYPE值
UNION RESULT:UNION产生的结果集
DERIVED:出现在FROM子句中的子查询
用途:查看查询方法
TABLE列:
输出数据行所在的表的名称
<unionM,N>由ID为M,N查询union产生的结果集
<derivedN>或<subqueryN>由ID为N的查询产生的结果
用途:查看数据来源
PARTITIONS列
对于分区表,显示查询的分区ID
对于非分区表,显示为NULL
用途:用于检查出低效率的跨分区扫描
TYPE列
system:这是const联接类型的一个特例,当查询的表只有一行时使用
const:表中有且只有一个匹配的行时使用,如对主键或是唯一索引的查询,效率最高的联接方式
eq_ref: 唯一索引或主键查找,对于每个索引键,表中只有一条记录与之匹配
ref:非唯一索引查找,返回匹配某个单独值的所有行。
ref_or_null:类似于ref类型的查询,但是附加了对NULL值列的查询
index_merge:该联接类型表示使用了索引合并优化方法。
range:索引范围扫描,常见于between、>、<这样的查询条件
index:全索引撒秒,同ALL的区别是,遍历的是索引数
ALL:全表扫描,效率最差的连接方式
EXTRA列
distinct:优化distinct操作,在找到第一匹配的元祖后即停止找同样值的动作
not exists:使用Not Exists来优化查询
using filesort:使用额外操作进行排序,通常会出现在order by或group by查询中
using index:使用了覆盖索引进行查询
using temporary:MySQL需要使用临时表来处理查询,常见于排序,子查询,和分组查询
using where:需要在MySQL服务器层使用WHERE条件来过滤数据
select tables optimized away:直接通过索引来获取数据,不用访问表(效率最高)
POSSIBLE_KEYS列
指出MySQL能使用哪些索引来优化查询
查询列所涉及到的列上的索引都会被列出,但不一定会被使用
KEY列
查询优化器优化查询实际所使用的索引
如果没有可用的索引,则显示为NULL
如查询使用了覆盖索引,则该索引仅出现在Key列中
KEY_LEN列
表示索引字段的最大可能长度
长度由字段定义计算而来,并非数据的实际长度
REF列
表示哪些列或常量被用于查找索引列上的值
ROWS列
表示MySQL通过索引统计信息,估算的所需读取的行数
ROWS值的大小是个统计抽样结果,并不十分准确
FILTERED列
表示返回结果的行数占需读取行数的百分比
FILTERED列的值越大越好
依赖于统计信息
执行计划的限制
无法展示存储过程,触发器,UDF对查询的影响
无法使用EXPLAIN对存储过程进行分析
早期版本的MySQL只支持对SELECT语句进行分析
常见业务优化处理
优化评论分页查询
例子
SELECT customer_id,title,content FROM `product_comment`WHERE audit_status=1 AND product_id=199726LIMIT 0,5
这里的索引有audit_status和product_id,可以建立联合索引。但是哪个放左边就要计算区分度。
计算方法
SELECT COUNT(DISTINCT audit_status)/COUNT(*) AS audit_rate, COUNT(DISTINCT product_id)/COUNT(*) AS product_rate FROM product_comment;
区分度越高越好,放左边。结论product_rate>audit_rate
建立联合索引
CREATE INDEX idx_productID_auditStatus ON product_comment(product_id,audit_status)
如何删除重复数据
业务场景:删除评论表中对同一订单同一商品的重复评论,只保留最早的一条。
查看是否存在对于同一订单同一商品的重复评论。
SELECT order_id,product_id,COUNT(*) FROM product_comment GROUP BY order_id,product_id HAVING COUNT(*)>1;
备份product_comment表。
CREATE TABLE bak_product_comment_161022 LIKE product_comment; INSERT INTO bak_product_comment_161022 SELECT * FROM product_comment;
删除同一订单的重复评论。
DELETE a FROM product_comment a JOIN( SELECT order_id,product_id,MIN(comment_id) AS comment_id FROM product_comment GROUP BY order_id,product_id HAVING COUNT(*)>=2) b ON a.order_id=b.order_id AND a.product_id=b.product_idAND a.comment_id>b.comment_id
如何进行分区间数据统计示例
业务场景:统计消费总金额大于1000元的,800到1000元的,500到800元的,以及500元以下的人数。
SELECT COUNT(CASE WHEN IFNULL(total_money,0) >=1000 THEN a.customer_id END) AS '>1000' ,COUNT(CASE WHEN IFNULL(total_money,0) >=800 AND IFNULL(total_money,0) <1000 THEN a.customer_id END) AS '800~1000' ,COUNT(CASE WHEN IFNULL(total_money,0) >=500 AND IFNULL(total_money,0) <800 THEN a.customer_id END) AS '500~800' ,COUNT(CASE WHEN IFNULL(total_money,0) <500 THEN a.customer_id END) AS '<500'FROM mc_userdb.`customer_login` a LEFT JOIN ( SELECT customer_id,SUM(order_money) AS total_money FROM mc_orderdb.`order_master` GROUP BY customer_id) b ON a.`customer_id`=b.`customer_id`
捕获有问题的SQL-慢查日志
启动MySQL慢查日志
set global show_query_log_file = /sql_log/show_log.logset global log_queries_not_using_indexes = on; -- 未使用索引的SQL记录日志set global long_query_time=0.001; -- 抓取执行超过多少时间的SQL(秒)set global low_query_log=on; -- 启动
如何分析慢查日志,使用
mysqldumpslow
工具,例如:mysqldumpslow slow-mysql.log
作者:linxinzhe
链接:https://www.jianshu.com/p/4644d7243185