MySQL慢sql优化思路详细讲解
1、开启Mysql慢查询
1.1、查看慢查询相关配置
show variables like 'slow_query_log%'
slow_query_log 表示慢查询开启的状态
slow_query_log_file 表示慢查询日志存放的位置
1.2、查询慢查询sql耗时临界点
show variables like 'long_query_time'
long_query_time 表示查询超过多少秒才记录到慢查询日志。
1.3、开启Mysql慢查询
方式一:修改配置文件开启慢查询
在my.ini增加如下配置
# 定义sql耗时多少秒就算是慢查询,记录慢查询日志 long_query_time=2 # 开启慢查询 slow_query_log=on # 定义慢查询日志文件名 slow_query_log_file=/usr/local/mysql/mysql-slow-query.log
方式二:通过命令开启慢查询
set global slow_query_log=ON # 开启慢查询日志 set global long_query_time=2 # SQL查询时间大于2秒,则记录慢查询日志
2、explain查看SQL执行计划
explain + SQL,查看SQL的执行计划。重点关注type、rows、extra、key指标。
2.1、Select_type
查询类型:
- SIMPLE : 表示查询语句不包含子查询或union
- PRIMARY:表示此查询是最外层的查询
- UNION:表示此查询是UNION的第二个或后续的查询
- DEPENDENT UNION:UNION中的第二个或后续的查询语句,使用了外面查询结果
- UNION RESULT:UNION的结果
- SUBQUERY:SELECT子查询语句
- DEPENDENT SUBQUERY:SELECT子查询语句依赖外层查询的结果
2.2、Type
存储引擎查询数据时采用的方式:
性能:NULL > const > eq_ref > ref > range > index > ALL
- ALL:表示全表扫描,性能最差。
- index:表示基于索引的全表扫描,先扫描索引再扫描全表数据。
- range:表示使用索引范围查询。使用>、>=、<、<=、in等等。
- ref:表示使用非唯一索引进行单值查询。
- eq_ref:一般情况下出现在多表join查询,表示前面表的每一个记录,都只能匹配后面表的一行结果。
- const:表示使用主键或唯一索引做等值查询,常量查询。
- NULL:表示不用访问表,速度最快。
2.3、Possible_keys
表示查询时可能使用到的索引。
2.4、Key
查询时真正使用到的索引。
2.5、Key_len
表示查询使用了索引的字节数量。可以判断是否全部使用了组合索引。
- 字符串类型
字符串长度跟字符集有关:latin1=1、gbk=2、utf8=3、utf8mb4=4
char(n):n*字符集长度
varchar(n):n * 字符集长度 + 2字节
- 数值类型
TINYINT:1个字节 SMALLINT:2个字节 MEDIUMINT:3个字节
INT、FLOAT:4个字节 BIGINT、DOUBLE:8个字节
- 时间类型
DATE:3个字节 TIMESTAMP:4个字节 DATETIME:8个字节
- 字段属性
NULL属性占用1个字节,如果一个字段设置了NOT NULL,则没有此项
2.6、Rows
SQL查询扫描的行数,行数越小越好。MySQL查询优化器会根据统计信息,估算SQL要查询到结果需要扫描多少行记录。
2.7、Extra
额外信息。
- Using where:表示查询需要通过索引回表查询数据。
- Using index:表示查询需要通过索引,索引就可以满足所需数据。
- Using filesort:表示查询出来的结果需要额外排序,数据量小在内存,大的话在磁盘,因此有Using filesort建议优化。
- Using temprorary:查询使用到了临时表,一般出现于去重、分组等操作。
- Using index condition:MySQL5.6之后新增的索引下推。在存储引擎层进行数据过滤,而不是在服务层过滤,利用索引现有的数据减少回表的数据。
3、profile 分析执行耗时
观测SQL
真正的执行线程状态及消耗的时间。
3.1、查询profile开启状态
show variables like '%profil%'
- have_profiling:确定是否支持 profile
- profiling:是否开启profiling
- profiling_history_size:定义MySQL服务器最近接收到的SQL条数。
3.2、开启profiling
执行如下SQL:
set profiling=ON set profiling_history_size=30
3.3、查看最近运行的SQL
3.3.1、show profiles
查询最近SQL的执行耗时。
-- 查询最近profiling_history_size条SQL show profiles;
3.3.2、show profile for query id
查询一条SQL从开始到结束整个生命周期各个阶段的执行耗时。
-- 根据query_id查询指定SQL执行耗时 show profile for query id
4、Optimizer Trace分析详情
profile只能查询SQL执行耗时,无法看到SQL具体的执行信息。
Optimizer Trace:可以跟踪执行语句的解析优化执行的全过程。
4.1、分析流程
打开开关
set optimizer_trace="enabled=on"
执行需要分析的SQL执行跟踪
select * from information_schema.optimizer_trace
4.2、结果分析
- join_preparation:准备阶段
- join_optimization:分析阶段
- join_execution:执行阶段
5、慢查询经典案例总结
以user表为例举例说明:
CREATE TABLE user ( id int(11) NOT NULL AUTO_INCREMENT, user_id varchar(32) NOT NULL, age varchar(16) NOT NULL, name varchar(255) NOT NULL, PRIMARY KEY (id), KEY idx_userid (userId) USING BTREE ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
5.1、隐式类型转换
把userId设为索引,如果在查询条件中把一个数字传给user_id,则索引失效。
# user_id索引失效,传的是数字123,索引user_id类型为字符串,两者类型不匹配 # MySql会将user_id转换为字符串再进行比较。 select *from user where user_id = 123 # 走userId索引 select *from user where user_id = '123'
5.2、最左匹配
不满足最左匹配原则,索引不生效。
5.3、limit深分页问题
MySql会查询满足条件的100010行,然后丢弃前100000行,返回最后10行。
select *from user where age > 20 limit 100000,10
解决方案:减少回表
标签记录法:
标记一下上次查询到哪一条了,下次再来查的时候,从该条开始往下扫描。
# 标签记录法:局限是要求id连续 select *from user where id > 100000 limit 10
延迟关联法:
把条件转移到主键索引树,减少回表。
# 为age字段创建索引,通过age索引查询到满足条件的id,再与原表通过id内连接 select user1.id, user1.age, user1.name FROM user user1 INNER JOIN ( SELECT u.id FROM user u WHERE u.age > 20 limit 100000, 10 ) AS user2 on user1.id= user2.id;
5.4、in元素过多
如果in中的元素过多,建议分组查询,一次200个。
select * from user where user_id in (1,2,3...200) union all select * from user where user_id in (201,202,203...400)
5.5、order走文件排序导致的慢查询
执行计划如下,Extra中包含了Using filesort(文件排序)。
因为数据是无序的,所以就需要排序。如果数据本身是有序的,那就不会再用到文件排序啦。而索引数据本身是有序的,我们通过建立索引来优化order by
语句。
我们还可以通过调整max_length_for_sort_data、sort_buffer_size
等参数优化;
5.6、索引字段使用is null 或 is not null可能导致索引失效
有时可能因为数据量问题,导致MySQL优化器放弃走索引。另外,用explain分析SQL的时候,需要注意type=range时,可能会因为数据量问题,导致索引无效。
5.7、索引字段上使用(!= 或者 < >, not in)可能导致索引失效
如果优化器觉得即使走了索引,还是需要扫描很多很多行的哈,它觉得不划算,不如直接不走索引。
5.8、左右连接,关联的字段编码格式不一致
select u.name, j.name, j.job from user u left join user_job j on u.name = j.name
将user表的name字段以及user_job表的name字段均设置索引
- 假设user表的name字段编码为utf8,user_job表的name字段编码为utf8mb4,则上述sql查询不走索引。
- 假设user表的name字段编码和user_job表的name字段编码均为utf8,则上述sql查询走索引。
5.9、delete + in子查询不走索引
delete from user where name in (select name from old_user)
- delete + in子查询不走索引
- select + in子查询走索引
这是因为,实际执行的时候,MySQL对select in子查询做了优化,把子查询改成join的方式,所以可以走索引。但是对于delete in子查询,MySQL却没有对它做这个优化。
总结
到此这篇关于MySQL慢sql优化思路详细讲解的文章就介绍到这了,更多相关MySQL慢sql优化内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
MySQL中TIMESTAMP类型返回日期时间数据中带有T的解决
这篇文章主要介绍了MySQL中TIMESTAMP类型返回日期时间数据中带有T的解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教2022-12-12
最新评论