MySQL中explain使用快速查询手册

 更新时间:2022年10月16日 07:50:40   作者:AntBlack  
我们会开慢查询去记录一些执行时间比较久的SQL语句,找出这些SQL语句并不意味着完事了,会用到explain这个命令来查看一个这些SQL语句的执行计划,查看该SQL语句有没有使用索引,下面这篇文章主要介绍了关于MySQL中explain使用快速查询手册的相关资料,需要的朋友可以参考下

一. 前言

上一篇整理完了 MySQL 的性能优化方式 , 其中最常用的就是 explain .

这一篇来详细看看 explain 中各个参数的含义和扩展 , 整理出来便于使用时快速查询

二 . explain 使用

三. 业务实践

在日常实践中 , 我们应该如何使用 explain 提供的查询来判断索引怎么配置呢?

以一个实际业务场景为例 : 首先场景里面的数据分布都很均衡 , 这就导致设置的索引在查询优化器的处理下 , 很难产生最好的效果.

先来看一下表结构 :

CREATE TABLE `user_info` (
  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键id',
  `user_id` bigint(20) NOT NULL DEFAULT '0' COMMENT '会员ID',
  `user_no` bigint(20) NOT NULL DEFAULT '0' COMMENT '会员编号',
  `open_id` varchar(128) NOT NULL DEFAULT '' COMMENT '外部ID',
  `org_id` varchar(128) NOT NULL DEFAULT '0' COMMENT '组织ID',
  `listen_num` int(11) NOT NULL DEFAULT '0' COMMENT '记录次数',
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
  `create_person` varchar(50) NOT NULL DEFAULT '' COMMENT '创建人',
  `update_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',
  `update_person` varchar(50) NOT NULL DEFAULT '' COMMENT '更新人',
  PRIMARY KEY (`id`),
  KEY `idx_user_id` (`user_id`),
  KEY `idx_org_id_open_id` (`org_id`,`open_id`) USING BTREE,
  KEY `idx_create_time` (`create_time`) USING BTREE,
  KEY `idx_update_time` (`update_time`) USING BTREE
) COMMENT='会员记录表';
  • 需要获取到记录次数 (listen_num) > 0 用户的会员编号 (user_no)
  • org_id 只有四种数据 (A/B/C/D) , 每种数据预计占25% - 30%
  • 数据是重复修改的关系 , 修改后会更新 update_time

基础信息

// 1. 总记录数 4200000

// 2. 不同 org_id 下的记录数
- 1234567890 : 100万
- 9876543210 : 100万
- 8888888888 : 100万
- 6666666666 : 100万
- 其他 : 20万

// 3. 时间周期 
> 2022-01
> 2022-12

3.1 以 user_id 为条件进行查找的思路

listen_num 本身没有创建索引 , 以该字段查肯定会走全表 , 优先考虑的思路就是 > user_id 为条件进行有序查询 :

explain select * from user_info where user_id > 69999887 and listen_num > 0

这里看起来好像万事大吉 , 你看索引不是生效了吗 , 只扫描了16行 ,nice!

但是 , 回想一下 B+Tree 的原则 , 在节点里面搜索条件是由小到大有序排列的 , 而带了这个 user_id 处 , 实际上已经快结束了 , 查询优化器理所当然的选择了通过 idx_user_id 进行查询 

如果以开始ID做查询条件 ,可以发现实际上索引没有生效 , 而类型也是全表

explain select * from user_info where user_id > 10000025 and listen_num > 0

总结 : 当索引字段遍布整个数据范围 , 且查询很分散的时候 , 在前排序区间的数据可能会放弃使用索引

3.2 以更新时间为查询条件

既然二级索引里面是有序 , 那么以时间作为查询条件是不是最好的 ?

EXPLAIN SELECT *  FROM user_info 
WHERE update_time > "2022-08-03 01:04:55" AND update_time < "2022-09-03 01:04:55" AND listen_num > 0 LIMIT 100

这里看起来就很不错了 , 查询行数和索引都使用的很理想. 但是这里面会有一个致命的问题 , 如果是大批量数据查询 , 那么这里一定会出现深度分页的问题

3.3 简单优化通过 orgId 进行切割

首先数据结构的特点是什么? >> 四个组织分布很平均 , 也就是说如果 org_id 生效 ,我们至少可以只保存四分之一的查询量

EXPLAIN SELECT *  FROM user_info WHERE org_id = "123" and update_time > "2022-08-03 01:04:55" AND update_time < "2022-09-03 01:04:55" and listen_num > 0 LIMIT 100

初步总结

通过以上三个案例 , 基本上就可以看出 explain 的基本用法

  • 通过 type 判断比较的类型
  • 通过 key 判断是否使用了自己期望的索引
  • 通过 row 判断这个索引的效果

3.4 多索引条件的抉择

要记住的一点是 , 索引并不是我们以为的样子 ,当多个索引同时存在的时候 , MySQL 会根据情况进行选择. 比如 :

EXPLAIN SELECT *  FROM user_info 
WHERE org_id = "1234567890" and update_time > "2022-08-03 01:04:55" AND update_time < "2022-08-04 01:04:55" 
and listen_num > 0 LIMIT 100

如果这里把时间周期拉长 , 那么结果也会相应的转变 :

EXPLAIN SELECT *  FROM user_info 
WHERE org_id = "1234567890" and update_time > "2022-08-03 01:04:55" AND update_time < "2022-09-04 01:04:55"
and listen_num > 0 LIMIT 100

3.5 连表查询的关注点

连表查询中主要关注的属性是 filtered , 来实际来看看这个属性 :

// org 是个很简单的表 , org_id 即对于其ID
EXPLAIN SELECT *  FROM user_info as u , org as o WHERE org_id = "123" and u.org_id = o.id

  • 在单表时 , filtered 表示索引生效的占比 . 简单来说 ,比例越高,则索引利用率越高
  • 在多表时 , 这个表示次表需要查询的行数占比. 也就是被驱动的表剩余的查询次数

四. 深入问题

4.1 explain 的结果能作为最终决策吗?

explain 的结果并不能作为最终决策行为 , explain 是执行计划 , 计划和实际是会存在偏差的, 毕竟 explain 没有真的执行.

哪怕我们最终只需要100行 , 按照 ID 排序的情况下只查几行 , 实际上执行计划的 row 仍然会很庞大.

总结

explain 主要作为参考 , 在实际使用中 , 需要更多的经验思考. 可能最终的结果和explain的不一致.

例如上面的案例 , 按照 explain 的做法 , 用短时间周期最好 ,其次应该是 org_id .

但是根据业务场景 ,我会选择通过 > id 的方式循环查. 一个是业务原因 ,查询的量大 , 上述两种方式都不能避免深度翻页的问题.

到此这篇关于MySQL中explain使用快速查询手册的文章就介绍到这了,更多相关MySQL explain快速查询手册内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

参考 :

<高性能MySQL>

<MySQL 是怎样运行的:从根儿上理解 MySQL>

相关文章

  • mysql双游标嵌套循环方式

    mysql双游标嵌套循环方式

    这篇文章主要介绍了mysql双游标嵌套循环方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-07-07
  • mysql不支持group by的解决方法小结

    mysql不支持group by的解决方法小结

    下载安装的是最新版的mysql5.7.x版本,默认是开启了 only_full_group_by 模式的,但开启这个模式后,原先的 group by 语句就报错,然后又把它移除了
    2020-02-02
  • MySQL语句之删除指令deleted和truncate在使用中的异同详解

    MySQL语句之删除指令deleted和truncate在使用中的异同详解

    这篇文章主要介绍了MySQL语句之删除指令deleted和truncate在使用中的异同,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-04-04
  • mysql jdbc连接步骤及常见参数

    mysql jdbc连接步骤及常见参数

    这篇文章主要介绍了mysql jdbc连接步骤及常见参数,需要的朋友可以参考下
    2015-09-09
  • Mysql日期查询的详细介绍

    Mysql日期查询的详细介绍

    这篇文章主要介绍了Mysql日期查询的详细介绍,根据时间段进行查询数据库中单表中的数据,如果感兴趣的来了解一下
    2020-07-07
  • MySQL数据库导出与导入及常见错误解决

    MySQL数据库导出与导入及常见错误解决

    MySQL数据库导出与导入的过程中将会发生众多不可预知的错误,本文整理了一些常见错误及相应的解决方法,遇到类似情况的朋友可以参考下,希望对大家有所帮助
    2013-07-07
  • mysqld_safe启动脚本源码阅读、分析

    mysqld_safe启动脚本源码阅读、分析

    这篇文章主要介绍了mysqld_safe启动脚本源码阅读、分析,mysqld_safe是一个带有安全特性的启动脚本,使用Shell语言编写,需要的朋友可以参考下
    2014-07-07
  • mysql报错:1406 Data too long for column问题的多种解决方案

    mysql报错:1406 Data too long for colu

    这篇文章给大家介绍了多种解决mysql报错:1406, Data too long for column的解决方法,如果有遇到相同问题的朋友可以参考阅读本文,对解决问题有一定的帮助,需要的朋友可以参考下
    2023-09-09
  • MySQL 常见的数据表设计误区汇总

    MySQL 常见的数据表设计误区汇总

    虽然会有一些常规意义上的数据表错误设计和优秀设计原则,但是同样也会有 MySQL 特定的一些情况,这会导致我们犯一些 MySQL 特定的错误。本篇讨论常见的设计误区。
    2021-06-06
  • mysql 找回误删表的数据方法(必看)

    mysql 找回误删表的数据方法(必看)

    下面小编就为大家带来一篇mysql 找回误删表的数据方法(必看)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-03-03

最新评论