MySQL 分组查询的优化方法

更新时间：2021年05月12日 10:14:48 作者：岛上码农

这篇文章主要介绍了MySQL 分组查询的优化方法，帮助大家更好的理解和学习使用MySQL，感兴趣的朋友可以了解下

MySQL 在处理 GROUP BY 和 DISTINCT 查询的方式在大多数情况下类似，事实上，在优化过程中有时候会把在这两种方式中转换。两类查询都能够从索引中受益，通常，这也是优化这两种查询最为重要的方式。

在无法使用索引时，MySQL 对于 GROUP BY 查询有两种策略：使用临时表或者 filesort 执行分组。对于给定的查询，两种方式都没法更高效。我们可以通过配置 SQL_BIG_RESULT 和 SQL_SMALL_RESULT 来指定优化器选择其中一个方式。

通常，对查询表的id 进行分组比使用值进行分组效率更高，例如下面的查询效率就比较低：

SELECT actor.first_name, actor.last_name, COUNT(*)
FROM sakila.file_actor
INNER JOIN sakila.actor USING(actor_id)
GROUP BY actor.first_name, actor.last_name;

而下面的查询方式则更有效：

SELECT actor.first_name, actor.last_name, COUNT(*)
FROM sakila.file_actor
INNER JOIN sakila.actor USING(actor_id)
GROUP BY film_actor.actor_id;

而使用 actor.actor_id 进行分组会比 film_actor.actor_id更高效。

这个查询能够发挥其优势的依据是演员(actor)的姓名是依赖于 actor_id 的，因此会返回相同的结果，但是如果返回的结果不同的话就不能这么做了。甚至有些时候服务端通过 SQL_MODE 配置禁用了 GROUP BY。此时如果不关心获取的值，而且用于分组的列的值是唯一的，这可以使用 MIN和 MAX 来解决这个问题。

SELECT MIN(actor.first_name), MAX(actor.last_name), ...;

对于完美主义者，他们会认为你的分组是错误的，他们也是对的。一个虚拟的 MIN 或 MAX 的结果是查询并不会正确地组装。然而，有时候你只是为了让 MySQL 更快地执行查询。完美主义者对于下面的查询会满意：

SELECT actor.fisrt_name, actor.last_name, c.cnt
FROM sakila.actor
	INNER JOIN (
    SELECT actor_id, COUNT(*) AS cnt
    FROM sakila.film_actor
    GROUP BY actor_id
  ) AS c USING(actor_id);

然而，子查询中创建和填充临时表的代价可能比理论上看起来的死办法更高。需要记住的是，子查询构建的临时表是没有索引的，这会导致性能上的下降。

通常在分组查询中，选择没有分组的列是一个糟糕的主意。这是因为查询结果是不确定的，一旦改变了索引或优化器使用了不同的策略都会导致结果被改变。事实上，我们建议将服务端的 SQL_MODE 设置为 ONLY_FULL_GROUP_BY，这时写了一个糟糕的分组查询时，系统会产生一个错误而不是直接执行。开启 ONLY_FULL_GROUP_BY 后，SELECT 的字段只能是 GROUP BY 指定的字段，此时可以通过构建分步查询或子查询的方式，先分组查出分组的列，再做二次查询。

MySQL 会根据 GROUP BY 指定的列次序自动分组，除非是使用了 ORDER BY 指定排序规则。如果不在乎次序并且发现了这导致了一个 filesort，这时候可以使用 ORDER BY NULL 来跳过自动排序。也可以通过在 GROUP BY 后面增加 DESC 或 ASC 来指定结果按指定的方向排序。

有时候可以在分组查询时要求 MySQL 在结果中做一次超级聚合。这可以通过在 GROUP BY 后面增加WITH ROLLUP 子句完成，但是这不一定能够达到优化的预期。可以通过 EXPLAIN 检查执行的方法，注意分组有没有通过 filesort 或临时表完成。然后在对相同的查询移除 WITH ROLLUP 后进行对比。通过对比也许可以找到优化的办法。

有些时候通过增加聚合查询会使得效率更高，虽然这种方式会返回更多的行。也可以通过在 FROM 后面嵌套子查询来保持中间查询结果，然后再使用 UNION 获取最终结果。

但是注意的是，在应用程序中最好是移除 WITH ROLLUP，而通过优化来完成分组查询。

结语：使用 GROUP BY 进行分组查询时最好是使用索引列分组，若无需指定次序可以使用 ORDER BY NULL 进行优化。倘若不按索引列分组的时候，则需要考虑变通的办法，并且考虑是否要使用子查询或使用 WITH ROLLUP 检查性能后再做优化。同时，为了防止分组查询出现不可预料的错误，最好是开启 ONLY_FULL_GROUP_BY。

以上就是MySQL 分组查询的优化方法的详细内容，更多关于MySQL 分组查询的优化的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

MySQL root账号远程新建数据库报错1044问题及解决方法
这篇文章主要介绍了MySQL root账号远程新建数据库报错1044问题及解决方法,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2022-09-09
一文弄懂MySQL自增主键
这篇文章主要介绍了MySQL自增主键,MySQL的自增主键并不一定是连续的,自增值的保存位置和修改机制决定了一种自增值不连续的场景,下面就来具体介绍一下,感兴趣的可以了解一下
2025-01-01
MySQL中常见的几种日志汇总
这篇文章主要给大家介绍了关于MySQL中常见的几种日志，文中通过实例代码结束的非常详细，对大家学习或者使用MySQL具有一定的参考学习价值，需要的朋友们下面来一起学习学习吧
2020-08-08
MYSQL表优化方法小结讲的挺全面
一篇MYSQL表优化的文章，说的很好，使用mysql的朋友可以参考下。
2010-05-05
MySQL主从配置学习笔记
在本篇文章里小编给大家整理的是关于MySQL主从配置学习笔记相关内容，需要的朋友们可以学习下。
2020-03-03
详细聊聊MySQL中慢SQL优化的方向
由于在MySQL日常查询中，查询类型的语句占慢sql的大部分,所以下面这篇文章主要给大家介绍了关于MySQL中慢SQL优化方向的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
2021-08-08
MySQL字符串前缀索引使用
本文主要介绍了MySQL字符串前缀索引使用，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2023-02-02
MySQL创建表时字符串的默认值问题
这篇文章主要介绍了MySQL创建表时字符串的默认值问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2023-10-10
深度探究：让MySQL支撑亿级流量的秘密！
MySQL是当前最为常用的关系型数据库之一,它的出色性能和可靠性使得它成为了许多互联网企业的首选,但是,如何让MySQL支撑亿级流量的挑战,成为了很多技术人员需要面对和解决的问题,需要的朋友可以参考下
2023-10-10
深入探寻mysql自增列导致主键重复问题的原因
前几天开发的同事反馈一个利用load data infile命令导入数据主键冲突的问题，分析后确定这个问题可能是mysql的一个bug，这里提出来给大家分享下。以免以后有童鞋遇到类似问题百思不得其解，难以入眠，哈哈。
2014-08-08

MySQL 分组查询的优化方法

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具