MySQL中聚合函数count的使用和性能优化技巧

 更新时间:2018年06月15日 15:56:20   作者:lmy86263  
这篇文章主要介绍了Windows 10,MySQL版本是5.7.12-log环境下mysql中聚合函数count的使用和性能优化,需要的朋友可以参考下

本文的环境是Windows 10,MySQL版本是5.7.12-log

一、 基本使用

count的基本作用是有两个:

  • 统计某个列的数据的数量;
  • 统计结果集的行数;

用来获取满足条件的数据的数量。但是其中有一些与使用中印象不同的情况,比如当count作用一列、多列、以及使用*来表达整行产生的效果是不同的。

示例表如下:

CREATE TABLE `NewTable` (
`id` int(11) NULL DEFAULT NULL ,
`name` varchar(30) NULL DEFAULT NULL ,
`country` varchar(50) NULL DEFAULT NULL ,
`province` varchar(30) NULL DEFAULT NULL ,
`city` varchar(30) NULL DEFAULT NULL 
)ENGINE=InnoDB

这里写图片描述

1.1 不计算NULL的值

如果有NULL值,在返回的结果中会被过滤掉

select count(country) from person;

返回结果如下:

这里写图片描述

如果满足条件的数据项不存在,则结构返回0,经常通过这种方式判断是否有满足条件的数据存在;返回的数据类型是bigint。

1.2 对count(*)的处理

count(*)的处理是有点不同的,它会返回所有数据的数量,但是不会过滤其中的NULL值,它也并不是相当于展开成所有的列,而是直接会忽略所有的列而直接统计所有的行数。语句如下:

select count(*) from person;

返回结果如下:

这里写图片描述

当想要返回所有的数据的数量的时候,但是又不想包括全部是NULL的列,使用count(*)是不可能做到的,但是在1.1中说到count作用于列的时候会过滤NULL,那么直接这么写是不是对?

select count(id, `name`, country, province, city) from person;

那就错了,count只能作用于单列,不能作用于多列 ,所以上面的写法是错误的。

另外针对count(*)语句,在MyISAM存储引擎中做了优化,每个表的数据行数都会存储在存储引擎中,可以很快拿到;但是在事务性的存储引擎中,比如InnoDB中,因为会涉及到多个事务;

1.3 对count(distinct …)的处理

count(distinct …)会返回彼此不同但是非NULL的数据的行数。这一点和只使用distinct是有区别的,因为distinct是不过滤NULL值的,详见MySQL中distinct的使用方法 。

- 如果没有符合条件的数据则返回0;
- 该语句可以作用于多列,是当各个列之间有一个不同,就认为整行数据不同,与distinct作用于多列时效果相同;

select count(DISTINCT country) from person;

返回结果如下:

这里写图片描述

但是对于count(*)和count(distinct )两者的结合,如下:

select count(DISTINCT *) from person;

该语句是错误的,无法执行,因此与select count(DISTINCT *) from person 还是有区别的。

二、 性能优化

通常情况下,count(*)操作需要大量扫描数据表中的行,如果避免扫描大量的数据就成为优化该语句的关键所在。针对这个问题可以从如下两个角度考虑。

2.1 在数据库的层次上优化

2.1.1 针对count(*)

在MySQL内部已经针对count(*)进行了优化,使用explain查询如下:

EXPLAIN select count(*) from person;

这里写图片描述

从中可以看出该查询没有使用全表扫描也没有使用索引,甚至不需要查询数据表,在上面的示例数据库中得知,该库的存储引擎是InnoDB ,而且其中既没有主键也没有索引。

2.2 针对单个列进行count

查询如下:

EXPLAIN select count(country) from person where id > 2;

这里写图片描述

发现在没有主键和索引的情况下,对全表进行了扫描。在数据中避免大量扫描数据行,一个最直接的方法使用索引:

当对id设置为一般索引 :INDEX abc (id) USING BTREE 。

执行查询如下:

EXPLAIN select count(country) from person where id > 2;

结果如下:

这里写图片描述

此时发现并没有使用索引,仍然进行的是全表扫描,当执行如下时:

EXPLAIN select count(country) from person where id > 4;

结果如下:

这里写图片描述

这是使用了索引进行了范围查询,显然比上面的要好。

但是问题来了,为什么有时候使用索引,有时候不用索引?在上面的第一次查询中已经能够检测出可能的key但是并没有使用?如果有知道的大神给解读一下!

对id设置为主键,执行查询如下:

EXPLAIN select count(country) from person where id > 2;

结果如下:

这里写图片描述

2.2 在应用的层次上优化

在应用的层次上优化,可以考虑在系统架构中引入缓存子系统,比如在过去中常用的Memcached,或者现在非常流行的Redis, 但是这样会增加系统的复杂性。

mysql group by与聚合函数(sum,count等)实例

首先我们先来了解一下mysql聚合函数

mysql中一种特殊的函数:聚合函数,SUM, COUNT, MAX, MIN, AVG等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。例如:

SELECT SUM(score) FROM table

这个sql的意思是查询表table里面所有score列的总和。

接着我们通过一个实例来讲解group by语句中如何使用聚合函数。

book表如下:

id first_name last_name city
1 Jason Martin Toronto
2 Alison Mathews Vancouver
3 James Mathews Vancouver
4 Celia Rice Vancouver
5 David Larry New York

现在我们要对city进行分组查询,并获取每个分组有多少条数据,我们需要count聚合函数。

SELECT *,count(*) FROM book GROUP BY city

结果为:

id first_name last_name city count(*)
1 Jason Martin Toronto 1
2 Alison Mathews Vancouver 3
5 David Larry New York 1

先以city把返回记录分成多个组,这就是GROUP BY的字面含义。分完组后,然后用聚合函数对每组中的不同字段(一或多条记录)作运算。

相关文章

  • MySQL主从复制与读写分离原理及用法详解

    MySQL主从复制与读写分离原理及用法详解

    这篇文章主要介绍了MySQL主从复制与读写分离原理及用法,结合实例形式详细分析了mysql数据库主从复制、读写分离基本概念、原理、用法及操作注意事项,需要的朋友可以参考下
    2020-01-01
  • MySQL笔记之子查询使用介绍

    MySQL笔记之子查询使用介绍

    子查询是将一个查询语句嵌套在另一个查询语句中,内层查询语句的查询结果,可以为外层查询语句提供查询条件
    2013-05-05
  • 一文解决连接MySQL报错is not allowed to connect to this MySQL server

    一文解决连接MySQL报错is not allowed to connect to this MySQL 

    这篇文章主要给大家介绍了关于如何通过一文解决连接MySQL报错is not allowed to connect to this MySQL server的相关资料,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2023-08-08
  • Window10下安装 mysql5.7图文教程(解压版)

    Window10下安装 mysql5.7图文教程(解压版)

    这篇文章主要介绍了Window10下安装 mysql5.7图文教程(解压版),本文通过图文并茂的形式给大家介绍的非常详细,需要的朋友可以参考下
    2016-08-08
  • MySQL字符串前缀索引使用

    MySQL字符串前缀索引使用

    本文主要介绍了MySQL字符串前缀索引使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-02-02
  • MySQL自带慢日志排查慢查询SQL

    MySQL自带慢日志排查慢查询SQL

    昨天有一道笔试题是问mysql慢查询的,总结一下,下面这篇文章主要给大家介绍了关于MySQL如何利用自带慢日志排查慢查询SQL的相关资料,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2022-12-12
  • 图文介绍mysql中:=和=的区别

    图文介绍mysql中:=和=的区别

    这篇文章主要给大家介绍了关于mysql中:=和=区别的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用mysql具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-08-08
  • mysql 8.0.20 安装配置方法图文教程

    mysql 8.0.20 安装配置方法图文教程

    这篇文章主要为大家详细介绍了mysql 8.0.20 安装配置方法图文教程,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-05-05
  • MySQL在Linux系统中隐藏命令行中的密码的方法

    MySQL在Linux系统中隐藏命令行中的密码的方法

    这篇文章主要介绍了MySQL在Linux系统中隐藏命令行中的密码的方法,作者利用简单的C程序实现,需要的朋友可以参考下
    2015-06-06
  • Mysql中基本语句优化的十个原则小结

    Mysql中基本语句优化的十个原则小结

    这篇文章主要给大家总结介绍了Mysql中基本语句优化的十个原则,通过学习与记住它们,在构造sql时可以养成良好的习惯,文中介绍的相对比较详细与简单明了,需要的朋友们可以参考借鉴,下面来一起看看吧。
    2017-06-06

最新评论