MySQL百万数据深度分页优化思路解析

 更新时间:2023年05月10日 14:31:58   作者:一个程序员的成长  
这篇文章主要为大家介绍了MySQL百万数据深度分页优化思路分析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

业务场景

一般在项目开发中会有很多的统计数据需要进行上报分析,一般在分析过后会在后台展示出来给运营和产品进行分页查看,最常见的一种就是根据日期进行筛选。这种统计数据随着时间的推移数据量会慢慢的变大,达到百万、千万条数据只是时间问题。

瓶颈再现

创建了一张user表,给create_time字段添加了索引。并在该表中添加了100w条数据。

我们这里使用limit分页的方式查询下前5条数据和后5条数据在查询时间上有什么区别。

查询前10条基本上不消耗什么时间

我们从第50w+开始取数据的时候,查询耗时1秒。

SQL_NO_CACHE
这个关键词是为了不让SQL查询走缓存。

同样的SQL语句,不同的分页条件,两者的性能差距如此之大,那么随着数据量的增长,往后页的查询所耗时间按理会越来越大。

问题分析

回表

我们一般对于查询频率比较高的字段会建立索引。索引会提高我们的查询效率。我们上面的语句使用了SELECT * FROM user,但是我们并不是所有的字段都建立了索引。当从索引文件中查询到符合条件的数据后,还需要从数据文件中查询到没有建立索引的字段。那么这个过程称之为回表。

覆盖索引

如果查询的字段正好创建了索引了,比如 SELECT create_time FROM user,我们查询的字段是我们创建的索引,那么这个时候就不需要再去数据文件里面查询,也就不需要回表。这种情况我们称之为覆盖索引。

IO

回表操作通常是IO操作,因为需要根据索引查找到数据行后,再根据数据行的主键或唯一索引去聚簇索引中查找具体的数据行。聚簇索引一般是存储在磁盘上的数据文件,因此在执行回表操作时需要从磁盘读取数据,而磁盘IO是相对较慢的操作。

LIMTI 2000,10 ?

你有木有想过LIMIT 2000,10会不会扫描1-2000行,你之前有没有跟我一样,觉得数据是直接从2000行开始取的,前面的根本没扫描或者不回表。其实这样的写法,一个完整的流程是查询数据,如果不能覆盖索引,那么也是要回表查询数据的。

现在你知道为什么越到后面查询越慢了吧!

问题总结

我们现在知道了LIMIT 遇到后面查询的性能越差,性能差的原因是因为要回表,既然已经找到了问题那么我们只需要减少回表的次数就可以提升查询性能了。

解决方案

既然覆盖索引可以防止数据回表,那么我们可以先查出来主键id(主键索引),然后将查出来的数据作为临时表然后 JOIN 原表就可以了,这样只需要对查询出来的5条结果进行数据回表,大幅减少了IO操作。

优化前后性能对比

我们看下执行效果:

优化前:1.4s

优化后:0.2s

查询耗时性能大幅提升。这样如果分页数据很大的话,也不会像普通的limit查询那样慢。

以上就是MySQL百万数据深度分页优化思路分析的详细内容,更多关于MySQL数据分页优化的资料请关注脚本之家其它相关文章!

相关文章

  • MySQL 8.0 对 limit 的优化技巧

    MySQL 8.0 对 limit 的优化技巧

    从不同版本的 MySQL 发展轨迹来看 MySQL 的优化器越来越智能 (比如大家期待已久的直方图特性) ,能更多的减少人为干预,提升执行计划的准确性,这篇文章主要介绍了MySQL 8.0 对 limit 的优化,需要的朋友可以参考下
    2022-10-10
  • MySQL创建用户与授权及撤销用户权限方法

    MySQL创建用户与授权及撤销用户权限方法

    这篇文章主要介绍了MySQL创建用户并授权及撤销用户权限、设置与更改用户密码、删除用户等等,需要的朋友可以参考下
    2014-08-08
  • 关于MySQL查询语句的优化详解

    关于MySQL查询语句的优化详解

    这篇文章主要介绍了MySQL查询语句的优化方法,分别介绍了子查询优化,分页查询优化以及排序查询优化,对学习有一定的帮助,需要的小伙伴可以参考一下
    2023-04-04
  • Ubuntu自启动Mysql的三种方式

    Ubuntu自启动Mysql的三种方式

    本文给大家介绍ubuntu自启动mysql的三种方式,一种方法通过执行命令,也是最简单的方法,第二种方法是使用sysv-rc-cont工具,第三种方法是使用chkconfig工具,关于以上三种方式的详解请看下文
    2015-10-10
  • MySQL数据库恢复(使用mysqlbinlog命令)

    MySQL数据库恢复(使用mysqlbinlog命令)

    binlog是通过记录二进制文件方式来备份数据,然后在从二进制文件将数据恢复到某一时段或某一操作点。
    2011-08-08
  • MySQL对数据库数据进行复制的基本过程详解

    MySQL对数据库数据进行复制的基本过程详解

    这篇文章主要介绍了MySQL对数据库数据进行复制的基本过程,解读了Slave的一些相关配置,需要的朋友可以参考下
    2015-11-11
  • MYSQL表优化方法小结 讲的挺全面

    MYSQL表优化方法小结 讲的挺全面

    一篇MYSQL表优化的文章,说的很好,使用mysql的朋友可以参考下。
    2010-05-05
  • MySQL中存储的数据查询的时候如何区分大小写

    MySQL中存储的数据查询的时候如何区分大小写

    这篇文章主要介绍了MySQL中存储的数据查询的时候如何区分大小写问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-04-04
  • MySQL允许远程连接的配置指南

    MySQL允许远程连接的配置指南

    MySQL 是一个广泛使用的开源关系型数据库管理系统,在实际开发中,我们经常需要从本地或外部服务器连接到 MySQL 数据库,下面我们就来看看如何配置 MySQL 以允许远程连接
    2025-06-06
  • 定位和优化mysql慢查询的常见方法分享

    定位和优化mysql慢查询的常见方法分享

    MySQL中的慢查询(Slow Query)指执行时间超过指定阈值的查询语句,默认阈值是long_query_time参数设置的秒值,MySQL有几种常见的方法可以发现和获取慢查询,接下来小编将给大家详细的介绍一下这些方法,需要的朋友可以参考下
    2023-08-08

最新评论