解读MySql深分页的问题及优化方案

 更新时间:2025年06月29日 14:32:32   作者:找不到、了  
这篇文章主要介绍了MySql深分页的问题及优化,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

关于sql在mysql中的执行过程:Mysql中select查询语句的执行过程

如下图所示:

在 MySQL 中,深分页(Deep Pagination)是指当使用limit和offset进行分页查询时,随着offset值的增大,查询性能显著下降的现象。

例如,查询第 10000 页(每页 10 条数据)时,offset为 99990,MySQL 需要扫描前面 99990 行才能找到目标数据,导致性能瓶颈。

1、深分页

是对大型数据集进行分页查询时,尤其是当需要获取较后页的数据时,性能可能会受到影响。

传统的分页方法在数据量较大时,随着页数的增加,性能会迅速下降。

1.1. 传统分页

当数据进行查询的时候,需要进行以下过程:

SELECT * FROM table_name ORDER BY id LIMIT offset, size;
  • limit:控制每页返回的记录数(size)。
  • offset:跳过前多少条记录(offset)。

1.2. 问题原因

1、扫描大量数据:

MySQL需要跳过大量的数据行才能返回请求的数据。在数据量较大的表中,扫描的成本是巨大的,导致查询延迟增加。

2、锁竞争问题:

在使用OFFSET进行分页时,数据表的锁可能被频繁地获取和释放,尤其是在高并发的情况下,会导致锁竞争问题,进一步影响数据库的响应速度。

3、I/O瓶颈:

深分页查询会对I/O性能产生压力,因为每次查询都需要读取大量的磁盘数据,尤其是在使用MySQL的磁盘存储时,I/O操作会显著影响性能。

2、深分页的优化方案

2.1、索引介绍

在mysql中索引分为聚簇索引非聚簇索引

1、B+树索引的特点:

  • 节点存储:B+树是一种自平衡的树结构,其中每个节点可以有多个子节点。
  • 非叶子节点存储的是指向子节点的指针和分隔值,而叶子节点存储的是实际的数据记录或记录的指针。
  • 顺序访问:叶子节点中的数据是按照索引列的顺序存储的,这使得范围查询非常高效。

2、聚簇索引和非聚簇索引:

聚簇索引(主键索引)的叶子节点直接存储行数据,而非聚簇索引(二级索引)的叶子节点存储的是主键值。

如下图所示:

2.2、优化方案分类

1. 基于主键游标的分页

1、原理

通过记录上一页的最后一个值(如主键或排序字段),作为下一页的起点,避免offset。

2、适用场景

数据有序且可唯一标识(如id或时间戳)。

3、实现步骤

假设我们有一个users表,并且希望查询某一页的数据,传统的分页查询如下:

SELECT * FROM users ORDER BY id LIMIT 10 OFFSET 1000;


使用游标分页的查询如下:

SELECT * FROM users WHERE id > ? ORDER BY id LIMIT 10;

4、优点

避免offset,直接定位到起始位置。查询效率稳定,不受页数影响。

5、缺点

无法直接跳转到任意页。

需要业务层维护“游标”(如上一页最后一个记录的id)。

2. 延迟关联

1、原理

先通过子查询获取主键,再通过主键关联原表获取完整数据。

2、适用场景

需要关联多表或查询非主键字段的场景。

3、实现步骤

-- 1. 先查询主键(使用覆盖索引)
SELECT id FROM table_name ORDER BY id LIMIT 99990, 10;

-- 2. 通过主键关联原表获取完整数据
SELECT t.* 
FROM table_name t 
JOIN (
    SELECT id FROM table_name ORDER BY id LIMIT 99990, 10
) AS tmp ON t.id = tmp.id;

4、优点

减少扫描数据量,尤其是当主键字段有索引时。

5、缺点

需要额外的子查询和 JOIN 操作。

3. 覆盖索引

1、原理

创建包含查询所需字段的复合索引,避免回表操作。

2、适用场景

查询字段较少且可被索引覆盖。

3、实现步骤

-- 创建覆盖索引(假设按 id 排序)
CREATE INDEX idx_cover ON table_name (id, name, age);

-- 使用覆盖索引查询(无需回表)
SELECT id, name, age FROM table_name ORDER BY id LIMIT 100000, 10;

4、优点

索引本身包含所需数据,减少 I/O。

5、缺点

索引占用额外存储空间。

4. 分区表

1、原理

将大表按规则(如按时间或范围)拆分为多个分区,查询时只扫描相关分区。

2、适用场景

数据可按某种规则分区(如按时间)。

3、实现步骤

1、按时间范围分区

按时间范围分区
CREATE TABLE orders (
    id BIGINT PRIMARY KEY,
    user_id INT,
    create_time DATETIME
)
PARTITION BY RANGE (YEAR(create_time)) (
    PARTITION p2022 VALUES LESS THAN (2023),
    PARTITION p2023 VALUES LESS THAN (2024),
    PARTITION p2024 VALUES LESS THAN (2025)
);


-- 查询2023年的订单,分页
SELECT * FROM orders 
WHERE create_time BETWEEN '2023-01-01' AND '2023-12-31'
ORDER BY create_time DESC 
LIMIT 1000000, 20;


优化效果:仅扫描 p2023 分区,避免全表扫描。

2、按 ID 范围分区

CREATE TABLE users (
    id BIGINT PRIMARY KEY,
    name VARCHAR(100)
)
PARTITION BY RANGE (id) (
    PARTITION p1 VALUES LESS THAN (1000000),
    PARTITION p2 VALUES LESS THAN (2000000),
    PARTITION p3 VALUES LESS THAN (MAXVALUE)
);


-- 查询 ID > 1000000 的用户,分页
SELECT * FROM users 
WHERE id > 1000000 
ORDER BY id 
LIMIT 20;

仅扫描 p2 和 p3 分区,跳过 p1。

4、优点

显著减少扫描数据量。

5、缺点

分区管理复杂,不适合频繁修改分区规则的场景。

5. 缓存机制

1、原理

对频繁访问的分页结果进行缓存(如 Redis),减少数据库查询。

2、适用场景

数据更新频率低,分页请求频繁。

3、实现步骤

  • 使用缓存中间件(如 Redis)存储分页结果。
  • 对于冷数据或过深分页,直接返回缓存或提示用户跳转限制。

4、优点

显著降低数据库压力。

5、缺点

数据实时性要求高的场景不适用。

6. 业务层优化

1、限制最大页数

如限制用户最多查看前 100 页。

2、滑动窗口分页

允许用户通过“上一页/下一页”滑动访问,而非跳转到任意页。

3、预加载数据

在用户浏览当前页时,预加载下一页数据。

性能对比

3、总结

深分页是 MySQL 处理大数据量时的常见性能瓶颈。优化的核心在于减少扫描数据量避免 OFFSET 的全表扫描

根据业务需求选择合适的方案:

  • 优先推荐:游标分页或延迟关联(适合大多数场景)。
  • 补充方案:覆盖索引、分区表或缓存机制(针对特定需求)。
  • 业务层配合:限制分页深度或改用滑动窗口。

通过合理设计索引、查询语句和分页逻辑,可以显著提升深分页的性能,避免 MySQL 在大数据量下的性能退化。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • MySQL事务的基础学习以及心得分享

    MySQL事务的基础学习以及心得分享

    本篇内容是关于MySQL事务的基础知识学习内容,并把学习中网友的心得做了总结,分享给大家,一起学习参考下吧。
    2017-12-12
  • sql跨表查询的三种方案总结

    sql跨表查询的三种方案总结

    这篇文章主要介绍了sql跨表查询的三种方案总结,文章围绕主题展开详细的内容,具有一定的参考价值,需要的小伙伴可以参考一下,希望对你的学习有所帮助
    2022-08-08
  • 深入mysql主从复制延迟问题的详解

    深入mysql主从复制延迟问题的详解

    本篇文章是对mysql中主从复制延迟的问题进行了详细的分析介绍,需要的朋友参考下
    2013-06-06
  • 简析mysql字符集导致恢复数据库报错问题

    简析mysql字符集导致恢复数据库报错问题

    这篇文章主要介绍了简析mysql字符集导致恢复数据库报错问题,具有一定参考价值,需要的朋友可以了解。
    2017-10-10
  • 详解Mysql中保证缓存与数据库的双写一致性

    详解Mysql中保证缓存与数据库的双写一致性

    在一些高并发场景下,为了提升系统的性能,我们通常会将数据存储在 Redis 缓存中,并通过 Redis 缓存来提高系统的读取速度,这篇文章主要介绍了详解Mysql中保证缓存与数据库的双写一致性,需要的朋友可以参考下
    2024-03-03
  • MySQL常用判断函数小结

    MySQL常用判断函数小结

    本文带大家一起来看一看MySQL中都有哪些常用的控制流函数,以及控制流函数的使用场景都有哪些,非常具有实用价值,需要的朋友可以参考下
    2023-05-05
  • Ubuntu搭建Mysql+Keepalived高可用的实现(双主热备)

    Ubuntu搭建Mysql+Keepalived高可用的实现(双主热备)

    本文主要介绍了Ubuntu搭建Mysql+Keepalived高可用的实现(双主热备),文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-11-11
  • 用Jena将本体文件存入MySQL数据库的实现方法

    用Jena将本体文件存入MySQL数据库的实现方法

    以下的文章主要介绍的是使用Jena,将本体文件存入MySQL数据库的实际操作步骤
    2010-06-06
  • CentOS 5.5下安装MySQL 5.5全过程分享

    CentOS 5.5下安装MySQL 5.5全过程分享

    网络上有很多相关的安装笔记,但是并不详尽,或是编译环境稍有不同,过程就会有差异,所以我总结了已有的经验和我自己安装过程中的体验,扩充并详尽地记录了整个过程。我选择安装的是MySQL5.5.27版本。以下是我的安装笔记
    2012-09-09
  • 使用LEFT JOIN 统计左右存在的数据问题

    使用LEFT JOIN 统计左右存在的数据问题

    最近做了一个数据模块的统计,统计企业收款、发票相关的数据,开始统计是比较简单,后面再拆分账套统计就有点小复杂,这篇文章主要介绍了使用LEFT JOIN 统计左右存在的数据,需要的朋友可以参考下
    2022-10-10

最新评论