解读MySql深分页的问题及优化方案

更新时间：2025年06月29日 14:32:32 作者：找不到、了

这篇文章主要介绍了MySql深分页的问题及优化,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

1、深分页

是对大型数据集进行分页查询时，尤其是当需要获取较后页的数据时，性能可能会受到影响。

传统的分页方法在数据量较大时，随着页数的增加，性能会迅速下降。

1.1. 传统分页

当数据进行查询的时候，需要进行以下过程：

SELECT * FROM table_name ORDER BY id LIMIT offset, size;

limit：控制每页返回的记录数（size）。
offset：跳过前多少条记录（offset）。

1.2. 问题原因

1、扫描大量数据：

MySQL需要跳过大量的数据行才能返回请求的数据。在数据量较大的表中，扫描的成本是巨大的，导致查询延迟增加。

2、锁竞争问题：

在使用OFFSET进行分页时，数据表的锁可能被频繁地获取和释放，尤其是在高并发的情况下，会导致锁竞争问题，进一步影响数据库的响应速度。

3、I/O瓶颈：

深分页查询会对I/O性能产生压力，因为每次查询都需要读取大量的磁盘数据，尤其是在使用MySQL的磁盘存储时，I/O操作会显著影响性能。

2、深分页的优化方案

2.1、索引介绍

在mysql中索引分为聚簇索引和非聚簇索引。

1、B+树索引的特点：

节点存储：B+树是一种自平衡的树结构，其中每个节点可以有多个子节点。
非叶子节点存储的是指向子节点的指针和分隔值，而叶子节点存储的是实际的数据记录或记录的指针。
顺序访问：叶子节点中的数据是按照索引列的顺序存储的，这使得范围查询非常高效。

2、聚簇索引和非聚簇索引：

聚簇索引（主键索引）的叶子节点直接存储行数据，而非聚簇索引（二级索引）的叶子节点存储的是主键值。

如下图所示：

2.2、优化方案分类

1. 基于主键游标的分页

1、原理：

通过记录上一页的最后一个值（如主键或排序字段），作为下一页的起点，避免offset。

2、适用场景：

数据有序且可唯一标识（如id或时间戳）。

3、实现步骤：

假设我们有一个users表，并且希望查询某一页的数据，传统的分页查询如下：

SELECT * FROM users ORDER BY id LIMIT 10 OFFSET 1000;


使用游标分页的查询如下：

SELECT * FROM users WHERE id > ? ORDER BY id LIMIT 10;

4、优点：

避免offset，直接定位到起始位置。查询效率稳定，不受页数影响。

5、缺点：

无法直接跳转到任意页。

需要业务层维护“游标”（如上一页最后一个记录的id）。

2. 延迟关联

1、原理：

先通过子查询获取主键，再通过主键关联原表获取完整数据。

2、适用场景：

需要关联多表或查询非主键字段的场景。

3、实现步骤：

-- 1. 先查询主键（使用覆盖索引）
SELECT id FROM table_name ORDER BY id LIMIT 99990, 10;

-- 2. 通过主键关联原表获取完整数据
SELECT t.* 
FROM table_name t 
JOIN (
    SELECT id FROM table_name ORDER BY id LIMIT 99990, 10
) AS tmp ON t.id = tmp.id;

4、优点：

减少扫描数据量，尤其是当主键字段有索引时。

5、缺点：

需要额外的子查询和 JOIN 操作。

3. 覆盖索引

1、原理：

创建包含查询所需字段的复合索引，避免回表操作。

2、适用场景：

查询字段较少且可被索引覆盖。

3、实现步骤：

-- 创建覆盖索引（假设按 id 排序）
CREATE INDEX idx_cover ON table_name (id, name, age);

-- 使用覆盖索引查询（无需回表）
SELECT id, name, age FROM table_name ORDER BY id LIMIT 100000, 10;

4、优点：

索引本身包含所需数据，减少 I/O。

5、缺点：

索引占用额外存储空间。

4. 分区表

1、原理：

将大表按规则（如按时间或范围）拆分为多个分区，查询时只扫描相关分区。

2、适用场景：

数据可按某种规则分区（如按时间）。

3、实现步骤：

1、按时间范围分区

按时间范围分区
CREATE TABLE orders (
    id BIGINT PRIMARY KEY,
    user_id INT,
    create_time DATETIME
)
PARTITION BY RANGE (YEAR(create_time)) (
    PARTITION p2022 VALUES LESS THAN (2023),
    PARTITION p2023 VALUES LESS THAN (2024),
    PARTITION p2024 VALUES LESS THAN (2025)
);


-- 查询2023年的订单，分页
SELECT * FROM orders 
WHERE create_time BETWEEN '2023-01-01' AND '2023-12-31'
ORDER BY create_time DESC 
LIMIT 1000000, 20;


优化效果：仅扫描 p2023 分区，避免全表扫描。

2、按 ID 范围分区

CREATE TABLE users (
    id BIGINT PRIMARY KEY,
    name VARCHAR(100)
)
PARTITION BY RANGE (id) (
    PARTITION p1 VALUES LESS THAN (1000000),
    PARTITION p2 VALUES LESS THAN (2000000),
    PARTITION p3 VALUES LESS THAN (MAXVALUE)
);


-- 查询 ID > 1000000 的用户，分页
SELECT * FROM users 
WHERE id > 1000000 
ORDER BY id 
LIMIT 20;

仅扫描 p2 和 p3 分区，跳过 p1。

4、优点：

显著减少扫描数据量。

5、缺点：

分区管理复杂，不适合频繁修改分区规则的场景。

5. 缓存机制

1、原理：

对频繁访问的分页结果进行缓存（如 Redis），减少数据库查询。

2、适用场景：

数据更新频率低，分页请求频繁。

3、实现步骤：

使用缓存中间件（如 Redis）存储分页结果。
对于冷数据或过深分页，直接返回缓存或提示用户跳转限制。

4、优点：

显著降低数据库压力。

5、缺点：

数据实时性要求高的场景不适用。

6. 业务层优化

1、限制最大页数：

如限制用户最多查看前 100 页。

2、滑动窗口分页：

允许用户通过“上一页/下一页”滑动访问，而非跳转到任意页。

3、预加载数据：

在用户浏览当前页时，预加载下一页数据。

性能对比

3、总结

深分页是 MySQL 处理大数据量时的常见性能瓶颈。优化的核心在于减少扫描数据量和避免 OFFSET 的全表扫描。

根据业务需求选择合适的方案：

优先推荐：游标分页或延迟关联（适合大多数场景）。
补充方案：覆盖索引、分区表或缓存机制（针对特定需求）。
业务层配合：限制分页深度或改用滑动窗口。

通过合理设计索引、查询语句和分页逻辑，可以显著提升深分页的性能，避免 MySQL 在大数据量下的性能退化。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

mysql导出表的字段和相关属性的步骤方法
在本篇文章里小编给大家分享了关于mysql导出表的字段和相关属性的步骤方法，有需要的朋友们跟着学习下。
2019-01-01
mysqld_exporter+Prometheus+Grafana 配置小结
本文主要介绍了mysqld_exporter+Prometheus+Grafana 配置,实现了对MySQL数据库的监控和可视化展示,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2025-05-05
MySQL比较运算符使用详解及注意事项
这篇文章主要给大家介绍了关于MySQL比较运算符使用详解及注意事项的相关资料,Mysql可以通过运算符来对表中数据进行运算,比如通过出生日期求年龄等,需要的朋友可以参考下
2024-01-01
MySQL中explain语句的基本使用教程
这篇文章主要给大家介绍了关于MySQL中explain语句的基本使用教程，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-03-03
MySQL数据库约束详解
mysql常见约束有：1、非空约束“not null”；2、唯一性约束“unique”；3、主键约束“primary key”；4、外键约束“foreign key”；5、默认值约束“Default”等等。
2022-10-10
MySQL定位长事务(Identify Long Transactions)的实现
在MySQL的运行中,经常会遇到一些长事务,本文主要介绍了MySQL定位长事务,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2024-09-09
MySQL业务数据量增长到单表成为瓶颈时的解决方案
文章详细介绍了MySQL在单表数据量增长到瓶颈时的解决方案,包括应急与优化、架构升级和终极解决方案,本文结合实例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧
2025-12-12
如何找到MySQL的binlog文件的存储位置
这篇文章主要介绍了如何找到MySQL的binlog文件的存储位置,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2025-07-07
MySQL AUTO_INCREMENT 主键自增长的实现
本文主要介绍了MySQL AUTO_INCREMENT 主键自增长的实现,每增加一条记录,主键会自动以相同的步长进行增长,具有一定的参考价值,感兴趣的可以了解一下
2023-11-11
MySQL8配置mysqldump逻辑备份的实现
mysqldump是MySQL自带的逻辑备份工具,通过生成SQL语句实现跨平台/版本的数据备份,下面就来介绍一下MySQL8配置mysqldump逻辑备份的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2026-03-03