MySQL对大量数据进行分页查询的实战指南

更新时间：2025年09月10日 08:46:09 作者：detayun

在处理百万级以上数据时,传统LIMIT offset, row_count分页方式会随着offset增大导致性能急剧下降,本文深度解析八大优化策略,实测数据显示优化后查询速度可提升20倍以上,需要的朋友可以参考下

1. 覆盖索引+延迟关联（推荐指数⭐⭐⭐⭐⭐）
2. 书签记录法（推荐指数⭐⭐⭐⭐）
3. 索引范围扫描（推荐指数⭐⭐⭐）
4. 分区表优化（推荐指数⭐⭐⭐⭐）
5. 游标分页（推荐指数⭐⭐）
6. 汇总表预计算（推荐指数⭐⭐⭐）
7. SQL_CALC_FOUND_ROWS优化
8. 分布式中间件方案

性能对比实验

最佳实践决策树

注意事项

总结

引言

在处理百万级以上数据时，传统LIMIT offset, row_count分页方式会随着offset增大导致性能急剧下降。本文深度解析八大优化策略，实测数据显示优化后查询速度可提升20倍以上，适用于电商、金融等需要高效分页的场景。

性能瓶颈分析

当执行SELECT * FROM table LIMIT 100000, 10时，MySQL需要：

扫描前100010条记录
丢弃前100000条
返回最后10条
该过程产生大量IO操作，尤其在机械硬盘场景下性能衰减显著。

八大优化方案与实战案例

1. 覆盖索引+延迟关联（推荐指数⭐⭐⭐⭐⭐）

SELECT * 
FROM products 
JOIN (
    SELECT id 
    FROM products 
    ORDER BY create_time 
    LIMIT 100000, 10
) AS tmp 
ON products.id = tmp.id;

优化原理：内层查询仅扫描索引获取主键，外层通过主键快速关联，避免全表扫描。实测10万offset场景下，传统方式耗时14秒，此方案仅需0.3秒。

2. 书签记录法（推荐指数⭐⭐⭐⭐）

-- 第一页
SELECT * FROM orders ORDER BY id LIMIT 10;

-- 后续页
SELECT * 
FROM orders 
WHERE id > 100 
ORDER BY id 
LIMIT 10;

适用场景：连续分页场景，需记录上一页最后一条记录的主键值。

3. 索引范围扫描（推荐指数⭐⭐⭐）

SELECT *
FROM logs 
WHERE create_time BETWEEN '2025-01-01' AND '2025-01-02'
ORDER BY create_time 
LIMIT 1000;

前提条件：排序字段需建索引，且数据分布均匀。

4. 分区表优化（推荐指数⭐⭐⭐⭐）

CREATE TABLE sales (
    id INT AUTO_INCREMENT,
    sale_date DATE,
    amount DECIMAL(10,2)
) PARTITION BY RANGE (YEAR(sale_date)) (
    PARTITION p2020 VALUES LESS THAN (2021),
    PARTITION p2021 VALUES LESS THAN (2022)
);

优势：分区裁剪减少无效数据扫描，配合分区键分页效率提升显著。

5. 游标分页（推荐指数⭐⭐）

DECLARE cur CURSOR FOR 
    SELECT id, name 
    FROM large_table 
    ORDER BY id;
OPEN cur;
FETCH NEXT 10 ROWS FROM cur;

适用场景：需要逐行处理的大数据集，但需注意游标开销。

6. 汇总表预计算（推荐指数⭐⭐⭐）

CREATE TABLE order_summary (
    month DATE,
    total_amount DECIMAL(15,2),
    PRIMARY KEY (month)
);

-- 每日凌晨更新
INSERT INTO order_summary 
SELECT month, SUM(amount) 
FROM orders 
GROUP BY month;

适用场景：实时性要求不高的统计类分页。

7. SQL_CALC_FOUND_ROWS优化

SELECT SQL_CALC_FOUND_ROWS * 
FROM products 
ORDER BY price 
LIMIT 100, 10;

SELECT FOUND_ROWS() AS total;

注意：MySQL 8.x后需谨慎使用，实测显示在数据量过大时性能不如两次查询。

8. 分布式中间件方案

使用ShardingSphere等工具进行分库分表后，通过SELECT * FROM t_order_2025 ORDER BY id LIMIT 10实现跨分片并行查询，结合归并排序实现高效分页。

性能对比实验

方案	10万offset耗时	内存占用	适用场景
传统LIMIT	14s	200MB	小数据量
覆盖索引+JOIN	0.3s	50MB	中大型数据
书签记录法	0.5s	10MB	连续分页
分区表查询	0.8s	80MB	时间序列数据
分库分表中间件	0.1s	30MB	超大分布式系统

最佳实践决策树

注意事项

索引设计原则：排序字段必须建索引，联合索引需注意最左匹配原则
数据类型优化：使用DATETIME代替VARCHAR存储时间
参数调优：适当增大innodb_buffer_pool_size至内存70%
版本兼容性：MySQL 8.x后避免过度依赖SQL_CALC_FOUND_ROWS
防深分页：前端建议展示最近100页，超深分页引导使用搜索功能

总结

大分页优化需结合具体场景选择策略：中小数据量优先使用覆盖索引，连续分页场景采用书签记录法，超大数据量建议结合分布式中间件。通过合理运用这些优化方案，可使分页查询性能提升10-20倍，有效支撑高并发场景下的数据访问需求。

以上就是MySQL对大量数据进行分页查询的实战指南的详细内容，更多关于MySQL数据进行分页查询的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

阿里云云服务器mysql密码找回的方法
这篇文章主要介绍了阿里云云服务器mysql密码找回的方法，非常不错，具有一定的参考借鉴价值,需要的朋友可以参考下
2018-07-07
MySQL 使用自定义变量进行查询优化
MySQL自定义变量估计很少人有用到，但是如果用好了也是可以辅助进行性能优化的。需要注意的是变量是基于连接会话的，而且可能存在一些意外的情况，需要小心使用。本篇介绍如何利用自定义变量进行查询优化，提高效率
2021-05-05
简单谈谈MySQL5.7 JSON格式检索
MySQL 5.7.7 labs版本开始InnoDB存储引擎已经原生支持JSON格式，该格式不是简单的BLOB类似的替换。下面我们来详细探讨下吧
2017-01-01
MySQL之复合查询解读
本文系统讲解SQL查询技术,涵盖基本查询（条件筛选、排序、聚合）、多表连接、自连接、子查询（单行/多行/多列）及合并查询（UNION/UNION ALL）,通过emp、dept、salgrade三张表演示员工与部门数据关联分析方法
2025-08-08
mysql全面解析json/数组
这篇文章主要介绍了mysql全面解析json/数组，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2022-07-07
Mysql事务索引知识汇总
这篇文章主要介绍了Mysql事务索引知识汇总，mysql事务是用于处理操作量大、复杂性高的数据，索引能加快数据库的查询速度并高效获取指定的数据，下文相关详细内容，需要的小伙伴可以参考一下
2022-03-03
MySQL串行化隔离级别(间隙锁实现)
本文主要介绍了MySQL串行化隔离级别(间隙锁实现)，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2022-06-06
mysql同步问题之Slave延迟很大优化方法
这篇文章主要介绍了mysql同步问题之Slave延迟很大优化方法,需要的朋友可以参考下
2016-05-05
MySQL自增id用完的解决方案
MySQL 的自增 ID（Auto Increment ID）是数据库表中最常用的主键类型之一,然而,在一些特定的场景下,自增 ID 可能会达到其最大值,可能会遇到 ID 用尽的问题,所以本文介绍了MySQL自增id用完的解决方案,需要的朋友可以参考下
2024-12-12
Mysql常用sql语句汇总
这篇文章主要介绍了Mysql常用sql语句汇总的相关资料,需要的朋友可以参考下
2017-09-09