为什么说MySQL单表数据不要超过500万行

 更新时间:2019年06月26日 09:10:17   作者:qianfeng_dashuju  
在本篇文章里小编给大家整理了一篇关于为什么说MySQL单表数据不要超过500万行的相关内容,有兴趣的朋友们阅读下吧。

今天,探讨一个有趣的话题:MySQL 单表数据达到多少时才需要考虑分库分表?有人说 2000 万行,也有人说 500 万行。那么,你觉得这个数值多少才合适呢?

曾经在中国互联网技术圈广为流传着这么一个说法:MySQL 单表数据量大于 2000 万行,性能会明显下降。事实上,这个传闻据说最早起源于百度。具体情况大概是这样的,当年的 DBA 测试 MySQL性能时发现,当单表的量在 2000 万行量级的时候,SQL 操作的性能急剧下降,因此,结论由此而来。然后又据说百度的工程师流动到业界的其它公司,也带去了这个信息,所以,就在业界流传开这么一个说法。

再后来,阿里巴巴《Java 开发手册》提出单表行数超过 500 万行或者单表容量超过 2GB,才推荐进行分库分表。对此,有阿里的黄金铁律支撑,所以,很多人设计大数据存储时,多会以此为标准,进行分表操作。

那么,你觉得这个数值多少才合适呢?为什么不是 300 万行,或者是 800 万行,而是 500 万行?也许你会说这个可能就是阿里的最佳实战的数值吧?那么,问题又来了,这个数值是如何评估出来的呢?稍等片刻,请你小小思考一会儿。

事实上,这个数值和实际记录的条数无关,而与 MySQL 的配置以及机器的硬件有关。因为,MySQL 为了提高性能,会将表的索引装载到内存中。InnoDB buffer size 足够的情况下,其能完成全加载进内存,查询不会有问题。但是,当单表数据库到达某个量级的上限时,导致内存无法存储其索引,使得之后的 SQL 查询会产生磁盘 IO,从而导致性能下降。当然,这个还有具体的表结构的设计有关,最终导致的问题都是内存限制。这里,增加硬件配置,可能会带来立竿见影的性能提升哈。

那么,我对于分库分表的观点是,需要结合实际需求,不宜过度设计,在项目一开始不采用分库与分表设计,而是随着业务的增长,在无法继续优化的情况下,再考虑分库与分表提高系统的性能。对此,阿里巴巴《Java 开发手册》补充到:如果预计三年后的数据量根本达不到这个级别,请不要在创建表时就分库分表。那么,回到一开始的问题,你觉得这个数值多少才合适呢?我的建议是,根据自身的机器的情况综合评估,如果心里没有标准,那么暂时以 500 万行作为一个统一的标准,相对而言算是一个比较折中的数值。

我们再来看一下关于SQL书写的一些注意点,会给大家带来帮助

sql的编写需要注意优化

  • 使用limit对查询结果的记录进行限定
  • 避免select *,将需要查找的字段列出来
  • 使用连接(join)来代替子查询
  • 拆分大的delete或insert语句
  • 可通过开启慢查询日志来找出较慢的SQL
  • 不做列运算:SELECT id WHERE age + 1 = 10,任何对列的操作都将导致表扫描,它包括数据库教程函数、计算表达式等等,查询时要尽可能将操作移至等号右边
  • sql语句尽可能简单:一条sql只能在一个cpu运算;大语句拆小语句,减少锁时间;一条大sql可以堵死整个库
  • OR改写成IN:OR的效率是n级别,IN的效率是log(n)级别,in的个数建议控制在200以内
  • 不用函数和触发器,在应用程序实现
  • 避免%xxx式查询
  • 少用JOIN
  • 使用同类型进行比较,比如用'123'和'123'比,123和123比
  • 尽量避免在WHERE子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描
  • 对于连续数值,使用BETWEEN不用IN:SELECT id FROM t WHERE num BETWEEN 1 AND 5
  • 列表数据不要拿全表,要使用LIMIT来分页,每页数量也不要太大

相关文章

  • MySQL性能突然下降的原因

    MySQL性能突然下降的原因

    这篇文章主要介绍了MySQL性能突然下降的原因,帮助大家更好的了解和维护数据库,感兴趣的朋友可以了解下
    2020-10-10
  • mysql建表常用sql语句个人经验分享

    mysql建表常用sql语句个人经验分享

    熟悉一些常用的建表语句可以提升你建表的速度效率,本文整理了一些,个人感觉还不错,希望对大家有所帮助
    2014-01-01
  • 在MySQL中修改密码及访问限制的设置方法详解

    在MySQL中修改密码及访问限制的设置方法详解

    MySQL是一个真正的多用户、多线程SQL数据库服务器。MySQL是以一个客户机/服务器结构的实现,它由一个服务器守护程序mysqld和很多不同的客户程序和库组成。
    2007-03-03
  • Navicat配置mysql数据库用户权限问题

    Navicat配置mysql数据库用户权限问题

    这篇文章主要介绍了Navicat配置mysql数据库用户权限问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-03-03
  • windows10安装mysql5.7.17教程

    windows10安装mysql5.7.17教程

    windows10安装mysql5.7.17是这样安装的吗?这篇文章主要为大家详细介绍了win10下mysql5.7.17安装配置方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-01-01
  • 如何正确、安全地关闭MySQL

    如何正确、安全地关闭MySQL

    当需要停止或关闭MySQL实例时,很多人并不清楚如何做到正确、安全地关闭MySQL,会对数据的安全性和稳定性造成很大的威胁,本文将从多个方面详细阐述如何正确关闭MySQL,包括关闭MySQL的基本方法、关闭MySQL前的准备工作、优雅地关闭MySQL以及遇到MySQL无法正常关闭的情况
    2023-09-09
  • Mysql分区表的管理与维护

    Mysql分区表的管理与维护

    改变一个表的分区方案只需使用alter table 加 partition_options 子句就可以了。这篇文章主要介绍了Mysql分区表的管理与维护,非常不错,感兴趣的朋友一起学习吧,需要的朋友可以参考下
    2016-08-08
  • 如何查看连接MYSQL数据库的IP信息

    如何查看连接MYSQL数据库的IP信息

    这篇文章介绍了三种查看连接MYSQL数据库的IP信息方法,方法简单实用,需要的朋友可以参考下
    2015-07-07
  • mysql中int(3)和int(10)的数值范围是否相同

    mysql中int(3)和int(10)的数值范围是否相同

    依稀还记得有次面试,有面试官问我int(10)与int(11)有什么区别,当时觉得就是长度的区别吧,后来发现事情不是这么简单,这篇文章主要给大家介绍了关于mysql中int(3)和int(10)的数值范围是否相同的相关资料
    2021-10-10
  • MongoDB日期查询操作图文详解

    MongoDB日期查询操作图文详解

    MongoDB中按日期查询是一种常见的查询操作,而按日期查询也是开发人员在MongoDB工作中最常遇到的查询任务之一,这篇文章主要给大家介绍了关于MongoDB日期查询操作的相关资料,需要的朋友可以参考下
    2024-02-02

最新评论