MySQL分表实现上百万上千万记录分布存储的批量查询设计模式详解

 更新时间:2013年06月19日 14:41:08   作者:  
本篇文章是对使用MySQL分表实现上百万上千万记录分布存储的批量查询设计模式进行了详细的分析介绍,需要的朋友参考下

我们知道可以将一个海量记录的 MySQL 大表根据主键、时间字段,条件字段等分成若干个表甚至保存在若干服务器中。
唯一的问题就是跨服务器批量查询麻烦,只能通过应用程序来解决。谈谈在Java中的解决思路。其他语言原理类似。
这里说的分表不是 MySQL 5.1 的 partition,而是人为把一个表分开存在若干表或不同的服务器。
1. 应用程序级别实现
见示意图

electThreadManager 分表数据查询管理器
它为分表的每个database or server 建立一个 thread pool
addTask() - 添加任务
stopTask() - 停止任务
getResult() - 获取执行结果
最快的执行时间 = 最慢的 MySQL 节点查询消耗时间
最慢的执行时间 = 超时时间
某个 ThreadPool 忙时候处理流程
1. 假如 ThreadPoolN 非常忙,(也意味 DB N 非常忙);
2. 新的查询任务到来,addTask(), 新的任务的一个thread加到ThreadPoolN任务排队中
3. 外层应用已经获得其他 thread 返回结果,继续等待
4. 外层应用等待超时的时间到,调用 stopTask() 设置该任务全部 thread 中的停止标志, 外层应用返回。
5. 若干时间后,ThreadPoolN取到该排队 Thread, 因为设置了停止位,线程直接运行完成。
2. JDBC 层实现
做一个 JDBC Driver 的包装,拦截 PreparedStatement, Statement 的 executeQuery()
然后调用 SelectThreadManager 完成
3. MySQL partition
MySQL 5.1 的 partition 功能由于单张表的数据跨文件,批量查询时候同样存在上述问题,不过它是在 MySQL 内部实现的,不需要外部调用者关心。其查询实现的原理应该大致类似。
但 partition 只解决了 IO 的瓶颈,并不能解决 CPU 计算的瓶颈,因此无法代替传统的手工分表方式。

相关文章

  • 为什么mysql字段要使用NOT NULL

    为什么mysql字段要使用NOT NULL

    数据库字段一定要设置为 not null,不然会有很大的bug,下面就一起来介绍一下,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-05-05
  • MySQL大小写敏感的注意事项

    MySQL大小写敏感的注意事项

    MySQL 在 Windows 下不区分大小写,但在 Linux 下默认是区分大小写。如果你稍加不注意就会出现在本机开发的程序运行一切正常,发布到服务器行就出现表名找不到的问题,一头雾水。
    2021-05-05
  • 使用mss2sql工具将SqlServer转换为Mysql全记录

    使用mss2sql工具将SqlServer转换为Mysql全记录

    上篇文章我们讲诉了在mssql数据转换成mysql数据中,用Navicat Premium导入数据很完美,但是创建表的时候数据类型转换不是很完美,本文我们来讲诉下用mss2sql工具来创建表,顺便说下导入数据
    2014-08-08
  • Mac系统下MySql下载MySQL5.7及详细安装图解

    Mac系统下MySql下载MySQL5.7及详细安装图解

    这篇文章主要介绍了Mac系统下MySql下载MySQL5.7及详细安装图解,本文图文并茂给大家介绍的非常详细,需要的朋友可以参考下
    2017-11-11
  • MySQL创建数据库和创建数据表

    MySQL创建数据库和创建数据表

    MySQL 是最常用的数据库,在数据库操作中,基本都是增删改查操作,简称CRUD。但是,这篇文章主要介绍了数据库和数据表如何创建,想详细了解的小伙伴可以参考阅读一下
    2023-03-03
  • MYSQL基础之连接MYSQL、修改密码、添加用户

    MYSQL基础之连接MYSQL、修改密码、添加用户

    在这篇文章中我们就从连接MYSQL、修改密码、增加用户等方面来学习一些MYSQL的常用命令。
    2008-08-08
  • 一些mysql启动参数的说明和优化方法

    一些mysql启动参数的说明和优化方法

    要求MySQL能有的连接数量。当主要MySQL线程在一个很短时间内得到非常多的连接请求,这就起作用,然后主线程花些时间(尽管很短)检查连接并且启动一个新线程。
    2011-04-04
  • Windows server 2008 r2上安装MySQL5.7.10步骤

    Windows server 2008 r2上安装MySQL5.7.10步骤

    这篇文章主要介绍了Windows server 2008 r2上安装MySQL5.7.10的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-01-01
  • Mysql数据库中datetime、bigint、timestamp来表示时间选择,谁来存储时间效率最高

    Mysql数据库中datetime、bigint、timestamp来表示时间选择,谁来存储时间效率最高

    这篇文章主要介绍了Mysql数据库中datetime、bigint、timestamp来表示时间选择,谁来存储时间效率最高,针对这一问题每人回答方式各不相同,下面分享下我的个人想法,需要的朋友可以参考下
    2021-08-08
  • mysql group_concat()函数用法总结

    mysql group_concat()函数用法总结

    这篇文章主要介绍了mysql group_concat()函数用法,结合实例形式较为详细的group_concat()函数的功能、使用方法与相关注意事项,需要的朋友可以参考下
    2016-06-06

最新评论