MySQL 线上数据库清理数据的方法

 更新时间:2021年03月30日 10:52:54   作者:AsiaYe  
这篇文章主要介绍了MySQL 线上数据库清理数据的方法,帮助大家更好的理解和学习使用MySQL,感兴趣的朋友可以了解下

01 场景分析

 今天下午,开发的同事提来一个需求,需要在线上要删除一些数据记录,简单看了看数据的分布,大概是要删除数据表中的两千七百多万条记录,数据表的总记录是两千八百多万,也就是说,要删除的记录占了总记录的绝大部分比重,两千七百多万的数据记录,要是删除的话,使用的时间是相当长的,对线上的业务肯定会造成影响。这里将实际的应用案例简单重构为以下方法:

mysql> select date,count(*) from test.tbl_a  group by date;
+----------+----------+
|   date | count(*) |
+----------+----------+
| |  63103 |
| 20190118 | |
| |  125916 |
| 20190120 |   |
| |  129198 |
| 20190122 |  |
| | 5191247 |
+----------+----------+
 rows in set (13.21 sec)

上面就是重构之后的表的结构,我们可以看到,test数据库中的表tbl_b按照date分组之后,每个组的数据量都不小,而我们的需求是将date为20190118和20190123的记录删除,可以看到这两种记录总计有两千多万条,占了表中数据的绝大部分,如果直接删除的话,线上的业务肯定会受到阻塞。

以下是操作方法,需要注意的是,应用下面的操作方法的前提是:

要删除的数据占了数据表中的绝大部分。

02 操作办法

 通过分析,知道剩余的表数据对于全表来说是很小的一部分,这个操作我们分为4步:

1.我们先把剩余的数据存入到另外一个数据库test1中:

create table test1.tbl_b_new as 
select * from test.tbl_b 
where date in(,,,,);

这个操作的时间只有3s左右;

2.我们在test1数据库中创建一个同名的表tbl_b,它的结构和test数据库中的tbl_b数据结构一致:

create table test1.tbl_b like test.tbl_b;

3.紧接着,我们使用数据库中的rename操作将表test中的表tbl_b和test1中的表tbl_b进行交换,等价于将test数据库中的表所有数据清除。

RENAME TABLE test.tbl_b  TO test1.tbl_b_bak,
         test1.tbl_b  TO test.tbl_b,
         test1.tbl_b_bak TO test1.tbl_b;

4.再讲第一步保存的剩余数据填充到新表中来,如下:

insert into test.tbl_b select * from  test1.tbl_b_new;

03 结果分析

 看上去我们好像把问题搞复杂了,直接删除的事情,被我们搞的多了好几个步骤,但是实际上不是这样的,这一套操作可以帮我们节省好几分钟时间,对线上业务的影响也更小,原因如下:

  1. 我们使用create table as的方法创建剩余的数据表,这种方法使我们仅对数据表中的少部分数据进行了操作。避免了我们对过多的数据进行扫描。
  2. mysql中对大表进行rename的操作,rename命令会直接修改底层的.frm文件,所以它的速度是相当之快的。

   第二个特点给我们提供了一种思路,在一个很着急的业务中,要使用一个表的时候,往往不给我们留充足的时间备份表,如果我们想要删除一个大表里面的数据,而且需要进行相关备份,我们可以通过rename操作迅速处理,然后再想办法去备份rename之后的表。

    上面的例子中使用create table as 和create table like两种克隆表的方式,有几点需要注意:

create table like方式会完整地克隆表结构,但不会插入数据,需要单独使用insert into或load data方式加载数据
create table as  方式会部分克隆表结构,完整保留数据

    如果有兴趣,可以做做试验进行验证。

以上就是MySQL 线上数据库清理数据的方法的详细内容,更多关于MySQL 线上数据库清理数据的资料请关注脚本之家其它相关文章!

相关文章

  • MySQL导入sql脚本错误:2006 解决方法

    MySQL导入sql脚本错误:2006 解决方法

    本文给大家分享的是在使用mysql导入数据的时候,提示脚本错误2006 MySQL server has gone away的解决方法,非常实用,有需要的小伙伴,可以参考下。
    2015-07-07
  • MySQL聚合查询与联合查询操作实例

    MySQL聚合查询与联合查询操作实例

    这篇文章主要给大家介绍了关于MySQL聚合查询与联合查询操作的相关资料,文中通过实例代码介绍的非常详细,对大家学习或者使用MySQL具有一定的参考学习价值,需要的朋友可以参考下
    2022-02-02
  • Mysql开启慢SQL并分析原因

    Mysql开启慢SQL并分析原因

    今天小编就为大家分享一篇关于Mysql开启慢SQL并分析原因,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-04-04
  • 以mysql为例详解ToplingDB 的 UintIndex

    以mysql为例详解ToplingDB 的 UintIndex

    本文主要介绍了以mysql为例详解ToplingDB的UintIndex,在ToplingDB的CO-Index(Compressed Ordered Index)家族中,Nest Succinct Trie是最通用的,更多相关内容需要的朋友可以参考一下
    2022-08-08
  • 深入mysql创建自定义函数与存储过程的详解

    深入mysql创建自定义函数与存储过程的详解

    本篇文章是对mysql创建自定义函数与存储过程进行了详细的分析介绍,需要的朋友参考下
    2013-06-06
  • MySQL group by对单字分组序和多字段分组的方法讲解

    MySQL group by对单字分组序和多字段分组的方法讲解

    今天小编就为大家分享一篇关于MySQL group by对单字分组序和多字段分组的方法讲解,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-03-03
  • MySQL 8.0.28 安装配置图文教程

    MySQL 8.0.28 安装配置图文教程

    这篇文章主要为大家详细介绍了MySQL 8.0.28 安装配置图文教程,文中安装步骤介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-06-06
  • 解决Linux下Tomcat向MySQL插入数据中文乱码问题

    解决Linux下Tomcat向MySQL插入数据中文乱码问题

    本文给大家介绍的是如何解决win平台下开发的项目移植到Linux平台后,向MySQL插入数据时中文出现乱码的问题,非常的简单实用,有需要的小伙伴可以参考下
    2018-04-04
  • MySQL中索引的定义以及操作新手教程

    MySQL中索引的定义以及操作新手教程

    索引是对数据库表中一列或多列的值进行排序的一种结构,在关系数据库中,索引是一种与表有关的数据库结构,下面这篇文章主要给大家介绍了关于MySQL中索引的定义以及操作的相关资料,需要的朋友可以参考下
    2022-08-08
  • MySQL 查询某个字段不重复的所有记录

    MySQL 查询某个字段不重复的所有记录

    现在想从这5条记录中查询所有title不重复的记录
    2009-05-05

最新评论