MySQL 大表添加一列的实现

 更新时间:2021年02月06日 11:05:13   作者:干货满满张哈希  
这篇文章主要介绍了MySQL 大表添加一列的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

问题参考自: https://www.zhihu.com/question/440231149 ,mysql中,一张表里有3亿数据,未分表,要求是在这个大表里添加一列数据。数据库不能停,并且还有增删改操作。请问如何操作?答案为个人原创

以前老版本 MySQL 添加一列的方式:

ALTER TABLE 你的表 ADD COLUMN 新列 char(128);

会造成锁表,简易过程如下:

  • 新建一个和 Table1 完全同构的 Table2
  • 对表 Table1 加写锁
  • 在表 Table2 上执行 ALTER TABLE 你的表 ADD COLUMN 新列 char(128)
  • 将 Table1 中的数据拷贝到 Table2
  • 将 Table2 重命名为 Table1 并移除 Table1,释放所有相关的锁

如果数据量特别特别大,那么锁表时间很长,期间所有表更新都会阻塞,线上业务不能正常执行。

针对 MySQL 5.6(不包含)之前的版本,通过触发器将一个表的更新在另一个表上重复,并进行数据同步,当数据同步完成时,业务上修改表名为新表并发布。业务不会暂停。触发器设置类似于:

create trigger person_trigger_update AFTER UPDATE on 原有表 for each row 
begin set @x = "trigger UPDATE";
Replace into 新表 SELECT * from 原有表 where 新表.id = 原有表.id;
END IF;
end;

MySQL 5.6(包含) 以后的版本引入了在线 DDL 的功能:

Alter table 你的表 , ALGORITHM [=] {DEFAULT|INSTANT|INPLACE|COPY}, LOCK [=] { DEFAULT| NONE| SHARED| EXCLUSIVE }

其中的参数:

ALGORITHM:

  • DEFAULT:默认方式,在 MySQL 8.0中,如果未显示指定 ALGORITHM,那么会优先选择 INSTANT 算法,如果不行再使用 INPLACE 算法,如果不支持 INPLACE 算法则使用 COPY 的方式完成
  • INSTANT:8.0 中新添加的算法,添加列是立即返回。但是不能是虚拟列。这个原理很简单,对于新建一列,表所有原有数据并不是立刻发生变化,只是在表字典里面记录下这个列和默认值,对于默认的 Dynamic 行格式(其实就是 Compressed 的变种),如果更新了这一列则原有数据标记为删除在末尾追加更新后的记录。这样做就是没有提前预留出列空间,之后更新可能经常会发生行记录空间变动。但是对于大多数业务,都是最近的时间的记录才会修改,所以问题不大。
  • INPLACE:在原表上直接进行修改,不会拷贝临时表,可以逐条记录修改,不会产生大量的 undolog 以及 redolog,不会占用很多 buffer。可以避免重建表带来的IO和CPU消耗,保证期间依然良好的性能和并发。
  • COPY:拷贝到临时新表上进行修改。由于记录拷贝,会产生大量的 undolog 以及 redolog,并占用很多 buffer,对业务性能有影响。

LOCK:

  •  DEFAULT:和 ALGORITHM 的 DEFAULT 类似
  • NONE:无锁,允许并发读取和更新表
  • SHARED:共享锁,允许读取不允许更新
  • EXCLUSIVE:不允许读取和更新

各个版本支持的在线 DDL 修改使用的算法的对比:

image

参考文档:

MySQL 5.6:https://dev.mysql.com/doc/refman/5.6/en/innodb-online-ddl-operations.htmlMySQL

5.7:https://dev.mysql.com/doc/refman/5.7/en/innodb-online-ddl-operations.htmlMySQL

8.0:https://dev.mysql.com/doc/refman/8.0/en/innodb-online-ddl-operations.html

可以通过:

ALTER TABLE 你的表 ADD COLUMN 新列 char(128), ALGORITHM=INSTANT, LOCK=NONE;

类似的语句,实现在线增加字段。最好还是明确 ALGORITHM 以及 LOCK,这样执行 DDL 的时候能明确知道到底会对线上业务有多大影响

同时,执行在线 DDL 的过程大概是:

image

可以看出,在开始阶段需要 metadata lock,metadata lock 是在 5.5 才引入到mysql,之前也有类似保护元数据的机制,只是没有明确提出 metadata lock 概念而已。但是 5.5 之前版本(比如5.1)与5.5之后版本在保护元数据这块有一个显著的不同点是,5.1对于元数据的保护是语句级别的,5.5对于metadata的保护是事务级别的。所谓语句级别,即语句执行完成后,无论事务是否提交或回滚,其表结构可以被其他会话更新;而事务级别则是在事务结束后才释放 metadata lock。

引入 metadata lock 后,主要解决了2个问题,一个是事务隔离问题,比如在可重复隔离级别下,会话A在2次查询期间,会话B对表结构做了修改,两次查询结果就会不一致,无法满足可重复读的要求;另外一个是数据复制的问题,比如会话A执行了多条更新语句期间,另外一个会话B做了表结构变更并且先提交,就会导致 slave 在重做时,先重做 alter,再重做 update 时就会出现复制错误的现象。

如果当前有很多事务在执行,并且有那种包含大查询的事务,例如:

START TRANSACTION;
select count(*) from 你的表

这样类似的会执行较长时间的事务,也会阻塞。

所以,原则上:

  • 避免大事务
  • 在业务低峰去做表结构变化

到此这篇关于MySQL 大表添加一列的实现的文章就介绍到这了,更多相关MySQL 大表添加一列内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 如何利用Mysql计算地址经纬度距离实时位置

    如何利用Mysql计算地址经纬度距离实时位置

    最近工作中遇到了一个附近门店的功能,下面这篇文章主要给大家介绍了关于如何利用Mysql计算地址经纬度距离实时位置的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-04-04
  • IDEA 链接Mysql数据库并执行查询操作的完整代码

    IDEA 链接Mysql数据库并执行查询操作的完整代码

    这篇文章主要介绍了IDEA 链接Mysql数据库并执行查询操作的完整代码,代码不难,详细大家看完本文肯定有意向不到的收获,感兴趣的朋友跟随小编一起看看吧
    2021-05-05
  • MySQL中Select查询语句的高级用法分享

    MySQL中Select查询语句的高级用法分享

    MySQL是一个开源的关系型数据库管理系统,支持多种操作语言,其中最基础、最常用的命令之一就是SELECT语句,所以本文就来和大家聊聊Select查询语句的几个高级用法吧
    2023-05-05
  • MySQL InnoDB Cluster搭建安装教程

    MySQL InnoDB Cluster搭建安装教程

    这篇文章主要介绍了MySQL InnoDB Cluster搭建安装教程,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
    2024-01-01
  • mysql变量用法实例分析【系统变量、用户变量】

    mysql变量用法实例分析【系统变量、用户变量】

    这篇文章主要介绍了mysql变量用法,结合实例形式分析了mysql系统变量、用户变量相关概念、功能、原理与使用技巧,需要的朋友可以参考下
    2020-04-04
  • MySQL insert 记录后查询乱码问题解决方法

    MySQL insert 记录后查询乱码问题解决方法

    文章通过分析一个MySQL插入数据后查询乱码的问题,探讨了乱码的原因,并提出了解决方法,问题的根本原因是MySQL客户端和服务器之间的字符集不一致,导致插入的中文字符被错误解码为乱码,感兴趣的朋友跟随小编一起看看吧
    2024-11-11
  • 你知道哪几种MYSQL的连接查询

    你知道哪几种MYSQL的连接查询

    连接(join)查询是将两个查询的结果以“横向对接”的方式合并起来的结果,这篇文章主要给大家介绍了关于MYSQL连接查询的相关资料,需要的朋友可以参考下
    2021-06-06
  • 深入分析Mysql中limit的用法

    深入分析Mysql中limit的用法

    很久没用mysql的limit,一时大意竟然用错了,自认为(limit 开始,结束),其实错了,正确的应该是(limit 偏移量,条数),为了记住这次错误,转载一篇limit用法详解。推荐给大家,希望对大家能够有所帮助。
    2015-03-03
  • MySQL数据库的性能优化

    MySQL数据库的性能优化

    这篇文章主要介绍了MySQL数据库的性能优化,文中介绍的非常详细,一定的参考价值,感兴趣的同学可以参考阅读
    2023-04-04
  • MySQL复制之GTID复制的具体使用

    MySQL复制之GTID复制的具体使用

    从MySQL 5.6.5开始新增了一种基于GTID的复制方式,本文主要介绍了MySQL复制之GTID复制的具体使用,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-05-05

最新评论