Mysql大表添加字段失败问题及解决

 更新时间:2024年04月11日 08:41:17   作者:RobinCode  
这篇文章主要介绍了Mysql大表添加字段失败问题及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

背景

最近遇到一个问题,需要在user用户表千万级别数据中添加两个字段,发现老是加不上去,一直卡死。

表数据量不仅大,而且是一个热点表,访问频率特别高,而且该表的访问是在一个大事务中。加字段的时候一直在等待获取MDL写锁

这个等待也影响了后续表访问对MDL读锁的获取,导致后面的查询也都被堵塞了。

更惨的是,客户端有重试机制,查询堵塞超过超时时间会再起一个session进行请求,导致数据库的线程池很快就爆满了,直接挂掉。

MDL锁

MDL锁介绍

MDL锁属于表级别的元数据锁表级别锁分为数据锁元数据锁,通常我们说的加锁一般指的是加的数据锁。跟数据锁一样,元数据锁也分读锁写锁

MDL不需要显示使用,在进行表操作时会自动加上。当对表数据进行增删改查( insert、delete、select、update等)时,会自动加上MDL读锁;当要对表进行加减字段的结构修改时,会自动加上MDL写锁

  • 读锁不互斥:意味着可以多个线程同时对一张表进行增删改查(CRUD)的操作。
  • 写锁独占:进行结构修改前,要先等待其他所有的MDL锁释放了才能获取到MDL写锁。获取到写锁后,在写锁释放前,其他线程无法获取到MDL读锁和写锁。也就是说,修改一个表的结构过程中,会阻塞其他线程对表的操作

MDL锁是MySQL自动隐式加锁,无需我们手动操作。在我们执行DML语句的时候,MySQL自动添加MDL读锁。在我们执行DDL语句的时候,MySQL自动添加MDL写锁。读锁与读锁之间不互斥,读锁与写锁、写锁与写锁之间互斥。注意:MDL锁是表锁,会对整张表加锁

  • DML(Data Manipulation Language)数据操纵语言:适用范围:对表数据进行操作,比如 insert、delete、select、update等。
  • DDL(Data Definition Language)数据定义语言:适用范围:对表结构进行操作,比如create、drop、alter、rename、truncate等。

MDL锁的必要性

MDL锁 的存在,其实是为了保证 数据的一致性 。

想象一下,假如没有 MDL锁 ,一个查询在遍历表数据的过程中,另外一个线程执行了ALTER TABLE t DELETE COLUMN 'col_1'把col_1这一列删掉了,那查询结果就乱了,结果中是否应该有这一列数据?

所以为了保证并发操作下数据的一致性。

如果一个事务正在执行中,另一个在这时修改了表结构,不但可能导致当前事务出现不可重复读的问题,还有可能连事务都无法提交

事故复现

介绍完MDL锁,我们再来复现下事故。我们通过下面的操作序列来模拟线上情况。

Session 1Session 2Session 3
begin;select * from user limit 10;
alter table user add ‘age’ int not null default ‘0’ comment ‘年龄’;(阻塞)
select * from user limit 10;

时刻1,事务1对表user进行查询,注意此时事务1并未提交,所以获取的MDL读锁也不会释放。

时刻2另外一个线程想要添加字段, 由于 事务1正持着MDL读锁,所以事务2会陷入阻塞,等待事务1释放读锁后获取MDL写锁

申请 MDL 锁的操作会形成一个队列,队列中写锁获取优先级高于读锁

所以事务2不仅阻塞了加字段的操作,也会阻塞后续对该表的所有操作。比如后面的事务3查询由于获取不到MDL读锁都被阻塞了

这时,如果客户端有重试机制,查询超时后会重新进行请求,容易把数据库的连接池给挤爆了。

Mysql服务宕机的原因

为什么会出现这种情况呢?

原因是在执行查询语句的时候,MySQL自动加了MDL锁(metadata lock,即元数据锁)。

不行的话,我们可以再执行一下show processlist命令,查看有哪些正在执行的进程:

可以清楚的看到Session2和Session3的语句正在等待MDL锁,Waiting for table metadata lock

解决方案

方案一

了解了原因,事情就比较好处理了,数据库奔溃原因是由于加字段等待时间太长导致影响后续请求,但mysql又无法在 alter table 语句里面设定等待时间。

所以当时做法是继续尝试加字段语句,语句卡住30秒就手动cancel掉。避免对后续请求的影响。重试了几次发现一直没能加上。最后是通过查看接口调用监控,在请求频率较低的时间点给加上了。

方案二

从MySQL5.6版本开始增加了Online DDL,作用就是在执行DDL的时候,允许并发执行DML。简单翻译就是修改表结构的时候,也能同时支持并发执行增删查改操作。

从MySQL8.0版本开始又优化了Online DDL,支持快速添加列,可以实现给大表秒级加字段。具体用法就是在DDL语句后面增加两个参数ALGORITHMLOCK

比如下面这样:

ALTER TABLE user ADD age int NOT NULL DEFAULT '0' COMMENT '年龄', ALGORITHM=Inplace, LOCK=NONE;

ALGORITHM可以指定使用哪种算法执行DDL,可选项有:

  • Copy:拷贝方式,MySQL5.6 之前 DDL 的执行方式,过程就是先创建新表,修改新表结构,把旧表数据复制到新表,删除旧表,重命名新表。执行过程非常耗时,产生大量的磁盘IO和占用CPU,还有使Buffer poll失效,而且需要锁住旧表,性能较差,现在基本很少使用。
  • Inplace:原地修改,MySQL5.6开始引入的,优点是不会在Server层发生表数据拷贝,过程中允许并发执行DML操作。过程就是先添加MDL写锁,执行初始化操作,然后降级为MDL读锁,执行DDL操作(比较耗时,允许并发执行DML操作),升级为MDL写锁,完成DDL操作。
  • Instant:快速修改,MySQL8.0开始引入的,可以实现快速给大表添加字段。

性能依次是,Instant > Inplace > Copy。

LOCK可以指定执行过程中,是否加锁,可选项有:

  • NONE不加锁,允许DML操作。
  • SHARED加读锁,允许读操作,禁止DML操作。
  • DEFAULT默认锁模式,在满足DDL操作前提下,默认锁模式会允许尽可能多的读操作和DML操作。
  • EXCLUSIVE加写锁,禁止读操作和DML操作。

其他

这里我们重点关注INNODB_TRX, INNODB_LOCKS, 以及INNODB_LOCK_WAITS三张表,表如其名,这三张表记录了正在运行的事务(包括事务占用or释放锁的信息)状态信息

select * FROM information_schema.INNODB_TRX;
select * FROM information_schema.INNODB_LOCKS;
select * FROM information_schema.INNODB_LOCK_WAITS;

desc information_schema.INNODB_TRX;
desc information_schema.INNODB_LOCKS;
desc information_schema.INNODB_LOCK_WAITS

show engine innodb status;
show processlist;

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • MySQL9.1.0实现最基础主从复制的步骤

    MySQL9.1.0实现最基础主从复制的步骤

    本文主要介绍了使用Docker实现MySQL的主从复制,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2025-02-02
  • MySQL中慢SQL优化的不同方式介绍

    MySQL中慢SQL优化的不同方式介绍

    慢 SQL 的优化,主要从两个方面考虑,SQL 语句本身的优化,以及数据库设计的优化,下面小编就来给大家介绍一下有哪些方式可以优化慢 SQL吧
    2025-03-03
  • xtrabackup备份还原MySQL数据库

    xtrabackup备份还原MySQL数据库

    这篇文章主要为大家详细介绍了xtrabackup备份还原MySQL数据库的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-06-06
  • MySQL中datetime时间字段的四舍五入操作

    MySQL中datetime时间字段的四舍五入操作

    这是由一则生产环境问题引出的MySQL对于datetime时间类型字段中毫秒的处理的深究,这篇文章主要给大家介绍了关于MySQL中datetime时间字段的四舍五入操作的相关资料,需要的朋友可以参考下
    2021-09-09
  • mysql生成指定位数的随机数及批量生成随机数的方法

    mysql生成指定位数的随机数及批量生成随机数的方法

    这篇文章主要介绍了mysql生成指定位数的随机数及批量生成随机数的方法,文中给大家介绍了常用mysql函数,需要的朋友可以参考下
    2018-09-09
  • MySQL数据库Event定时执行任务详解

    MySQL数据库Event定时执行任务详解

    这篇文章主要介绍了MySQL数据库Event定时执行任务
    2017-12-12
  • mysql update case 更新字段值不固定的操作

    mysql update case 更新字段值不固定的操作

    这篇文章主要介绍了mysql update case 更新字段值不固定的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-02-02
  • 使用MySQL建立外键约束时报错3780的解决方案

    使用MySQL建立外键约束时报错3780的解决方案

    在创建MySQL外键约束时,报错3780通常是因为主表和从表中对应字段的数据类型不一致,使用Navicat可视化界面修改数据类型,即可解决此问题,这是一个常见的数据库设计错误,确保数据类型一致是关键
    2024-11-11
  • MYSQL数据库导入数据时出现乱码的解决办法

    MYSQL数据库导入数据时出现乱码的解决办法

    我是用的最后一种方法,前面三种解决MYSQL导入数据乱码的方法没试过,东莞SEO推荐大家直接使用第四种方法处理MYSQL导入中文数据时的乱码问题。
    2011-01-01
  • MYSQL设置字段自动获取当前时间的sql语句

    MYSQL设置字段自动获取当前时间的sql语句

    整理数据库数据,看到好多表都有加create_time和 update_time字段,来记录数据插入的时间和更新时间,但是时间插入是通过代码来维护的,这篇文章主要介绍了MYSQL设置字段自动获取当前时间,需要的朋友可以参考下
    2023-07-07

最新评论