Mysql批量插入数据时该如何解决重复问题详解

 更新时间:2022年11月10日 10:09:28   作者:头秃的程序员小王  
之前写的代码批量插入遇到了问题,原因是有重复的数据(主键或唯一索引冲突),所以插入失败,下面这篇文章主要给大家介绍了关于Mysql批量插入数据时该如何解决重复问题的相关资料,需要的朋友可以参考下

前言

当数据库中存量数据较多时,或者是在批量插入操作时,很容易出现插入重复数据的问题。

一、三种方法

在 mysql 中,当存在主键冲突或唯一键冲突的情况下,根据插入策略不同,一般有以下三种避免方法:

insert ignore into:若没有则插入,若存在则忽略

replace into:若没有则正常插入,若存在则先删除后插入

insert into ... on duplicate key update:若没有则正常插入,若存在则更新

注意,使用以上方法的前提是表中有一个 PRIMARY KEY 或 UNIQUE 约束/索引,否则,使用以上三个语句没有特殊意义,与使用单纯的 INSERT INTO 效果相同。

测试表结构:

测试表数据:

二、细节

2.1、insert ignore into

insert ignore 会根据主键或者唯一键判断,忽略数据库中已经存在的数据,若数据库没有该条数据,就插入为新的数据,跟普通的 insert into 一样。若数据库有该条数据,就忽略这条插入语句,不执行插入操作。

insert ignore into student(age) values (12),(13);

age=12的数据已存在,因此未插入(根据创建时间可得),age=13的数据不存在,因此成功插入

2.2 、insert into ... on duplicate key update

在 insert into 语句末尾指定 on duplicate key update,会根据主键或者唯一键判断:若数据库有该条数据,则直接更新原数据,相当于 update,若数据库没有该条数据,则插入为新的数据,跟普通的 insert into 一样。

insert into student(age) values (12),(13) 
ON DUPLICATE KEY UPDATE student.created_at = '2022-01-01 00:00:00';

age=12的记录已存在,因此created_at字段被更新。age=13的记录不存在,因此成功插入

2.3、replace into

 replace into student(age) values (12),(13);

age=12的记录已存在,因此被删除重新插入(由createdAt值可知)。age=13的记录不存在,因此成功插入

replace into 会根据主键或者唯一键判断:

  • 若表中已存在该数据,则先删除此行数据,然后插入新的数据,相当于 delete + insert
  • 可能会丢失数据、主从服务器的 AUTO_INCREMENT 不一致。
  • 若表中不存在该数据,则直接插入新数据,跟普通的 insert into 一样

三、总结

1)在主键冲突情况下,三种方法都可以使用

2)在唯一键冲突情况下,且有自增主键时:三种方法都会出现 AUTO_INCREMENT 不连续问题,且这种不连续不会同步更新到 slave 的 AUTO_INCREMENT。当 master 被 kill,且 slave 升级为 master 时,就会出现主键冲突问题。(因为事务原因,即使没有插入成功,也会占用一个自增id。row模式binlog下,主从的数据同步是一致的,主键也一致。有没有影响取决于主从同步模式)

  • statement格式:binlog记录的是实际执行的sql语句
  • row格式:binlog记录的是变化前后的数据(涉及所有列),形如update table_a set col1=value1, col2=value2 ... where col1=condition1 and col2=condition2 ...
  • mixed格式:默认选择statement格式,只在需要时改用row格式

3)replace into 方法可能会导致部分数据丢失。

到此这篇关于Mysql批量插入数据时该如何解决重复问题的文章就介绍到这了,更多相关Mysql批量插入数据重复问题内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Mysql数据库绿色版安装教程 解决系统错误1067的方法

    Mysql数据库绿色版安装教程 解决系统错误1067的方法

    这篇文章主要为大家详细介绍了MySql数据库绿色版安装教程,以及系统错误1067的解决方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-08-08
  • 以mysql为例详解ToplingDB 的 UintIndex

    以mysql为例详解ToplingDB 的 UintIndex

    本文主要介绍了以mysql为例详解ToplingDB的UintIndex,在ToplingDB的CO-Index(Compressed Ordered Index)家族中,Nest Succinct Trie是最通用的,更多相关内容需要的朋友可以参考一下
    2022-08-08
  • MySQL的加密解密的几种方式(小结)

    MySQL的加密解密的几种方式(小结)

    这篇文章主要介绍了MySQL的加密解密的几种方式(小结),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-03-03
  • 通过mysqladmin远程管理mysql的方法

    通过mysqladmin远程管理mysql的方法

    在一些特殊场景下,想要远程重启mysql,以便让某些修改能及时的生效,但是mysql并没有提供远程重启的功能,唯一能做的就是远程关闭mysql服务
    2013-03-03
  • SQL JOIN 子句合并多个表中相关行全面指南

    SQL JOIN 子句合并多个表中相关行全面指南

    这篇文章主要为大家介绍了SQL JOIN 子句合并多个表中相关行全面指南,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-11-11
  • MYSQL如何自动为查询数据的结果编上序号详解

    MYSQL如何自动为查询数据的结果编上序号详解

    这篇文章主要给大家介绍了关于MYSQL如何自动为查询数据的结果编上序号的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用mysql具有一定的参考学习价值,需要的朋友们下面随着小编来一起看看吧。
    2017-11-11
  • 深入了解SQL注入

    深入了解SQL注入

    本篇文章通过SQL和MYSQL的对比,以及SQL注入的原理等方面详细分析了SQL注入相关知识点,对此有兴趣的朋友学习下。
    2018-02-02
  • MySQL死锁套路之唯一索引下批量插入顺序不一致

    MySQL死锁套路之唯一索引下批量插入顺序不一致

    这篇文章主要给大家介绍了关于MySQL死锁套路之唯一索引下批量插入顺序不一致的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者MySQL具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-06-06
  • MySQL查看日志简单易懂保姆级教程

    MySQL查看日志简单易懂保姆级教程

    这篇文章主要给大家介绍了关于MySQL查看日志简单易懂保姆级教程的相关资料,在操作MySQL数据库的时候会留下每一个步骤的痕迹,那怎么查看呢?就可以用日志去查看,需要的朋友可以参考下
    2023-08-08
  • mysql安装出现Install/Remove of the Service Denied!错误问题

    mysql安装出现Install/Remove of the Service D

    这篇文章主要介绍了mysql安装出现Install/Remove of the Service Denied!错误问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-12-12

最新评论