关于MySQL表中没有主键时如何找到重复的数据

 更新时间:2023年06月09日 16:02:03   作者:唐小码  
这篇文章主要来和探讨一下关于MySQL表中没有主键时,该如何找到重复的数据,文中的示例代码讲解详细,具有一定的参考价值,需要的可以了解一下

问题描述

有一次遇到这样一个面试题,说如果一个表中没有主键,如何找到里面重复的数据?

表数据如下:

表结构如下:

针对以上问题,有以下几种解决方案

解决方案

1.  使用 GROUP BY 分组查询法

利用 GROUP BY 分组查询语句来分组聚合,然后筛选出出现次数大于1的重复记录。例如:

SELECT column1, column2, column3, COUNT(*) as count FROM table_name GROUP BY column1, column2, column3 HAVING count > 1;

该语句将按照 column1、column2、column3 分组,统计每个分组的数量,然后取出数量大于 1 的分组。该方法比较简单,但是如果表中记录较多,可能查询效率较低。

2.  使用子查询法

使用子查询获得重复的记录,例如:

SELECT * FROM table_name WHERE (column1, column2, column3) IN (SELECT column1, column2, column3 FROM table_name GROUP BY column1, column2, column3 HAVING COUNT(*) > 1)

该语句子查询部分统计每个不同的 column1、column2、column3 分组,然后再用 IN 子句将重复记录选出来。

3.  使用连接查询法

使用连接查询,将表和本身连接起来,并比较来判断重复。例如:

SELECT a.* FROM table_name a INNER JOIN (SELECT column1, column2, column3 FROM table_name GROUP BY column1, column2, column3 HAVING COUNT(*) > 1) b ON a.column1 = b.column1 AND a.column2 = b.column2 AND a.column3 = b.column3

该语句以列 column1、column2、column3 分组,找出出现两次以上的重复记录,并与原表进行连接查询。

4.  使用去重后比较条数法

将表中所有列的值连接成一个字符串,再将这个字符串进行快速 MD5 哈希,用 count() 函数来计算每个哈希值出现的次数,如果某个哈希值出现次数大于 1,那么这些记录就是重复的。例如:

SELECT COUNT(*), MD5(CONCAT_WS('|', column_1, column_2, column_3, column_4, ..., column_n)) FROM table_name GROUP BY MD5(CONCAT_WS('|', column_1, column_2, column_3, column_4, ..., column_n)) HAVING COUNT(*) > 1

5.  使用子查询法计算重复次数

使用子查询先计算出每个记录重复的次数,然后取出重复次数大于 1 的记录。例如:

SELECT a.* FROM table_name a, (SELECT column1, column2, column3, COUNT(*) as count FROM table_name GROUP BY column1, column2, column3 HAVING count > 1) b WHERE a.column1 = b.column1 AND a.column2 = b.column2 AND a.column3 = b.column3

该语句计算出每个 column1、column2、column3 分组中出现的次数,然后筛选出出现次数大于 1 的记录。

6.  对多列使用 DISTINCT 子句法

使用 DISTINCT 子句来去除重复的数据,例如:

SELECT DISTINCT column1, column2, column3 FROM table_name

该语句将按照 column1、column2、column3 去重,只取出不同的记录。如果存在重复数据,那么就会取出重复数据。

7.  查找输入数据相同的记录法

这种方法就是找到输入的记录与某些记录是相同的,这些记录就是重复记录。例如:

SELECT * FROM table_name WHERE column1='value1' AND column2='value2' AND column3='value3'

该语句将根据表中每个过滤条件来查找重复记录。

8.  根据下标去重

该方法是通过打印出所有的键值,找出重复的键并去重。例如:

SELECT DISTINCT SUBSTRING_INDEX(column_string,',',1) AS column1, SUBSTRING_INDEX(SUBSTRING_INDEX(column_string,',',2),',',-1) AS column2, SUBSTRING_INDEX(column_string,',',-1) AS column3 FROM (SELECT CONCAT(column1,',',column2,',',column3) AS column_string FROM table_name) AS table_alias

该语句将 SELECT CONCAT(column1,',',column2,',',column3) AS column_string FROM table_name 产生的结果进行处理,将 column1、column2、column3 分开,然后再按照去重不同列的方法进行处理。

9.  手动输入表的列名法

该方法是通过手动输入要查询的列名,然后进行查找。例如:

SELECT column1, column2, column3, COUNT(*) as count FROM table_name GROUP BY column1, column2, column3 HAVING count > 1;

10. 使用 ROW_NUMBER() OVER() 分配行号

该方法基于 ROW_NUMBER() OVER() 分配行号来找到重复的记录。例如:

SELECT * FROM (
    SELECT *, ROW_NUMBER() OVER(PARTITION BY column1, column2, column3 ORDER BY column1, column2, column3) AS rn 
    FROM table_name
) t
WHERE t.rn > 1

该语句将按照 column1、column2、column3 分组,为每组结果分配一个行号并选出行号大于 1 的结果。这种方法适用于较新的 MySQL 版本和较大的表。

到此这篇关于关于MySQL表中没有主键时如何找到重复的数据的文章就介绍到这了,更多相关MySQL重复数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • MySQL UPDATE更新数据方式

    MySQL UPDATE更新数据方式

    这篇文章主要介绍了MySQL UPDATE更新数据方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2025-04-04
  • 不确定mysql是否安装成功了的检查办法(Windows、Linux、macOS)

    不确定mysql是否安装成功了的检查办法(Windows、Linux、macOS)

    MySQL安装完成后,需通过命令行操作和服务状态检查确认安装是否成功,这篇文章主要介绍了各系统(Windows、Linux、macOS)下不确定mysql是否安装成功了的检查办法,需要的朋友可以参考下
    2026-02-02
  • mysql中的四大运算符种类实例汇总(20多项) 

    mysql中的四大运算符种类实例汇总(20多项) 

    这篇文章主要介绍了mysql中的四大运算符种类汇总,运算符连接表达式中的各个操作数,他的作用是用来指明对数据表中的操作数所进行的运算
    2022-07-07
  • 用HAProxy来检测MySQL复制的延迟的教程

    用HAProxy来检测MySQL复制的延迟的教程

    这篇文章主要介绍了用HAProxy来检测MySQL复制的延迟的教程,HAProxy需要使用到PHP脚本,需要的朋友可以参考下
    2015-04-04
  • MySQL8.0的工具日志配置管理方式

    MySQL8.0的工具日志配置管理方式

    MySQL日志分类包括错误日志(记录错误信息)、普通日志(全量操作记录)、二进制日志(用于数据恢复、主从复制和审计,默认8.0开启)、慢日志(记录性能低的SQL),配置需在my.cnf中设置,重启生效,建议分离存储日录与数据
    2025-07-07
  • mysql 添加索引的实现步骤

    mysql 添加索引的实现步骤

    索引是一种用于提高查询效率的数据结构,通过添加索引,可以加快数据的查找速度,本文主要介绍了mysql 添加索引的实现步骤,具有一定的参考价值,感兴趣的可以了解一下
    2024-07-07
  • 探索MySQL 8中utf8mb4释放多语言数据的强大潜力

    探索MySQL 8中utf8mb4释放多语言数据的强大潜力

    这篇文章主要为大家介绍了探索MySQL 8中utf8mb4释放多语言数据的强大潜力,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-12-12
  • MySQL中的锁机制详解之全局锁,表级锁,行级锁

    MySQL中的锁机制详解之全局锁,表级锁,行级锁

    MySQL锁机制通过全局、表级、行级锁控制并发,保障数据一致性与隔离性,全局锁适用于全库备份,表级锁适合读多写少场景,行级锁(InnoDB)实现高并发事务控制,本文给大家介绍MySQL之锁机制详解:全局锁,表级锁,行级锁,感兴趣的朋友一起看看吧
    2025-06-06
  • MySql 设置表格字段key中的值

    MySql 设置表格字段key中的值

    本文主要介绍了MySql 设置表格字段key中的值,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2024-05-05
  • 一篇文章带你了解MySQL数据库约束

    一篇文章带你了解MySQL数据库约束

    数据库中要管理很多数据,但是这些数据是否正确、是否非法,光靠人力来检验是远远不够的,因此我们想让数据库拥有丰富的检验和校验能力,所以便引入了约束,下面这篇文章主要给大家介绍了关于MySQL数据库约束的相关资料,需要的朋友可以参考下
    2023-06-06

最新评论