MySQL中删除重复数据的简单方法

 更新时间:2015年05月30日 11:08:24   投稿:goldensun  
这篇文章主要介绍了MySQL中删除重复数据的简单方法,比起一般的NOT IN语句的效率更为高,需要的朋友可以参考下

MYSQL里有五百万数据,但大多是重复的,真实的就180万,于是想怎样把这些重复的数据搞出来,在网上找了一圈,好多是用NOT IN这样的代码,这样效率很低,自己琢磨组合了一下,找到一个高效的处理方式,用这个方式,五百万数据,十来分钟就全部去除重复了,请各位参考。

第一步:从500万数据表data_content_152里提取出不重复的字段SFZHM对应的ID字段到TMP3表

create table tmp3 as select min(id) as col1 from data_content_152 group by SFZHM;

第二步:创建新表RES

CREATE TABLE `res` (
`id` int(11),
`sfz` char(20)
) ENGINE=MyISAM;

第三步:把TMP3表ID对应到data_content_152里需要提取的数据添加到RES表的SFZ字段

INSERT INTO res (sfz) SELECT sfzhm FROM data_content_152,tmp3 where data_content_152.id=tmp3.col1

至此,就在MYSQL里实现了,给数据表data_content_152完全删除重复数据,把去重复后的数据导入到RES表。

相关文章

  • CentOS 7下MySQL服务启动失败的快速解决方法

    CentOS 7下MySQL服务启动失败的快速解决方法

    CentOS 7下MySQL服务启动失败怎么办?下面小编就为大家带来一篇CentOS 7下MySQL服务启动失败的快速解决方法。现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-03-03
  • MySQL 表分区步骤示例详解

    MySQL 表分区步骤示例详解

    MySQL表分区是一种数据库管理技术,用于将大型表拆分成更小、更可管理的分区(子表,这篇文章主要介绍了MySQL 表分区简介,需要的朋友可以参考下
    2023-09-09
  • MySQL日期格式以及日期函数举例详解

    MySQL日期格式以及日期函数举例详解

    这篇文章主要给大家介绍了关于MySQL日期格式及日期函数的相关资料,日期在数据库中是一个常见且重要的数据类型,在MySQL中我们可以使用各种函数和格式化选项来处理和显示日期,需要的朋友可以参考下
    2023-11-11
  • MySQL笔记之索引的使用

    MySQL笔记之索引的使用

    索引是创建在表上的,对数据库表中一列或多列的值进行排序的一种结构其作用主要在于提高查询的速度,降低数据库系统的性能开销
    2013-05-05
  • mysql 5.7如何安装 mysql 5.7安装配置教程

    mysql 5.7如何安装 mysql 5.7安装配置教程

    这篇文章主要为大家详细介绍了MySQL 5.7安装配置方法,安装过程中出现问题的解决方案,感兴趣的小伙伴们可以参考一下
    2016-08-08
  • 浅谈Using filesort和Using temporary 为什么这么慢

    浅谈Using filesort和Using temporary 为什么这么慢

    本文主要介绍了Using filesort和Using temporary为什么这么慢,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-02-02
  • 详解MySQL中的视图

    详解MySQL中的视图

    视图是一个虚拟表,非真实存在,其本质是根据SQL语句获取动态的数据集,并为其命名,用户使用时只需使用视图名称即可获取结果集,并可以将其当作表来使用,这篇文章主要介绍了MySQL的视图,需要的朋友可以参考下
    2022-12-12
  • 分享几道关于MySQL索引的重点面试题

    分享几道关于MySQL索引的重点面试题

    这篇文章主要给大家介绍了几道关于MySQL索引的重点面试题,文中通过示例代码介绍的非常详细,对大家学习或者使用MySQL具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-05-05
  • Mysql 主从数据库同步(centos篇)

    Mysql 主从数据库同步(centos篇)

    Mysql 主从数据库同步(centos篇),需要的朋友可以参考下。
    2011-05-05
  • 详解GaussDB for MySQL性能优化

    详解GaussDB for MySQL性能优化

    GaussDB(for MySQL)数据库在写入性能上,在业界同类产品中是最好的,这主要得益于GaussDB(for MySQL)在MySQL内核方面的诸多优化。其中有一项从“送快递”得来灵感的优化——事务异步提交,值得我们分析。
    2021-05-05

最新评论