删除Table表中的重复行的方法

 更新时间:2010年06月08日 00:22:16   作者:  
在写SQL的时候经常会有这样的需求: 在一个Table中会有多条重复的数据,如何有效的取出来不重复的数据,或者是删除掉重复的数据,或者取出某列重复值的第一条数据.
利用SQL Server 2005的新功能NOW_NUMBER和CTE可以很好的实现.
举例说明如下:
建立测试数据:
复制代码 代码如下:

create table Dup1
(
Col1 int null,
Col2 varchar(20) null
)
insert into Dup1 values
(1, 'aaa'),
(2, 'aaa'),
(2, 'aaa'),
(2, 'aaa'),
(3, 'bbb'),
(3, 'bbb'),
(4, 'ccc'),
(4, 'ddd'),
(5, 'eee')
select * from Dup1

可以查看到重复的数据有:
复制代码 代码如下:

SELECT Col1, Col2, COUNT(*) AS DupCountFROM Dup1GROUP BY Col1, Col2HAVING COUNT(*) > 1


接下来介绍如何delete掉重复的数据:
1.NOW_NUMBER:SQL Server 2005添加了很好用的RANKING函数(NOW_NUMBER,RANK,DENSE_RANK,NTILE),利用NOW_NUMBER()OVER(PARTITION GY)最为直接,也最为方便,不能修改表或者产生多余的列.
首先会分配一个列号码,以Col1,Col2组合来分区排序.
复制代码 代码如下:

SELECT Col1, Col2,ROW_NUMBER() OVER (PARTITION BY Col1, Col2 ORDER BY Col1) AS rnFROM Dup1


得到的序号如下:
 
很明显的是重复列都分组分割排序,只需要delete掉排序序号>1的即可.
复制代码 代码如下:

--用到CTE
WITH DupsD
AS (
SELECT Col1, Col2,
ROW_NUMBER() OVER (PARTITION BY Col1, Col2 ORDER BY Col1) AS rn
FROM Dup1
)
DELETE DupsD
WHERE rn > 1;
--或者
DELETE A FROM (
SELECT Col1, Col2,
ROW_NUMBER() OVER (PARTITION BY Col1, Col2 ORDER BY Col1) AS rn
FROM Dup1) A WHERE A.rn>1

2.创建一个标识键唯一的表记一列.
复制代码 代码如下:

ALTER TABLE dbo.Dup1
ADD
PK INT IDENTITY
NOT NULL
CONSTRAINT PK_Dup1 PRIMARY KEY;
SELECT *
FROM Dup1;

删除找出与Col1,Col2相同并且比Dup1.PK大的记录,也就是保留重复值中PK最小的记录.
复制代码 代码如下:

DELETE Dup1
WHERE EXISTS ( SELECT *
FROM Dup1 AS D1
WHERE D1.Col1 = Dup1.Col1
AND D1.Col2 = Dup1.Col2
AND D1.PK > Dup1.PK );

3.select distant into,这种方法借助一个新的table,把不重复的结果集转移到新table中.
复制代码 代码如下:

SELECT distinct Col1, Col2 INTO NoDupsFROM Dup1;select * from NoDups

建议采用第一种和第三种方法,第一种多见于T-SQL的编程中,第三种在ETL中常常使用.

相关文章

  • sql时间段切分实现每隔x分钟出一份高速门架车流量

    sql时间段切分实现每隔x分钟出一份高速门架车流量

    本文主要介绍了sql时间段切分实现每隔x分钟出一份高速门架车流量,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-02-02
  • SQL Server里书签查找的性能伤害

    SQL Server里书签查找的性能伤害

    本文主要介绍了SQL Server里书签查找的性能伤害,具有很好的参考价值。下面跟着小编一起来看下吧
    2017-03-03
  • 分区表场景下的 SQL 优化

    分区表场景下的 SQL 优化

    这篇文章主要介绍了分区表场景下的 SQL 优化,帮助大家更好的理解和学习SQL,感兴趣的朋友可以了解下
    2020-08-08
  • sqlserver:查询锁住sql以及解锁方法

    sqlserver:查询锁住sql以及解锁方法

    这篇文章主要介绍了sqlserver:查询锁住sql以及解锁方法,具有一定参考价值,这里分享给大家,供需要的朋友参考。
    2017-10-10
  • SQL Server 实例之间传输登录名和密码的详细步骤

    SQL Server 实例之间传输登录名和密码的详细步骤

    本文介绍如何在Windows上运行的SQL Server的不同实例之间传输登录名和密码,适用于SQL mirroring,SQL AG中的本地logins的迁移或者同步,需要的朋友可以参考下
    2023-06-06
  • 开窗函数有浅入深详解(一)

    开窗函数有浅入深详解(一)

    本篇文章主要给大家介绍开窗函数,本文有浅入深详解开窗函数,有需要的朋友可以参考下
    2015-08-08
  • 小议sqlserver数据库主键选取策略

    小议sqlserver数据库主键选取策略

    我们在建立数据库的时候,需要为每张表指定一个主键,所谓主键就是能够唯一标识表中某一行的属性或属性组,一个表只能有一个主键,但可以有多个候选索引
    2011-10-10
  • SQL Join的一些总结(实例)

    SQL Join的一些总结(实例)

    Join是关系型数据库系统的重要操作之一,SQL Server中包含的常用Join:内联接、外联接和交叉联接等
    2012-08-08
  • sql下三种批量插入数据的方法

    sql下三种批量插入数据的方法

    本文将介绍三种批量插入数据的方法,需要的朋友可以参考下
    2013-10-10
  • SQL Server 触发器详情

    SQL Server 触发器详情

    这篇文章主要介绍了SQL Server 触发器,触发器是一种特殊类型的存储过程,它不同于之前的我们介绍的存储过程。触发器主要是通过事件进行触发被自动调用执行的。而存储过程可以通过存储过程的名称被调用。需要的朋友可以参考一下
    2021-09-09

最新评论