浅谈sql数据库去重

 更新时间:2014年08月07日 10:53:12   投稿:hebedich  
关于sql去重,我简单谈一下自己的理解和经验,如果各位有建议或有不明白的欢迎多多指出。

  关于sql去重,我简单谈一下自己的简介,如果各位有建议或有不明白的欢迎多多指出。

  关于sql去重最常见的有两种方式:DISTINCT和ROW_NUMBER(),当然了ROW_NUMBER()除了去重还有很多其他比较重要的功能,一会我给大家简单说说我自己在实际中用到的。

  假如有张UserInfo表,如下图:

 
   
  现在我们要去掉完全重复的数据:SELECT DISTINCT * FROM dbo.UserInfo结果如下图:

  

  但是现在有个新的需求,要把名字为‘张三'的去重,也就是相同名字的只要一条数据,要是还用DISTINCT的话就很麻烦了。想必聪明的你已经想到此时是ROW_NUMBER()登场的时候了吧。我们只需执行这样一句话就万事大吉了SELECT * FROM (SELECT ROW_NUMBER() OVER(PARTITION BY Name ORDER BY ID) AS RowId,* FROM dbo.UserInfo) x WHERE x.RowId=1;虽然看起来有点长,但是很容易理解。现在执行的结果如下图:

  现在名字重复的数据只取了一条,而且是根据sql语句中的ORDER BY ID取的第一条,其中PARTITION BY后面跟的就是去重的字段,也许你想问为什么要加WHERE x.RowId=1呢,现在我们不加这个条件看看结果如何:SELECT * FROM (SELECT ROW_NUMBER() OVER(PARTITION BY Name ORDER BY ID) AS RowId,* FROM dbo.UserInfo) x,如下图:

  

  现在我们已经看到,如果不加条件会把所有数据都查出来,所以RowId=1的数据就是去重后的数据;

  ROW_NUMBER()除了可以去重还可以得到表的行号,现在我们只需一下语句:SELECT ROW_NUMBER() OVER(ORDER BY ID) AS RowNum,* FROM dbo.UserInfo,结果如下图:

  

  得到了所有的数据,而且还得到了每条数据的行号,其中数据的顺序可以根据ORDER BY ID调节,也就是说不去重的话就不用加PARTITION BY Name了,此功能在分页中用的也比较多,假如每页15条数据,分页时直接加条件RowNum Between 1 AND 15就行了。孤狼发表的博客很少,平时也比较懒,希望对大家有用。

相关文章

  • Mysql自增主键id不是以此逐级递增的处理

    Mysql自增主键id不是以此逐级递增的处理

    这篇文章主要介绍了Mysql自增主键id不是以此逐级递增的处理方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-07-07
  • 基于Mysql的Sequence实现方法

    基于Mysql的Sequence实现方法

    下面小编就为大家带来一篇基于Mysql的Sequence实现方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-09-09
  • percona 实用工具之pt-kill使用介绍

    percona 实用工具之pt-kill使用介绍

    一个优秀的kill MySQL连接的一个工具,是percona toolkit的一部分,在因为空闲连接较多导致超过最大连接数、某个有问题的sql导致mysql负载很高时,都需要将一些连接kill掉,这个工具主要就是这个用途
    2016-04-04
  • MySQL数据库 1067错误号的解决方法

    MySQL数据库 1067错误号的解决方法

    这篇文章主要介绍了MySQL数据库 1067错误号的解决方法,非常不错,具有参考借鉴价值,需要的朋友可以参考下
    2016-12-12
  • SQL查询执行顺序分析

    SQL查询执行顺序分析

    这篇文章主要为大家介绍了SQL查询执行顺序分析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-09-09
  • CMS不要让MySQL为你流泪

    CMS不要让MySQL为你流泪

    MySQL是中小型网站普遍使用的数据库之一,然而,很多人并不清楚MySQL到底能支持多大的数据量,再加上某些国内CMS厂商把数据承载量的责任推给它,导致很多不了解MySQL的站长对它产生了很多误解
    2008-12-12
  • MySQL插入时间戳字段的值实现

    MySQL插入时间戳字段的值实现

    在MySQL中,我们经常会遇到需要插入时间戳字段的情况,包括使用NOW()函数插入当前时间戳,使用FROM_UNIXTIME()插入指定时间戳,本文就来介绍一下,感兴趣的可以了解一下
    2024-09-09
  • CentOS 6.5 i386 安装MySQL 5.7.18详细教程

    CentOS 6.5 i386 安装MySQL 5.7.18详细教程

    这篇文章主要介绍了CentOS 6.5 i386 安装MySQL 5.7.18详细教程,需要的朋友可以参考下
    2017-04-04
  • 如何批量生成MySQL不重复手机号大表实例代码

    如何批量生成MySQL不重复手机号大表实例代码

    这篇文章主要给大家介绍了关于如何批量生成MySQL不重复手机号大表的相关资料,,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-11-11
  • MySQL分组的时候遇到ONLY_FULL_GROUP_BY报错问题及解决方案

    MySQL分组的时候遇到ONLY_FULL_GROUP_BY报错问题及解决方案

    这篇文章主要介绍了MySQL分组的时候遇到ONLY_FULL_GROUP_BY报错问题及解决方案,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2025-04-04

最新评论