pandas删除重复数据简单方法

 更新时间:2023年07月07日 12:03:04   作者:**星光*  
这篇文章主要给大家介绍了关于pandas删除重复数据的简单方法,在数据处理过程中常常会遇到重复的问题,文中通过实例代码介绍的非常详细,需要的朋友可以参考下

 1、pandas中重复索引问题

df = df[~df.index.duplicated()]

2、pandas删除重复数据行

# 首先导入常用的两个包
import pandas as pd
import numpy as np
 
# 1.删除完全重复的行
df.drop_duplicates()
 
2.按k列进行去重,对于重复项,保留第一次出现的值
df.drop_duplicates('k',keep='first')
 
3、k2和k1两列进行去重
df.drop_duplicates(['k2','k1'], keep='first')
 
"""
keep:{‘first', ‘last', False}, 默认值 ‘first'
first:保留第一次出现的重复行,删除后面的重复行。
last:删除前面的重复项,保留最后一次出现的重复行。
False:删除所有重复项
"""

 3、drop_duplicates()函数的语法

df.drop_duplicates(subset=['A','B','C'],keep='first',inplace=True)

参数说明如下:

  • subset:表示要进去重的列名,默认为 None。
  • keep:有三个可选参数,分别是 first、last、False,默认为 first,表示只保留第一次出现的重复项,删除其余重复项,last 表示只保留最后一次出现的重复项,False 则表示删除所有重复项。
  • inplace:布尔值参数,默认为 False 表示删除重复项后返回一个副本,若为 Ture 则表示直接在原数据上删除重复项。

附:pandas数据处理——取出重复数据

平常我们用pandas做重复数据处理时,常常调用到drop_duplicates方法来去除重。

现在我不想完全去除重复,而是把重复数据输出,现有数据如下所示:

方法:

重复数据保留一个,duplicate_bool输出的是bool类型值,通过判断bool==True,取出重复行。

duplicate_bool = df.duplicated(subset=['id'], keep='first')
repeat=df.loc[duplicate_bool == True]
repeat复制

输出:

 总结

到此这篇关于pandas删除重复数据的文章就介绍到这了,更多相关pandas删除重复数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python学习之基于Python的人脸识别技术学习

    python学习之基于Python的人脸识别技术学习

    面部识别技术的应用越来越广泛,它广泛应用于安全系统、人机交互、社交媒体、医疗保健等领域。本文介绍了基于Python的人脸识别技术,感兴趣的小伙伴可以参考阅读
    2023-03-03
  • Python搭建FTP服务器的方法示例

    Python搭建FTP服务器的方法示例

    本篇文章主要介绍了Python搭建FTP服务器的方法示例,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-01-01
  • python机器学习包mlxtend的安装和配置详解

    python机器学习包mlxtend的安装和配置详解

    这篇文章主要介绍了python机器学习包mlxtend的安装和配置详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-08-08
  • 浅析Python如何优雅地处理超时和延迟加载问题

    浅析Python如何优雅地处理超时和延迟加载问题

    在网络爬虫开发中,超时(Timeout)和延迟加载(Lazy Loading)是两个常见的技术挑战,本文将介绍如何在Python中优雅地处理超时和延迟加载,并提供完整的代码实现,有需要的小伙伴可以参考下
    2025-07-07
  • Python 如何用一行代码实现for循环初始化数组

    Python 如何用一行代码实现for循环初始化数组

    这篇文章主要介绍了Python 用一行代码实现for循环初始化数组的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • Vue的el-scrollbar实现自定义滚动

    Vue的el-scrollbar实现自定义滚动

    本篇文章给大家分享了Vue的el-scrollbar实现自定义滚动实现的过程和实例代码,对此有需要的朋友可以参考下。
    2018-05-05
  • 关于jupyter代码自动补全设置方式

    关于jupyter代码自动补全设置方式

    这篇文章主要介绍了关于jupyter代码自动补全设置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-06-06
  • python中class类与方法的用法实例详解

    python中class类与方法的用法实例详解

    类(class)是python中很重要的一个概念,也是我们面象对象编程中最重要的概念主之一,这篇文章主要给大家介绍了关于python中class类与方法用法的相关资料,需要的朋友可以参考下
    2022-04-04
  • Python基础之元组与文件知识总结

    Python基础之元组与文件知识总结

    今天带大家复习一下Python基础知识,文中详细介绍了Python元祖与文件,对正在学习python基础的小伙伴们很有帮助,需要的朋友可以参考下
    2021-05-05
  • python使用whisper读取蓝牙耳机语音并转为文字

    python使用whisper读取蓝牙耳机语音并转为文字

    这篇文章主要为大家详细介绍了python如何使用whisper读取蓝牙耳机语音并识别转为文字,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下
    2025-05-05

最新评论