pandas删除重复数据简单方法

更新时间：2023年07月07日 12:03:04 作者：**星光*

这篇文章主要给大家介绍了关于pandas删除重复数据的简单方法,在数据处理过程中常常会遇到重复的问题,文中通过实例代码介绍的非常详细,需要的朋友可以参考下

1、pandas中重复索引问题

df = df[~df.index.duplicated()]

2、pandas删除重复数据行

# 首先导入常用的两个包
import pandas as pd
import numpy as np
 
# 1.删除完全重复的行
df.drop_duplicates()
 
2.按k列进行去重，对于重复项，保留第一次出现的值
df.drop_duplicates('k',keep='first')
 
3、k2和k1两列进行去重
df.drop_duplicates(['k2','k1'], keep='first')
 
"""
keep：{‘first', ‘last', False}, 默认值 ‘first'
first：保留第一次出现的重复行，删除后面的重复行。
last：删除前面的重复项，保留最后一次出现的重复行。
False：删除所有重复项
"""

3、drop_duplicates()函数的语法

df.drop_duplicates(subset=['A','B','C'],keep='first',inplace=True)

参数说明如下：

subset：表示要进去重的列名，默认为 None。
keep：有三个可选参数，分别是 first、last、False，默认为 first，表示只保留第一次出现的重复项，删除其余重复项，last 表示只保留最后一次出现的重复项，False 则表示删除所有重复项。
inplace：布尔值参数，默认为 False 表示删除重复项后返回一个副本，若为 Ture 则表示直接在原数据上删除重复项。

附：pandas数据处理——取出重复数据

平常我们用pandas做重复数据处理时，常常调用到drop_duplicates方法来去除重。

现在我不想完全去除重复，而是把重复数据输出，现有数据如下所示：

方法：

重复数据保留一个，duplicate_bool输出的是bool类型值，通过判断bool==True，取出重复行。

duplicate_bool = df.duplicated(subset=['id'], keep='first')
repeat=df.loc[duplicate_bool == True]
repeat复制

输出：

总结

到此这篇关于pandas删除重复数据的文章就介绍到这了,更多相关pandas删除重复数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

python turtle绘制多边形和跳跃和改变速度特效
这篇文章主要介绍了python turtle绘制多边形和跳跃和改变速度特效,文章实现过程详细，需要的小伙伴可以参考一下，希望对你的学习有所帮助
2022-03-03
Python爬虫中urllib3与urllib的区别是什么
Urllib3是一个功能强大，条理清晰，用于HTTP客户端的Python库。那么Python爬虫中urllib3与urllib的区别是什么，本文就详细的来介绍一下
2021-07-07
windos安装了python但cmd命令行找不到python的解决过程
在使用Python进行开发和学习时,CMD(命令提示符)是一个非常重要的工具,这篇文章主要介绍了windos安装了python但cmd命令行找不到python的解决过程,文中将解决的步骤介绍的非常详细,需要的朋友可以参考下
2025-12-12
Python 闭包的使用方法
这篇文章主要介绍了Python 闭包的使用方法的相关资料,了解闭包及定义方法和使用，需要的朋友可以参考下
2017-09-09
教你十行代码实现python向手机推送通知功能
这篇文章主要介绍了十行代码实现python向手机推送通知,这里使用的是pushplus的服务，代码也很简单，运行代码后也是很快就可以收到消息推送，需要的朋友可以参考下
2022-04-04
带你学习Python如何实现回归树模型
这篇文章主要介绍了Python如何实现回归树模型，文中讲解非常细致，帮助大家更好的理解和学习，感兴趣的朋友可以了解下
2020-07-07
Python自动化操作Excel方法详解(xlrd,xlwt)
Excel是Windows环境下流行的、强大的电子表格应用。本文将详解用Python利用xlrd和xlwt实现自动化操作Excel的方法详细，需要的可以参考一下
2022-06-06
Python 如何实现访问者模式
这篇文章主要介绍了Python 如何实现访问者模式，文中讲解非常细致，代码帮助大家更好的理解和学习，感兴趣的朋友可以了解下
2020-07-07
Python开发工具Pycharm的安装以及使用步骤总结
今天给大家带来的是关于Python开发工具的安装以及使用的相关知识,文章围绕着如何使用和安装Pycharm展开,文中有非常详细的介绍及代码示例,需要的朋友可以参考下
2021-06-06
Python高效实现Excel与TXT文本文件之间的数据转换
Excel 文件和文本文件（TXT）在不同场景中各有优势,本文将通过实际操作,演示如何使用 Python 来实现 Excel 和 TXT 文件之间的数据转换,帮助你轻松掌握这一常见且实用的技巧
2025-10-10