Pandas去除重复项函数详解drop_duplicates()

 更新时间:2024年02月20日 17:01:28   作者:ckSpark  
这篇文章主要介绍了Pandas去除重复项函数drop_duplicates(),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

drop_duplicates函数用途

pandas中的drop_duplicates()函数

可以通过SQL中关键字distinct的用法来理解

根据指定的字段对数据集进行去重处理

drop_duplicates()函数的具体参数

用法:

DataFrame.drop_duplicates(subset=None, keep=‘first', inplace=False)

参数说明:

参数说明
subset根据指定的列名进行去重,默认整个数据集
keep可选{‘first’, ‘last’, False},默认first,即默认保留第一次出现的重复值,并删去其他重复的数据,False是指删去所有重复数据。
inplace是否对数据集本身进行修改,默认False

drop_duplicates用法举例

根据指定字段进行去重

保留第一次出现的数据

import pandas as pd
#创建数据框
df=pd.DataFrame({
    'a':[1,2,4,3,3,3,4],
    'b':[2,3,3,4,4,5,3]
})
print('去重前:\n',df)

#根据字段a进行去重,保留第一次出现的数据
df.drop_duplicates(['a'],keep='first',inplace=True)
print('去重后:\n',df)

>>>
去重前:
    a  b
0  1  2
1  2  3
2  4  3
3  3  4
4  3  4
5  3  5
6  4  3
去重后:
    a  b
0  1  2
1  2  3
2  4  3
3  3  4

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Flask添加路由的三种方法

    Flask添加路由的三种方法

    Flask 是一个流行的 Python Web 框架,它提供了多种方法来添加路由,本文详细的介绍了Flask添加路由的三种方法,感兴趣的可以了解一下
    2023-11-11
  • pycharm 使用心得(一)安装和首次使用

    pycharm 使用心得(一)安装和首次使用

    PyCharm 是我用过的python编辑器中,比较顺手的一个。而且可以跨平台,在macos和windows下面都可以用,这点比较好。
    2014-06-06
  • python中gradio的输出展示组件实例代码

    python中gradio的输出展示组件实例代码

    这篇文章主要介绍了python中gradio的输出展示组件的相关资料,文章介绍了多种数据展示格式,包括HTML、JSON、KeyValues、Label、Markdown和Plot,每个格式都有其适用场景,需要的朋友可以参考下
    2024-11-11
  • 使用rpclib进行Python网络编程时的注释问题

    使用rpclib进行Python网络编程时的注释问题

    这篇文章主要介绍了使用rpclib进行Python网络编程时的注释问题,作者讲到了自己在编写服务器时要用unicode注释等需要注意的地方,需要的朋友可以参考下
    2015-05-05
  • python如何建立全零数组

    python如何建立全零数组

    在本篇内容里小编给大家分享了关于python建立全零数组的方法,需要的朋友们跟着学习下吧。
    2020-07-07
  • 详解Python编程中对Monkey Patch猴子补丁开发方式的运用

    详解Python编程中对Monkey Patch猴子补丁开发方式的运用

    Monkey Patch猴子补丁方式是指在不修改程序原本代码的前提下,通过添加类或模块等方式在程序运行过程中加入代码,下面就来进一步详解Python编程中对Monkey Patch猴子补丁开发方式的运用
    2016-05-05
  • Python实现照片卡通化

    Python实现照片卡通化

    animegan2-pytorch机器学习项目可以实现照片动漫化,本文将为大家详细介绍一下如何使用这一项目,感兴趣的小伙伴快来跟随小编一起学习吧
    2021-12-12
  • Python实现购物系统(示例讲解)

    Python实现购物系统(示例讲解)

    下面小编就为大家带来一篇Python实现购物系统(示例讲解)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-09-09
  • Windows系统下cython_bbox库的正确安装步骤

    Windows系统下cython_bbox库的正确安装步骤

    Cython-bbox一般无法直接通过pip直接安装,那么如何安装呢?下面这篇文章主要给大家介绍了关于Windows系统下cython_bbox库的正确安装步骤,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2023-05-05
  • Python数据分析之Numpy库的使用详解

    Python数据分析之Numpy库的使用详解

    NumPy(Numerical Python)是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库
    2021-11-11

最新评论