pandas统计重复值次数的方法实现

 更新时间:2021年02月20日 12:01:12   作者:Mr番茄蛋  
这篇文章主要介绍了pandas统计重复值次数的方法实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印数据框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重复项
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup) # 最后两项重复
# data1  2
# key1   2
# key2   2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重复元素个数的获取

方法有二:

1. 在调用duplicated方法后,非重复的元素会被标记为False,而重复的元素会被标记为True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info为一个dataframe框,user_id为其中一列

【注2】duplicated( )方法只会把重复的元素标记为True,而不会标记被重复的元素

2.这行代码的速度更快,drop_duplicates(['user_id'])方法为删除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 为获取行数

到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python中的常量和变量代码详解

    python中的常量和变量代码详解

    这篇文章主要介绍了python中的常量和变量,通过实例代码给大家介绍了局部和全局变量,需要的朋友参考下吧
    2018-07-07
  • Python中的请求重试策略深入探讨

    Python中的请求重试策略深入探讨

    在网络通信中,由于各种原因,请求可能会失败,为了增加程序的健壮性和可靠性,实现一个优雅的请求重试策略是至关重要的,本文将深入探讨如何在Python中实现优雅的请求重试,通过丰富的示例代码和详细的解释,帮助大家更好地理解和应用重试机制
    2024-01-01
  • python实现两张图片的像素融合

    python实现两张图片的像素融合

    这篇文章主要为大家详细介绍了python实现两张图片的像素融合,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-02-02
  • pandas中DataFrame数据合并连接(merge、join、concat)

    pandas中DataFrame数据合并连接(merge、join、concat)

    这篇文章主要给大家介绍了关于pandas中DataFrame 数据合并连接(merge、join、concat)的相关资料,文中介绍的非常详细,需要的朋友可以参考下
    2021-05-05
  • Python+Selenium定位不到元素常见原因及解决办法(报:NoSuchElementException)

    Python+Selenium定位不到元素常见原因及解决办法(报:NoSuchElementException)

    这篇文章主要介绍了Python+Selenium定位不到元素常见原因及解决办法(报:NoSuchElementException),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-03-03
  • 使用Python在Excel中实现自动查找并替换数据

    使用Python在Excel中实现自动查找并替换数据

    随着项目的进展,需要经常在Excel业务表格中查找及替换数据,已保证数据与实际项目进度一致,手动一个一个查找,然后替换,效率太低,还容易遗漏,现在我们来试试用Python自动完成查找及替换吧,需要的朋友可以参考下
    2023-12-12
  • Python rstrip()方法实例详解

    Python rstrip()方法实例详解

    这篇文章主要介绍了Python rstrip()方法,包括rstrip方法的语法介绍和参数类型,需要的朋友可以参考下
    2018-11-11
  • python @property的用法及含义全面解析

    python @property的用法及含义全面解析

    下面小编就为大家分享一篇python @property的用法及含义全面解析,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-02-02
  • jupyter notebook插入本地图片的实现

    jupyter notebook插入本地图片的实现

    这篇文章主要介绍了jupyter notebook插入本地图片的实现,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • python3 正则表达式基础廖雪峰

    python3 正则表达式基础廖雪峰

    正则表达式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的
    2020-03-03

最新评论