Pandas 实现分组计数且不计重复

 更新时间:2021年03月26日 11:50:12   投稿:jingxian  
这篇文章主要介绍了Pandas 实现分组计数且不计重复的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

在对dataframe进行分析的时候会遇到需要分组计数,计数的column中属性有重复,但又需要仅对不重复的项计数(即重复N次出现的项只计1次)。

函数如下:

dataframe.groupby([‘分组的列名']).需要计数的列名.nunique()

举例:

数组“data”如下:

StoreID Sales SalesDate Channel
A 100 2018/1/1 01
A 90 2018/1/1 02
A 110 2018/1/2 01
B 82.2 2018/1/1 01
B 90 2018/1/2 02

如果要按StoreID来统计每一家店的营业日期数(可以通过不计重复的count “SalesDate”来完成)

代码如下:

data.groupby(['StoreID']).SalesDate.nunique()

补充:pandas 统计分组内不重复计数

在数据分析中的数据处理过程中,经常需要对数据进行分组计数,看下下面这组数据

数据中name 为C 的有三行,其中有2个code是重复的

目标:

按name 分组,统计每组中code的不重复数量

df.groupby('name')['code'].nunique()
# 以name 分组后,统计code的不重复数目

结果如下:

排序

df.groupby('name')['code'].nunique().sort_values(ascending=False)
# 以name 分组后,统计code的不重复数目

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

相关文章

  • python openpyxl模块的使用详解

    python openpyxl模块的使用详解

    这篇文章主要介绍了python openpyxl模块的使用详解,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
    2021-02-02
  • 基于Python实现的影视数据智能分析系统

    基于Python实现的影视数据智能分析系统

    数据分析与可视化是当今数据分析的发展方向,大数据时代,数据资源具有海量特征,数据分析和可视化主要通过Python数据分析来实现,本文给大家介绍了如何基于Python实现的影视数据智能分析系统,文中给出了部分详细代码,感兴趣的朋友跟着小编一起来看看吧
    2024-01-01
  • Python Flask-Login实现用户会话管理

    Python Flask-Login实现用户会话管理

    这篇文章主要介绍了Python Flask-Login实现用户会话管理过程,Flask-Login为Flask提供用户会话管理。它处理登录、注销和长时间记住用户会话等常见任务
    2022-12-12
  • Python加载数据的5种不同方式(收藏)

    Python加载数据的5种不同方式(收藏)

    这篇文章主要介绍了Python加载数据的5种不同方式(收藏),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-11-11
  • Python利用PyQt5制作一个获取网络实时NBA数据并播报的GUI程序

    Python利用PyQt5制作一个获取网络实时NBA数据并播报的GUI程序

    现在NBA联赛也进行到半决赛了,我们怎么样才能以更快的方法获取NBA的数据呢?这里我们就自己来做一个数据播报的程序,需要的朋友可以参考下
    2021-06-06
  • Python变量和字符串详解

    Python变量和字符串详解

    本篇文章主要介绍了Python变量和字符串的相关资料。具有很好的参考价值。下面跟着小编一起来看下吧
    2017-04-04
  • python实现通过flask和前端进行数据收发

    python实现通过flask和前端进行数据收发

    今天小编就为大家分享一篇python实现通过flask和前端进行数据收发,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • Pandas DataFrame数据的更改、插入新增的列和行的方法

    Pandas DataFrame数据的更改、插入新增的列和行的方法

    这篇文章主要介绍了Pandas DataFrame数据的更改、插入新增的列和行的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-06-06
  • 基于Python实现捕获,播放和保存摄像头视频

    基于Python实现捕获,播放和保存摄像头视频

    这篇文章主要为大家分享一下Python操作视频最基本的操作,包括读取和播放视频和保存视频。文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2022-04-04
  • TensorFlow实现MLP多层感知机模型

    TensorFlow实现MLP多层感知机模型

    这篇文章主要为大家详细介绍了TensorFlow实现MLP多层感知机模型,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03

最新评论