基于python cut和qcut的用法及区别详解

 更新时间:2019年11月22日 10:16:53   作者:wx_411180165  
今天小编就为大家分享一篇基于python cut和qcut的用法及区别详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

我就废话不多说了,直接上代码吧:

from pandas import Series,DataFrame
import pandas as pd
import numpy as np
from numpy import nan as NA
from matplotlib import pyplot as plt
ages = [20,22,25,27,21,23,37,31,61,45,41,32]
#将所有的ages进行分组
bins = [18,25,35,60,100]
#使用pandas中的cut对年龄数据进行分组
cats = pd.cut(ages,bins)
#print(cats)
#调用pd.value_counts方法统计每个区间的个数
number=pd.value_counts(cats)
#print(pd.value_counts(cats))
#显示第几个区间index值
index=pd.cut(ages,bins).codes
#print(index)
#为分类出来的每一组年龄加上标签
group_names = ["Youth","YouthAdult","MiddleAged","Senior"]
personType=pd.cut(ages,bins,labels=group_names)
#print(personType)
plt.hist(personType)
#plt.show()
#cut和qcut的用法
data=[1,2,3,4,5,6,7,8,9,10]
result=pd.qcut(data,4)
print(' ',result)##qcut会将10个数据进行排序,然后再将data数据均分成四组
#统计落在每个区间的元素个数
print('dasdasdasdasdas:  ',pd.value_counts(result))
#qcut : 跟cut一样也可以自定义分位数(0到1之间的数值,包括端点)
results=pd.qcut(data,[0,0.1,0.5,0.9,1])
print('results:  ',results)
import numpy as np
import pandas as pd
data = np.random.rand(20)
print(data)
#用cut函数将一组数据分割成n份
#cut函数分割的方式:数据里的(最大值-最小值)/n=每个区间的间距
#利用数据中最大值和最小值的差除以分组数作为每一组数据的区间范围的差值
result = pd.cut(data,4,precision=2) #precision保留小数点的有效位数
print(result)
res_data=pd.value_counts(result)
print(res_data)

以上这篇基于python cut和qcut的用法及区别详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python数据类型相互转换

    Python数据类型相互转换

    当涉及数据类型转换时,Python提供了多种内置函数来执行不同类型之间的转换,本文主要介绍了Python数据类型相互转换,具有一定的参考价值,感兴趣的可以了解一下
    2023-09-09
  • python进行二次方程式计算的实例讲解

    python进行二次方程式计算的实例讲解

    在本篇内容里小编给大家整理了一篇关于python进行二次方程式计算的实例讲解内容,有兴趣的朋友们可以学习下。
    2020-12-12
  • python 单线程和异步协程工作方式解析

    python 单线程和异步协程工作方式解析

    这篇文章主要介绍了python 单线程和异步协程工作方式解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-09-09
  • 解决Pytorch训练过程中loss不下降的问题

    解决Pytorch训练过程中loss不下降的问题

    今天小编就为大家分享一篇解决Pytorch训练过程中loss不下降的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01
  • Dataframe的行名及列名排序问题

    Dataframe的行名及列名排序问题

    这篇文章主要介绍了Dataframe的行名及列名排序问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-09-09
  • python下的opencv画矩形和文字注释的实现方法

    python下的opencv画矩形和文字注释的实现方法

    今天小编就为大家分享一篇python下的opencv画矩形和文字注释的实现方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • Python使用unittest进行有效测试的示例详解

    Python使用unittest进行有效测试的示例详解

    这篇文章主要介绍了如何使用 unittest 来编写和运行单元测试,希望通过阅读本文,大家能了解 unittest 的基本使用方法,以及如何使用 unittest 中的断言方法和测试用例组织结构
    2023-06-06
  • 使用并行处理提升python for循环速度的过程

    使用并行处理提升python for循环速度的过程

    Python 是一门功能强大的编程语言,但在处理大规模数据或复杂计算任务时,性能可能成为一个瓶颈,这篇文章主要介绍了使用并行处理提升python for循环速度,需要的朋友可以参考下
    2023-06-06
  • Python pip指定安装源的方法详解

    Python pip指定安装源的方法详解

    pip是Python包管理工具,该工具提供了对Python包的查找、下载、安装、卸载的功能,这篇文章主要给大家介绍了关于Python pip指定安装源的相关资料,需要的朋友可以参考下
    2023-12-12
  • Python编程mac下使用pycharm小技巧

    Python编程mac下使用pycharm小技巧

    这篇文章主要介绍了Python编程中在mac下使用pycharm的一些小技巧,建议正在使用Pycharm的同学们可以收藏阅读,可以节省你的编程时间
    2021-09-09

最新评论