详细介绍在pandas中创建category类型数据的几种方法

 更新时间:2021年04月02日 09:59:41   作者:一个处女座的程序猿  
这篇文章主要介绍了详细介绍在pandas中创建category类型数据的几种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

在pandas中创建category类型数据的几种方法之详细攻略

 T1、直接创建 category类型数据
可知,在category类型数据中,每一个元素的值要么是预设好的类型中的某一个,要么是空值(np.nan)。 

T2、利用分箱机制(结合max、mean、min实现二分类)动态添加 category类型数据

输出结果
[NaN, 'medium', 'medium', 'fat']
Categories (2, object): ['medium', 'fat']
   name    ID  age  age02  ... weight    test01    test02  age02_mark
0   Bob     1  NaN     14  ...  140.5  1.000000  1.000000      Minors
1  LiSa     2   28     26  ...  120.8  2.123457  2.123457      Adults
2  Mary         38     24  ...  169.4  3.123457  3.123457      Adults
3  Alan  None           6  ...  155.6  4.123457  4.123457      Minors
 
[4 rows x 12 columns]

实习代码

import pandas as pd
import numpy as np
 
contents={"name": ['Bob',    'LiSa',           'Mary',            'Alan'],
     "ID":  [1,       2,             ' ',             None],  # 输出 NaN
     "age": [np.nan,    28,              38 ,             '' ],  # 输出 
     "age02": [14,      26,              24 ,             6], 
    "born": [pd.NaT,   pd.Timestamp("1990-01-01"), pd.Timestamp("1980-01-01"),    ''],   # 输出 NaT
     "sex": ['男',     '女',            '女',            None,],  # 输出 None
     "hobbey":['打篮球',   '打羽毛球',          '打乒乓球',          '',],  # 输出 
     "money":[200.0,        240.0,          290.0,           300.0], # 输出
     "weight":[140.5,        120.8,         169.4,           155.6], # 输出
     "test01":[1,  2.123456789,    3.123456781011126,  4.123456789109999],  # 输出
     "test02":[1,  2.123456789,    3.123456781011126,  4.123456789109999],  # 输出
     }
data_frame = pd.DataFrame(contents)
 
 
 
# T1、直接创建 category类型数据
weight_mark=pd.Categorical(['thin','medium','medium','fat'],categories=['medium','fat'])
print(weight_mark)
 
 
 
# T2、利用分箱机制(结合max、mean、min实现二分类)动态添加 category类型数据
col_age_des=pd.Series(data_frame['age02']).describe()
age_ranges=[col_age_des['min']-1,col_age_des['mean'],col_age_des['max']+1]
age_labels=['Minors','Adults']        # 高于平均值的为胖
data_frame['age02_mark']=pd.cut(data_frame['age02'],age_ranges,labels=age_labels)
print(data_frame)

到此这篇关于详细介绍在pandas中创建category类型数据的几种方法的文章就介绍到这了,更多相关pandas创建category内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Django REST framework 限流功能的使用

    Django REST framework 限流功能的使用

    DRF常用功能的案例基本用法都有讲解,关于限流(Throttling)这个功能其实在真实的业务场景中能真正用到的其实不算多。今天说这个话题其实一方面是讨论功能,另一方面也是希望换个角度去审视我们的开发过程,希望大家可以在使用DRF功能的同时,也了解一下功能背后的实现
    2021-06-06
  • Python容错的前缀树实现中文纠错

    Python容错的前缀树实现中文纠错

    本文使用 Python 实现了前缀树,并且支持编辑距离容错的查询。文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-07-07
  • Python3列表删除的三种方式实现

    Python3列表删除的三种方式实现

    本文主要介绍了Python3列表删除的三种方式实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-08-08
  • Python实现GUI计算器(附源码)

    Python实现GUI计算器(附源码)

    这篇文章主要为大家详细介绍了如何利用Python语言实现GUI计算器,可执行复杂运算,文中的示例代码讲解详细,具有一定的借鉴价值,需要的可以参考一下
    2022-11-11
  • python如何将空格分隔输入两个数

    python如何将空格分隔输入两个数

    这篇文章主要介绍了python如何将空格分隔输入两个数问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-02-02
  • Python计算机视觉SIFT尺度不变的图像特征变换

    Python计算机视觉SIFT尺度不变的图像特征变换

    这篇文章主要为大家介绍了Python计算机视觉SIFT尺度不变的图像特征变换,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • python数据结构之栈、队列及双端队列

    python数据结构之栈、队列及双端队列

    在上一章的学习中,我们主要学习了怎么去衡量一个算法的好坏,比较常见的方式是使用大O记法,就是所谓的时间复杂度,这一章节我来学习基本的数据结构,如栈、队列和双端队列等等。感兴趣的小伙伴可以参考一下
    2021-12-12
  • python机器学习之神经网络

    python机器学习之神经网络

    这篇文章主要介绍了python机器学习之神经网络,文中有非常详细的代码示例,对正在学习python的小伙伴们有很好地帮助,需要的朋友可以参考下
    2021-04-04
  • Pycharm中新添加或者导入项目文件名红色的解决方法

    Pycharm中新添加或者导入项目文件名红色的解决方法

    Pycharm的代码中添加新的文件夹,发现文件夹下的文件名是红色的,遇到这样的问题如何解决呢,下面小编给大家带来了Pycharm中新添加或者导入项目文件名红色的解决方法,感兴趣的朋友一起看看吧
    2023-12-12
  • Python中的字符串类型基本知识学习教程

    Python中的字符串类型基本知识学习教程

    这篇文章主要介绍了Python中的字符串类型基本知识学习教程,包括转义符和字符串拼接以及原始字符串等基础知识讲解,需要的朋友可以参考下
    2016-02-02

最新评论