pandas使用get_dummies进行one-hot编码的方法

 更新时间:2018年07月10日 10:21:23   作者:BYR_jiandong  
今天小编就为大家分享一篇pandas使用get_dummies进行one-hot编码的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码
pd.get_dummies(df)

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

您可能感兴趣的文章:

相关文章

  • Python生成随机数的方法详解(最全)

    Python生成随机数的方法详解(最全)

    Python生成随机数的方法有很多,譬如random模块、NumPy库、secrets模块等。本文为大家整理了五个生成随机数的方法(应该是最全的了吧),希望对大家有所帮助
    2023-02-02
  • django 常用orm操作详解

    django 常用orm操作详解

    下面小编就为大家带来一篇django 常用orm操作详解。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-09-09
  • tornado捕获和处理404错误的方法

    tornado捕获和处理404错误的方法

    这篇文章主要介绍了tornado捕获和处理404错误的方法,方法很简单,只要覆写write_error方法就可以,看下面的代码就明白了
    2014-02-02
  • Windows下Anaconda2安装NLTK教程

    Windows下Anaconda2安装NLTK教程

    这篇文章主要为大家详细介绍了Windows下Anaconda2安装NLTK的教程,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-09-09
  • 公认8个效率最高的爬虫框架

    公认8个效率最高的爬虫框架

    在本篇文章里小编给大家整理的是关于2020年8个效率最高的爬虫框架知识点,需要的朋友们可以学习下。
    2020-07-07
  • Python表格数据处理库之tablib库详解

    Python表格数据处理库之tablib库详解

    这篇文章主要介绍了Python表格数据处理库之tablib库详解,Tablib是一个用于处理电子表格数据的Python库,它可以轻松地进行数据的导入和导出,以及数据格式的转换,需要的朋友可以参考下
    2023-08-08
  • python调用系统ffmpeg实现视频截图、http发送

    python调用系统ffmpeg实现视频截图、http发送

    这篇文章主要为大家详细介绍了python调用系统ffmpeg实现视频截图、http发送,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • Python实现合并同一个文件夹下所有PDF文件的方法示例

    Python实现合并同一个文件夹下所有PDF文件的方法示例

    这篇文章主要介绍了Python实现合并同一个文件夹下所有PDF文件的方法,涉及Python针对pdf文件的读取、判断、解密、写入合并等相关操作技巧,需要的朋友可以参考下
    2018-04-04
  • PyTorch环境配置及安装过程

    PyTorch环境配置及安装过程

    这篇文章主要介绍了PyTorch环境配置及安装,本文通过图文实例代码相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-04-04
  • 解决python3中的requests解析中文页面出现乱码问题

    解决python3中的requests解析中文页面出现乱码问题

    requests是一个很实用的Python HTTP客户端库,编写爬虫和测试服务器响应数据时经常会用到。这篇文章给大家介绍了解决python3中的requests解析中文页面出现乱码问题,感兴趣的朋友一起看看吧
    2019-04-04

最新评论