基于pandas将类别属性转化为数值属性的方法

 更新时间:2018年07月25日 09:10:29   作者:chenpe32cp  
今天小编就为大家分享一篇基于pandas将类别属性转化为数值属性的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot 

编码

pd.get_dummies(df) 

以上这篇基于pandas将类别属性转化为数值属性的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python OpenCV图像指定区域裁剪的实现

    Python OpenCV图像指定区域裁剪的实现

    这篇文章主要介绍了Python OpenCV图像指定区域裁剪的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-10-10
  • Python实现单例模式的多种方法总结

    Python实现单例模式的多种方法总结

    单例模式是最常使用的一种设计模式,该模式的目的是确保在一个系统中,一个类只有一个实例,本文给大家介绍了Python实现单例模式的完整指南:原理、方法与最佳实践,需要的朋友可以参考下
    2025-04-04
  • 定位python内存泄漏问题及解决

    定位python内存泄漏问题及解决

    这篇文章主要介绍了定位python内存泄漏问题及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-11-11
  • python处理json数据中的中文

    python处理json数据中的中文

    这篇文章主要介绍了python处理json数据中的中文问题,需要的朋友可以参考下
    2014-03-03
  • Flask框架钩子函数功能与用法分析

    Flask框架钩子函数功能与用法分析

    这篇文章主要介绍了Flask框架钩子函数功能与用法,简单描述了flask框架钩子函数的概念、功能并结合实例形式分析了flask框架钩子函数的基本用法,需要的朋友可以参考下
    2019-08-08
  • Python 日期的转换及计算的具体使用详解

    Python 日期的转换及计算的具体使用详解

    这篇文章主要介绍了Python 日期的转换及计算的具体使用详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-01-01
  • python用700行代码实现http客户端

    python用700行代码实现http客户端

    这篇文章主要介绍了python用700行代码实现http客户端的方法,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2021-01-01
  • 详解在python操作数据库中游标的使用方法

    详解在python操作数据库中游标的使用方法

    这篇文章主要介绍了在python操作数据库中游标的使用方法,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-11-11
  • python输出带颜色字体实例方法

    python输出带颜色字体实例方法

    在本篇文章里小编给大家整理了关于python输出带颜色字体实例以及相关代码,有需要的朋友们可以学习参考下。
    2019-09-09
  • OpenCV图像缩放之cv.resize()函数详解

    OpenCV图像缩放之cv.resize()函数详解

    resize函数opencv中专门用来调整图像大小的函数,下面这篇文章主要给大家介绍了关于OpenCV图像缩放之cv.resize()函数的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-09-09

最新评论