pandas数据处理之 标签列字符转数字的实现

 更新时间:2021年03月18日 11:14:34   作者:wx740851326  
这篇文章主要介绍了pandas数据处理之 标签列字符转数字的实现方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

机器学习中,当我们在进行数据预处理的时候,对于标签列非字符的数据,我们往往需要将其转换成字符,因为有的算法可能不支持非数字类型来做特征。

那么怎么快捷地来着这个转换呢,请看我的示例:

1.构建测试数据

import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

2.数据转换下,并获取标签列的字典

df = pd.DataFrame(array,columns=['status'])
status_dict = df['status'].unique().tolist()

3.使用函数进行转换

df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

这样,就将标签列处理好了哈

等用完之后,再转回来

df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

补充:pandas factorize将字符串特征转化为数字特征

将原始数据中的字符串特征转化为模型可以识别的数字特征可是使用pandas自带的factorzie方法。

原始数据的job特征值如下

都是字符串特征,无法用于训练,当然可以单独建立map硬编码处理,但是pandas已经封装好了相应的方法。

data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

相关文章

  • python实现随机加减法生成器

    python实现随机加减法生成器

    这篇文章主要为大家详细介绍了python实现随机加减法生成器,练手小项目,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-02-02
  • cmd输入python命令无反应的解决方案

    cmd输入python命令无反应的解决方案

    这篇文章主要介绍了cmd输入python命令无反应的解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-02-02
  • python中字典增加和删除使用方法

    python中字典增加和删除使用方法

    这篇文章主要介绍了python中字典增加和删除使用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-09-09
  • 对Python使用mfcc的两种方式详解

    对Python使用mfcc的两种方式详解

    今天小编就为大家分享一篇对Python使用mfcc的两种方式详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • matplotlib调整子图间距,调整整体空白的方法

    matplotlib调整子图间距,调整整体空白的方法

    今天小编就为大家分享一篇matplotlib调整子图间距,调整整体空白的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-08-08
  • Python实现IP代理批量采集的示例代码

    Python实现IP代理批量采集的示例代码

    这篇文章主要为大家详细介绍了如何利用Python实现IP代理批量采集,并检测代理是否可用。文中的示例代码讲解详细,需要的可以参考一下
    2022-09-09
  • python如何利用cv2模块读取显示保存图片

    python如何利用cv2模块读取显示保存图片

    cv2模块还是一个可以进行跨平台的视觉库,可以进行人脸识别,经常在机器上被广泛应用,这篇文章主要介绍了python利用cv2读取显示保存图片的相关资料,需要的朋友可以参考下
    2021-06-06
  • python GUI库图形界面开发之PyQt5窗口背景与不规则窗口实例

    python GUI库图形界面开发之PyQt5窗口背景与不规则窗口实例

    这篇文章主要介绍了python GUI库图形界面开发之PyQt5窗口背景与不规则窗口实例,需要的朋友可以参考下
    2020-02-02
  • Python Pandas读写txt和csv文件的方法详解

    Python Pandas读写txt和csv文件的方法详解

    这篇文章主要为大家详细介绍了Python Pandas实现读写txt和csv文件查找的方法,文中的示例代码积极性,感兴趣的小伙伴可以跟随小编一起了解一下
    2022-09-09
  • Python实现遍历数据库并获取key的值

    Python实现遍历数据库并获取key的值

    本文给大家分享的是Python实现遍历数据库并获取key的值的方法,主要是使用for循环来实现,有需要的小伙伴可以参考下。
    2015-05-05

最新评论