python类别数据数字化LabelEncoder VS OneHotEncoder区别

 更新时间:2022年09月13日 17:24:45   作者:HZ在掘金  
这篇文章主要为大家介绍了机器学习:数据预处理之将类别数据数字化的方法LabelEncoder VS OneHotEncoder区别详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

LabelEncoder 和 OneHotEncoder 是什么

- 在数据处理过程中,我们有时需要对不连续的数字或者文本进行数字化处理。
- 在使用 Python 进行数据处理时,用 encoder 来转化 dummy variable(虚拟数据)非常简便,encoder 可以将数据集中的文本转化成0或1的数值。
- LabelEncoder 和 OneHotEncoder 是 scikit-learn 包中的两个功能,可以实现上述的转化过程。
- sklearn.preprocessing.LabelEncoder
- sklearn.preprocessing.OneHotEncoder 

数据集中的类别数据

在使用回归模型和机器学习模型时,所有的考察数据都是数值更容易得到好的结果。
因为回归和机器学习都是基于数学函数方法的,所以当我们要分析的数据集中出现了类别数据(categorical data),此时的数据是不理想的,因为我们不能用数学的方法处理它们。

例如,在处理男和女两个性别数据时,我们用0和1将其代替,再进行分析。

由于这种情况的出现,我们需要可以将文字数字化的现成方法。

LabelEncoder 和 OneHotEncoder 的区别

具体代码

import pandas as pd
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.cross_validation import train_test_split
# 读取数据
data_df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/'
                 'breast-cancer-wisconsin/wdbc.data', header=None)
# 前面的数据是特征,最后一列是标签label
x, y = data_df.values[:, :-1], data_df.values[:, -1]
# 先实例化一个对象
encoder_x = LabelEncoder() 
# 对标签进行类别数据数字化
y = encoder_x.fit_transform( y )

以上就是python 数据数字化的方法LabelEncoder VS OneHotEncoder区别的详细内容,更多关于LabelEncoder VS OneHotEncoder的资料请关注脚本之家其它相关文章!

相关文章

  • 手把手教你用Python打造互动式中秋节庆祝小程序

    手把手教你用Python打造互动式中秋节庆祝小程序

    中秋节将至,本文提供了一个使用Python开发的中秋节庆祝小程序教程,通过简单的步骤,您可以创建一个具有节日祝福、互动式灯谜游戏和模拟中秋明月动态背景的小程序,文章详细介绍了程序的功能、实现步骤以及如何运行程序,需要的朋友可以参考下
    2024-09-09
  • PyTorch清理CPU缓存的实现步骤

    PyTorch清理CPU缓存的实现步骤

    在使用PyTorch进行深度学习时,频繁的数据和计算可能导致CPU缓存满载,影响性能和内存使用,适时清理CPU缓存有助于管理内存占用,下面就来介绍一下如何使用
    2024-09-09
  • Python实现为PDF大文件批量去除水印

    Python实现为PDF大文件批量去除水印

    在阅读过程中如果遇到一些带有水印的资料是比较烦心的,而市面上去水印的功能有多要收费且很不方便,那么,如何通过Python来对这类图片水印进行去除呢,本文就来和大家分享一下实现方法吧
    2023-05-05
  • 一行代码实现Python动态加载依赖

    一行代码实现Python动态加载依赖

    本文主要介绍了Python动态加载依赖,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-12-12
  • Python之reload流程实例代码解析

    Python之reload流程实例代码解析

    这篇文章主要介绍了Python之reload流程实例代码解析,分享了相关代码示例,小编觉得还是挺不错的,具有一定借鉴价值,需要的朋友可以参考下
    2018-01-01
  • Python 实现敏感目录扫描的示例代码

    Python 实现敏感目录扫描的示例代码

    这篇文章主要介绍了Python 实现敏感目录扫描的示例代码,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-05-05
  • python编程-将Python程序转化为可执行程序[整理]

    python编程-将Python程序转化为可执行程序[整理]

    python编程-将Python程序转化为可执行程序[整理]...
    2007-04-04
  • pygame实现贪吃蛇游戏(上)

    pygame实现贪吃蛇游戏(上)

    这篇文章主要为大家详细介绍了pygame实现贪吃蛇游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-10-10
  • Python 迭代器与生成器实例详解

    Python 迭代器与生成器实例详解

    这篇文章主要介绍了Python 迭代器与生成器实例详解的相关资料,需要的朋友可以参考下
    2017-05-05
  • python中使用ctypes调用so传参设置遇到的问题及解决方法

    python中使用ctypes调用so传参设置遇到的问题及解决方法

    这篇文章主要介绍了python中使用ctypes调用so传参设置,本文较详细的给大家介绍了遇到问题及解决方案,需要的朋友可以参考下
    2019-06-06

最新评论