对python sklearn one-hot编码详解
one-hot编码的作用
使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点
将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。
sklearn的一个例子
from sklearn import preprocessing enc = preprocessing.OneHotEncoder() enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]]) print(enc.n_values_)//每个特征对应的最大位数 print(enc.transform([[0,1,3]]).toarray()) print(enc.transform([[0,1,1]]).toarray())
上面代码enc.fit()里有一个4行3列的矩阵
1、每一列对应于一个样本的特征序列,即一个样本有三个特征
2、4行表明传入了4个样本
3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3
4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串
以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
相关文章
python验证码识别教程之灰度处理、二值化、降噪与tesserocr识别
这篇文章主要给大家介绍了关于python验证码识别教程之灰度处理、二值化、降噪与tesserocr识别的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面随着小编来一起学习学习吧2018-06-06
利用pycharm调试ssh远程程序并实时同步文件的操作方法
这篇文章主要介绍了利用pycharm调试ssh远程程序并实时同步文件的操作方法,本篇文章提供了利用pycharm远程调试程序的方法,且使用的编译器可以是服务器中的虚拟环境的编译器,可以实时同步本地与服务器的文件内容,需要的朋友可以参考下2022-11-11
Python实现PS滤镜特效Marble Filter玻璃条纹扭曲效果示例
这篇文章主要介绍了Python实现PS滤镜特效Marble Filter玻璃条纹扭曲效果,涉及Python基于skimage库实现图形条纹扭曲效果的相关操作技巧,需要的朋友可以参考下2018-01-01


最新评论