Python机器学习iris数据集预处理和模型训练方式

 更新时间:2024年10月17日 10:13:42   作者:SuperYiY  
iris数据集包含150个样本,每个样本有4个特征及其类别信息,本文介绍了iris数据集的基本操作和如何使用knn模型进行花卉种类预测,是机器学习中的经典案例,适用于监督式学习

一、iris数据集简介

iris数据集的中文名是安德森鸢尾花卉数据集,英文全称是Anderson`s Iris data set。iris包含150个样本,对应数据集的每行数据。

每行数据包含每个样本的四个特征和样本的类别信息,所以iris数据集是一个150行5列的二维表。

通俗地说,iris数据集是用来给花做分类的数据集,每个样本包含了花萼长度、花萼宽度、花瓣长度、花瓣宽度四个特征(前4列),我们需要建立一个分类器,分类器可以通过样本的四个特征来判断样本属于山鸢尾(setosa)、变色鸢尾(versicolor)、维吉尼亚鸢尾(virginica)这三个名词都是花的品种。iris的每个样本都包含了品种信息,即目标属性(第5列,也叫target或label)

如图所示部分数据:

iris在机器学习中的应用:

  1. 属于监督式学习应用:根据花的四个特征预测鸢尾花卉属于(iris-setosa,iris-versicolour,iris-virginica)中的那一品种。
  2. 机器学习中经典案例,简单而具有代表性。

二、基本数据操作和模型训练

1.加载iris数据集

# iris数据集加载
from sklearn import datasets
iris = datasets.load_iris()

2.展示所有数据

#展示数据
print(iris.data
    )

3.展示每列的属性名

print(iris.feature_names)

4.展示输出目标结果以及结果的含义

print(iris.target)
print(iris.target_names)

5.查看输入和输出数据类型

print(type(iris.data))
print(type(iris.target))

6.确认行列维度

print(iris.data.shape)
print(iris.target.shape)

7.给x,y赋值

X =iris.data
Y = iris.target

8.利用knn模型进行预测结果

from sklearn.neighbors import KNeighborsClassifier
#创建实例,假设k值为1
knn = KNeighborsClassifier(n_neighbors=1)
#训练数据集模型
knn.fit(x,y)

9.给定特征的值预测花的品种

#预测某种花的品种
knn.predict([[1,2,3,4]])

得到数组的数据 “2” ,它代表的是花萼长度为1、花萼宽度为2、花瓣长度为3、花瓣宽度为4的鸢尾花卉预测结果的品种是第三种:维吉尼亚鸢尾(virginica)

#多种花的预测
x_test = [[1,2,3,4],[2,4,1,2]]
knn.predict(x_test)
`

得到数组的数据 “2” 和 “0”,它代表的是

  • 花萼长度为1、花萼宽度为2、花瓣长度为3、花瓣宽度为4的鸢尾花卉预测结果的品种是第三种:维吉尼亚鸢尾(virginica)
  • 花萼长度为2、花萼宽度为4、花瓣长度为1、花瓣宽度为2的鸢尾花卉预测结果的品种是第一种:山鸢尾(setosa)

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python使用psutil对系统数据进行采集监控

    Python使用psutil对系统数据进行采集监控

    psutil库可以实时获取系统的一些信息,这样就可以达到实时监控系统的目的。本文对详细讲解了ython使用psutil对系统数据进行采集监控,感兴趣的朋友可以看一看
    2021-08-08
  • Python hashlib模块与哈希算法保护数据完整性教程

    Python hashlib模块与哈希算法保护数据完整性教程

    hashlib模块为Python提供了一种简便的方式来使用各种哈希算法,如MD5、SHA-1、SHA-256等,哈希函数广泛用于密码学、数据完整性验证和安全存储等领域
    2024-01-01
  • python多进程日志以及分布式日志的实现方式

    python多进程日志以及分布式日志的实现方式

    这篇文章主要介绍了python多进程日志以及分布式日志的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-06-06
  • python二叉树常用算法总结

    python二叉树常用算法总结

    这篇文章主要分享的是python二叉树常用算法,二叉树的递归思想很重要,还有递归的复杂度分析,需下面文章就来详细解说该算法,要的朋友可以参考一下
    2021-09-09
  • Python2.7下安装Scrapy框架步骤教程

    Python2.7下安装Scrapy框架步骤教程

    本篇文章主要介绍了Python2.7下安装Scrapy框架步骤教程,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-12-12
  • 利用Python获取赶集网招聘信息前篇

    利用Python获取赶集网招聘信息前篇

    这篇文章主要为大家分享了如何利用Python获取赶集网招聘信息的前一篇内容,感兴趣的小伙伴们可以参考一下
    2016-04-04
  • Python 虚拟环境迁移到其他电脑的实现

    Python 虚拟环境迁移到其他电脑的实现

    本文主要介绍了Python 虚拟环境迁移到其他电脑的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-04-04
  • Python使用Numpy模块读取文件并绘制图片

    Python使用Numpy模块读取文件并绘制图片

    这篇文章主要介绍了Python使用Numpy模块读取文件并绘制图片,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-05-05
  • Python自动检测requests所获得html文档的编码

    Python自动检测requests所获得html文档的编码

    这篇文章主要为大家详细介绍了如何通过Python自动检测requests实现获得html文档的编码,文中的示例代码讲解详细,感兴趣的可以了解下
    2024-11-11
  • pandas调整列的顺序以及添加列的实现

    pandas调整列的顺序以及添加列的实现

    这篇文章主要介绍了pandas调整列的顺序以及添加列的实现操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03

最新评论