Python实现SVM支持向量机的示例代码

更新时间：2023年02月06日 08:41:24 作者：梦想橡皮擦

SVM 的目的是在数据集中找到一条最佳分隔超平面，使得在这个超平面两侧的数据分别属于不同的类别，且该超平面与最近的数据点之间的距离最大。本文将通过Python实现SVM支持向量机，感兴趣的可以了解一下

什么是支持向量机

支持向量机（SVM），SVM 的目的是在数据集中找到一条最佳分隔超平面，使得在这个超平面两侧的数据分别属于不同的类别，且该超平面与最近的数据点之间的距离最大。

这些最近的数据点称为支持向量，因此该模型被称为支持向量机。

SVM 可以处理线性可分和线性不可分的情况，也可以通过使用核函数来处理非线性问题。

SVM 在解决分类问题时，通常是通过构造一个最大间隔分离超平面来实现的。

在回归问题中，SVM 通过构造一个回归超平面来实现预测。

SVM 的核心思想是利用数学方法将高维数据映射到低维空间，从而对不可分数据进行线性分类。

SVM 模型具有很好的泛化能力，可以解决高维数据的分类问题。

SVM 模型可以使用不同的核函数，如线性核、多项式核、高斯核等，这样可以解决非线性问题。此外，SVM 还可以处理大量特征数据，并具有高效的计算速度。

用 Python 实现 SVM

使用 scikit-learn 库实现 SVM 分类

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加载数据集
iris = datasets.load_iris()
X = iris["data"]
y = iris["target"]

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 创建 SVM 模型
model = SVC(kernel='linear', C=1, random_state=0)

# 训练模型
model.fit(X_train, y_train)

# 在测试集上进行预测
y_pred = model.predict(X_test)

# 计算预测精度
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

首先使用 load_iris() 函数加载 iris 数据集，然后使用 train_test_split() 函数将数据集划分为训练集和测试集。

接着，使用 SVC 函数创建一个 SVM 模型，并使用 fit() 函数在训练集上进行训练。

最后，使用 predict 函数在测试集上进行预测，并使用 accuracy_score() 函数计算预测精度。

多项式和高斯核函数的 SVM

使用高斯核函数的 SVM 可以如下实现：

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加载数据集
iris = datasets.load_iris()
X = iris["data"]
y = iris["target"]

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 创建 SVM 模型，使用高斯核函数
model = SVC(kernel='rbf', C=1, random_state=0)

# 训练模型
model.fit(X_train, y_train)

# 在测试集上进行预测
y_pred = model.predict(X_test)

# 计算预测精度
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

在上面的代码中，首先加载了 scikit-learn 中的 iris 数据集，并将其特征数据存储在 X 中，标签存储在 y 中。

使用 train_test_split() 函数划分出了训练集和测试集，并将其分别存储在 X_train ， X_test ， y_train ， y_test 中。

创建了一个 SVM 模型，使用了高斯核函数（Radial basis function, RBF）。参数 C 用于控制对误差的惩罚程度，数值越大，惩罚程度越大。参数 gamma 控制高斯核函数的影响范围，数值越小，影响范围越广。

使用 fit() 方法训练模型。训练后，使用 predict() 方法在测试集上进行预测，并将预测结果存储在 y_pred 中。

最终的结果将通过 accuracy_score() 函数计算预测精度，并将其打印出来。

还可以调整 SVM 模型的超参数以改变模型的表现，例如 C 和 gamma 。通过调整超参数可以使模型更加适合数据，并提高模型的预测精度。

到此这篇关于Python实现SVM支持向量机的示例代码的文章就介绍到这了,更多相关Python SVM支持向量机内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python将Excel表格按某列拆分为多个sheet实现过程
这篇文章主要为大家介绍了Python实现将Excel表格按某列拆分为多个sheet，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2023-05-05
Python matplotlib如何绘制各种流线图
在Python中不仅可以绘制折线图、柱状图、散点图等常规图外，还支持绘制量场图、频谱图、提琴图、箱型图等特殊图。本文将主要介绍如何绘制流线图，需要的朋友可以参考一下
2021-12-12
Python cookbook(数据结构与算法)对切片命名清除索引的方法
这篇文章主要介绍了Python cookbook(数据结构与算法)对切片命名清除索引的方法,结合实例形式分析了Python字符串截取及indices方法映射序列的相关操作技巧,需要的朋友可以参考下
2018-03-03
Python操作Elasticsearch处理timeout超时
这篇文章主要介绍了Python操作Elasticsearch处理timeout超时,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-07-07
Python中的 pass 占位语句
这篇文章主要介绍了Python中的 pass 占位语句，Python pass是空语句，是为了保持程序结构的完整性，下文具体的相关内容介绍需要的小伙伴可以参考一下
2022-04-04
Python参数传递由浅入深实例教程
这篇文章主要为大家介绍了Python参数传递由浅入深实例教程详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2023-11-11
python Multiprocessing.Pool进程池模块详解
multiprocessing模块提供了一个Process类来代表一个进程对象，multiprocessing模块像线程一样管理进程，这个是multiprocessing的核心，它与threading很相似，对多核CPU的利用率会比threading好的多
2022-10-10
Python统计列表元素出现次数的方法示例
这篇文章主要介绍了Python统计列表元素出现次数的方法示例，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-04-04
解析Python中while true的使用
这篇文章主要介绍了解析Python中while true的使用,while true即用来制造一个无限循环,需要的朋友可以参考下
2015-10-10
Python3 操作 MySQL 插入一条数据并返回主键 id的实例
这篇文章主要介绍了Python3 操作 MySQL 插入一条数据并返回主键 id的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-03-03