python实现最小二乘法的方法详解

 更新时间:2024年04月30日 11:17:10   作者:菜鸟08哥  
这篇文章主要介绍了如何基于python实现最小二乘法的方法,文中有非常详细的代码示例,对正在学习python的小伙伴们有非常好的帮助,需要的朋友可以参考下

本节用python实现最小二乘法。

1.最小二乘法

1.1 线性回归

  • 主要是解决线性问题,无法解决非线性问题。线性回归过程主要解决的是如何通过样本获取最佳的拟合线,最常用的方法是 最小二乘法

1.2 最小二乘法

ps:在古代,“平方”的称谓为“二乘”,故得最小二乘法。

2.2.1 数据拟合法和插值法
  • 数据拟合法不必过所有的数据点,关注数据的变化趋势。
  • 插值法必须经过所有的数据点。

1.2.1 原理

一种数学优化技术,通过最小化残差的平方和寻找数据的最佳函数匹配。在数理统计中,残差是指实际观察值与估计值之间的差。力求总的拟合误差(即总残差)达到最小。

1.2.2 最小二乘法的求解过程

在这里插入图片描述

1.2.3 python实现最小二乘法(预测学生身高体重为例)

拟合曲线

# 拟合曲线
import numpy as np
import matplotlib.pyplot as plt
import scipy as sp
from scipy.optimize import leastsq

# 样本数据
# 身高数据
Xi = np.array([162, 165, 159, 173, 157, 175, 161, 164, 172, 158])
# 体重数据
Yi = np.array([48, 64, 53, 66, 52, 68, 50, 52, 64, 49])


# 需要拟合的函数func()指定函数的形状
def func(p, x):
    k, b = p
    return k*x + b


# 定义偏差函数,x,y为数组中对应Xi,Yi的值
def error(p, x, y):
    return func(p, x) - y


# 设置k,b的初始值,可以任意设定,经过实验,发现p0的值会影响cost的值:Para[1]
p0 = [1, 20]

# 把error函数中除了p0以外的参数打包到args中,leastsq()为最小二乘法函数
Para = leastsq(error, p0, args=(Xi, Yi))
# 读取结果
k, b = Para[0]
print('k=', k, 'b=', b)

# 画样本点
plt.figure(figsize=(8, 6))
plt.scatter(Xi, Yi, color='red', label='Sample data', linewidth=2)

# 画拟合直线
x = np.linspace(150, 180, 80)
y = k * x + b

# 绘制拟合曲线
plt.plot(x, y, color='blue', label='Fitting Curve', linewidth=2)
plt.legend()  # 绘制图例

plt.xlabel('Height:cm', fontproperties='simHei', fontsize=12)
plt.ylabel('Weight:Kg', fontproperties='simHei', fontsize=12)

plt.show()

在这里插入图片描述

计算残差

# 计算残差
import numpy as np
import matplotlib.pyplot as plt
import scipy as sp
from scipy.optimize import leastsq
from statsmodels.graphics.api import qqplot

# 样本数据
# 身高数据
Xi = np.array([162, 165, 159, 173, 157, 175, 161, 164, 172, 158])
# 体重数据
Yi = np.array([48, 64, 53, 66, 52, 68, 50, 52, 64, 49])

# 定义变量
xy_res=[]
# 定义计算残差函数
def residual(x,y):
    res = y - (0.4211697*x-8.2883026)               # 计算残差
    return res                                      # 返回残差

# 循环读取残差
for d in range(0,len(Xi)):
    res = residual(Xi[d], Yi[d])
    xy_res.append(res)

print(xy_res)
# 计算残差平方和,和越小表明拟合的情况越好
xy_res_pingfangsum = np.dot(xy_res,xy_res)
print(xy_res_pingfangsum)

# 如果数据拟合模型效果好,残差应该遵从正态分布(0,d*d),d表示残差

# 画样本点
fig = plt.figure(figsize=(8, 6))
ax = fig.add_subplot(111)           # 添加一个子图
fig = qqplot(np.array(xy_res),line='q',ax=ax)  # 设置参数


plt.show()

在这里插入图片描述

PS:其中的fig.add_subplot(111),

111代表的是画布11的第一个区域。

222则代表22的第二个区域。

在这里插入图片描述

以上就是python实现最小二乘法的方法详解的详细内容,更多关于python最小二乘法的资料请关注脚本之家其它相关文章!

相关文章

  • python如何利用paramiko执行服务器命令

    python如何利用paramiko执行服务器命令

    这篇文章主要介绍了python如何利用paramiko执行服务器命令,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2020-11-11
  • PyQt5每天必学之关闭窗口

    PyQt5每天必学之关闭窗口

    这篇文章主要为大家详细介绍了PyQt5每天必学之关闭窗口,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-04-04
  • Python实现经典算法拓扑排序、字符串匹配算法和最小生成树实例

    Python实现经典算法拓扑排序、字符串匹配算法和最小生成树实例

    这篇文章主要介绍了Python实现经典算法拓扑排序、字符串匹配算法和最小生成树实例,拓扑排序、字符串匹配算法和最小生成树是计算机科学中常用的数据结构和算法,它们在解决各种实际问题中具有重要的应用价值,需要的朋友可以参考下
    2023-08-08
  • 学习Python爬虫前必掌握知识点

    学习Python爬虫前必掌握知识点

    这篇文章主要介绍了学习Python爬虫前,我们需要了解涉及爬虫的知识点,学习爬虫的知识点比较多,我们一起学习爬虫吧
    2021-04-04
  • Python语法糖遍历列表时删除元素方法示例详解

    Python语法糖遍历列表时删除元素方法示例详解

    这篇文章主要为大家介绍了Python语法糖遍历列表时删除元素详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-05-05
  • Python全局变量用法实例分析

    Python全局变量用法实例分析

    这篇文章主要介绍了Python全局变量用法,结合实例形式分析了Python中全局变量的定义、使用方法与相关注意事项,需要的朋友可以参考下
    2016-07-07
  • Python中循环后使用list.append()数据被覆盖问题的解决

    Python中循环后使用list.append()数据被覆盖问题的解决

    这篇文章主要给大家介绍了关于Python中循环后使用list.append()数据被覆盖问题的解决方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-07-07
  • python pandas写入excel文件的方法示例

    python pandas写入excel文件的方法示例

    这篇文章主要介绍了python pandas写入excel文件的方法示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-06-06
  • Python绘制饼图、圆环图的实例

    Python绘制饼图、圆环图的实例

    这篇文章主要介绍了Python绘制饼图、圆环图的实例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-02-02
  • Pytorch环境搭建与基本语法

    Pytorch环境搭建与基本语法

    这篇文章主要介绍了Pytorch环境搭建与基本语法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-06-06

最新评论