Python多元非线性回归及绘图的实现

 更新时间:2024年04月28日 14:58:33   作者:浩瀚地学  
本文主要介绍了Python多元非线性回归及绘图的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

在数字地形模型这门课做的一个小实验,代码实现的是以影像因子和地形要素为自变量,采样后的高程计算出的指标为因变量进行回归,本质上是通过curve_fit进行多元非线性回归,但是当时的要素偏多,需要写代码依次使用不同的自变量和因变量回归

环境:Python 3.9

部分数据截图

image-20240425231728608

代码逻辑

导入所需库和模块

# coding=gbk
# -*- coding = utf-8 -*-

import numpy as np
import pandas as pd
from scipy.optimize import curve_fit
import matplotlib.pyplot as plt
  • numpy:用于数值计算和数组操作。
  • pandas:用于读取和处理Excel数据。
  • scipy.optimize.curve_fit:用于非线性最小二乘拟合。
  • matplotlib.pyplot:用于绘制三维散点图和曲面。

定义非线性模型函数

def nonlinear_model(xy, a, b, c):
    x, y = xy
    return (a * x - b) * y + c

定义nonlinear_model函数,它接受两个坐标xy(包含x和y的元组)以及三个参数abc,即 (a * x - b) * y + c

设置数据源和变量

excel_file_path = 'E:\zbh.xlsx'    
df = pd.read_excel(excel_file_path)

x = 'R'
y = 'SOS'
z = 'MEAN'
x_data = np.array(df[x])
y_data = np.array(df[y])
z_data = np.array(df[z])

指定的Excel文件路径可以改改,读取变量RSOSMEAN的列数据,这里也需要根据数据本身来改

非线性回归与参数估计

popt, pcov = curve_fit(nonlinear_model, (x_data, y_data), z_data)
a_fit, b_fit, c_fit = popt
z_fit = nonlinear_model((x_data, y_data), a_fit, b_fit, c_fit)

使用scipy.optimize.curve_fit对给定的nonlinear_model函数进行拟合,传入观测到的(x_data, y_data)对和对应的z_data作为目标值。curve_fit返回最佳拟合参数popt和协方差矩阵pcov。接着,将最佳参数赋值给a_fitb_fitc_fit,并使用这些参数计算出所有数据点的拟合值z_fit

计算拟合优度指标和均方根误差

ss_total = np.sum((z_data - np.mean(z_data)) ** 2)
ss_reg = np.sum((z_fit - np.mean(z_data)) ** 2)
r_squared = ss_reg / ss_total
rmse = np.sqrt(np.mean((z_data - z_fit) ** 2))

print("R方:", r_squared)
print("RMSE:", rmse)

计算拟合优度指标(R方),均方根误差(RMSE),最后打印

构建拟合公式字符串

formula = "{} = ({:.2f} * {} + ({:.2f})) * {} + {:.2f}".format(z, a_fit, x, b_fit, y, c_fit)
print(formula)

用已得到的最佳参数和变量名构建最终的拟合公式,并保留两位小数精度。

绘制三维散点图和拟合曲面

fig = plt.figure(figsize=(6, 6))
ax = fig.add_subplot(111, projection='3d')

ax.scatter(x_data, y_data, z_data, color='blue', label='Data Points')
X, Y = np.meshgrid(np.linspace(min(x_data), max(x_data), 30),
                   np.linspace(min(y_data), max(y_data), 30))
Z = nonlinear_model((X.flatten(), Y.flatten()), a_fit, b_fit, c_fit).reshape(X.shape)
ax.plot_surface(X, Y, Z, color='r', alpha=0.6, label='Fitted Surface')

ax.set_xlabel(x)
ax.set_ylabel(y)
ax.set_zlabel(z)
plt.title(x +"-"+ y + "-" + z + ":" + formula)
plt.show()

计算Z值和绘图

完整代码

# coding=gbk
# -*- coding = utf-8 -*-

import numpy as np
import pandas as pd
from scipy.optimize import curve_fit
import matplotlib.pyplot as plt

# 定义非线性模型函数
def nonlinear_model(xy, a, b, c):
    x, y = xy
    return (a * x - b) * y + c

# 指定Excel文件路径并读取
excel_file_path = 'E:\zbh.xlsx'
df = pd.read_excel(excel_file_path)
x = 'R'
y = 'SOS'
z = 'MEAN'
x_data = np.array(df[x])
y_data = np.array(df[y])
z_data = np.array(df[z])

# 利用 curve_fit 进行非线性回归
popt, pcov = curve_fit(nonlinear_model, (x_data, y_data), z_data)
a_fit, b_fit, c_fit = popt
z_fit = nonlinear_model((x_data, y_data), a_fit, b_fit, c_fit)

# 计算指标
ss_total = np.sum((z_data - np.mean(z_data)) ** 2)
ss_reg = np.sum((z_fit - np.mean(z_data)) ** 2)
r_squared = ss_reg / ss_total
rmse = np.sqrt(np.mean((z_data - z_fit) ** 2))
print("R方:", r_squared)
print("RMSE:", rmse)
# 拟合公式
formula = "{} = ({:.2f} * {} + ({:.2f})) * {} + {:.2f}".format(z, a_fit, x, b_fit, y, c_fit)
print(formula)

# 绘制三维散点图和拟合曲面
fig = plt.figure(figsize=(6, 6))
ax = fig.add_subplot(111, projection='3d')

# 散点图
ax.scatter(x_data, y_data, z_data, color='blue', label='Data Points')
# 曲面图
X, Y = np.meshgrid(np.linspace(min(x_data), max(x_data), 30),
                   np.linspace(min(y_data), max(y_data), 30))
Z = nonlinear_model((X.flatten(), Y.flatten()), a_fit, b_fit, c_fit).reshape(X.shape)
ax.plot_surface(X, Y, Z, color='r', alpha=0.6, label='Fitted Surface')

ax.set_xlabel(x)
ax.set_ylabel(y)
ax.set_zlabel(z)
plt.title(x +"-"+ y + "-" + z + ":" + formula)
plt.show()

部分结果

image-20240425233029356

总结

由于这次实验用到的数据量较少,因此画图的效果感觉一般,趋势不明显,计算出的指标参考意义也有限,数据量大一点效果好坏会一目了然

参考

Matplotlib文档

Scipy Curve_fit文档

到此这篇关于Python多元非线性回归及绘图的实现的文章就介绍到这了,更多相关Python多元非线性回归内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python 虚拟机集合set实现原理及源码解析

    Python 虚拟机集合set实现原理及源码解析

    这篇文章主要为大家介绍了Python 虚拟机集合set实现原理及源码解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-03-03
  • OpenCV学习之图像加噪与滤波的实现详解

    OpenCV学习之图像加噪与滤波的实现详解

    这篇文章主要为大家详细介绍了OpenCV中图像的加噪与滤波操作的相关资料,文中的示例代码简洁易懂,具有一定的借鉴价值,需要的可以参考一下
    2023-02-02
  • 关于tensorflow中tf.keras.models.Sequential()的用法

    关于tensorflow中tf.keras.models.Sequential()的用法

    这篇文章主要介绍了关于tensorflow中tf.keras.models.Sequential()的用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-01-01
  • python中的格式化输出用法总结

    python中的格式化输出用法总结

    这篇文章主要介绍了python中的格式化输出用法,分析了Python格式化输出的种类并结合实例形式总结了针对浮点数的格式化输出方法,需要的朋友可以参考下
    2016-07-07
  • python递归函数用法详解

    python递归函数用法详解

    在本篇文章里小编给大家整理的是一篇关于python递归函数用法详解,有需要的朋友们可以参考学习下。
    2020-10-10
  • Win10搭建Pyspark2.4.4+Pycharm开发环境的图文教程(亲测)

    Win10搭建Pyspark2.4.4+Pycharm开发环境的图文教程(亲测)

    本文主要介绍了Win10搭建Pyspark2.4.4+Pycharm开发环境的图文教程(亲测),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-02-02
  • 提升Python代码质量巧妙整理包引入顺序

    提升Python代码质量巧妙整理包引入顺序

    在Python编程中,优化导入包的顺序可以提高代码的可读性、可维护性和性能,一个良好的导入顺序不仅使代码更易于理解,还可以帮助减少潜在的循环依赖和提高导入速度,本文将介绍如何快速、有效地优化Python导入包的顺序,并提供丰富的示例代码以帮助更好地理解
    2024-01-01
  • python实现简单俄罗斯方块游戏

    python实现简单俄罗斯方块游戏

    这篇文章主要为大家详细介绍了python实现简单俄罗斯方块游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-01-01
  • Python实现批量读取HDF多波段栅格数据并绘制像元直方图

    Python实现批量读取HDF多波段栅格数据并绘制像元直方图

    这篇文章主要为大家详细介绍了如何基于Python语言gdal模块,实现多波段HDF栅格图像文件的读取、处理与像元值可视化(直方图绘制)等操作,需要的可以参考一下
    2023-03-03
  • 浅谈python量化 双均线策略(金叉死叉)

    浅谈python量化 双均线策略(金叉死叉)

    这篇文章主要介绍了浅谈python量化 双均线策略(金叉死叉),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06

最新评论