python基于numpy的线性回归

 更新时间:2022年07月30日 09:46:09   作者:Giao哥不瘦到100不改名  
这篇文章主要为大家详细介绍了python基于numpy的线性回归,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

本文实例为大家分享了python基于numpy的线性回归的具体代码,供大家参考,具体内容如下

class类中包含:

创建数据
参数初始化
计算输出值,损失值,dw,db
预测函数
交叉验证函数

其中用到的数据集为sklearn中的糖尿病数据集

具体代码如下:

import numpy as np
from sklearn.utils import shuffle
from sklearn.datasets import load_diabetes
import matplotlib.pyplot as plt

#基于numpy实现一个简单的线性回归模型
#用class进行简单封装
class lr_model():
    def __init__(self):
        pass

    # diabetes 是一个关于糖尿病的数据集, 该数据集包括442个病人的生理数据及一年以后的病情发展情况。
    # 数据集中的特征值总共10项, 如下:
    # 年龄
    # 性别
    # 体质指数
    # 血压
    # s1,s2,s3,s4,s4,s6  (六种血清的化验数据)
    # 但请注意,以上的数据是经过特殊处理, 10个数据中的每个都做了均值中心化处理,然后又用标准差乘以个体数量调整了数值范围。验证就会发现任何一列的所有数值平方和为1.
    def prepare_data(self):
        data = load_diabetes().data
        target = load_diabetes().target
        #数据打乱
        X, y = shuffle(data, target, random_state=42)
        X = X.astype(np.float32)
        y = y.reshape((-1, 1))#标签变成列向量形式
        data = np.concatenate((X, y), axis=1)#横向变为数据标签的行向量
        return data
     #初始化参数,权值与偏执初始化
    def initialize_params(self, dims):
        w = np.zeros((dims, 1))
        b = 0
        return w, b

    def linear_loss(self, X, y, w, b):
        num_train = X.shape[0]#行数训练数目
        num_feature = X.shape[1]#列数表示特征值数目
        y_hat = np.dot(X, w) + b#y=w*x+b
        loss = np.sum((y_hat - y) ** 2) / num_train#计算损失函数
        dw = np.dot(X.T, (y_hat - y)) / num_train#计算梯度
        db = np.sum((y_hat - y)) / num_train
        return y_hat, loss, dw, db

    def linear_train(self, X, y, learning_rate, epochs):
        w, b = self.initialize_params(X.shape[1])#参数初始化
        loss_list = []
        for i in range(1, epochs):
            y_hat, loss, dw, db = self.linear_loss(X, y, w, b)
            w += -learning_rate * dw
            b += -learning_rate * db#参数更新
            loss_list.append(loss)
        if i % 10000 == 0:#每到一定轮数进行打印输出
            print('epoch %d loss %f' % (i, loss))
        #参数保存
        params = {
            'w': w,
            'b': b
        }
        grads = {
            'dw': dw,
            'db': db
        }
        return loss, params, grads,loss_list

    #预测函数
    def predict(self, X, params):
        w = params['w']
        b = params['b']
        y_pred = np.dot(X, w) + b
        return y_pred

   #随机交叉验证函数,如何选测试集、训练集
    def linear_cross_validation(self, data, k, randomize=True):
        if randomize:
            data = list(data)
            shuffle(data)
        slices = [data[i::k] for i in range(k)]#k为step
        for i in range(k):
            validation = slices[i]
            train = [data for s in slices if s is not validation for data in s]#将不为测试集的数据作为训练集
            train = np.array(train)
            validation = np.array(validation)
            yield train, validation#yield 变为可迭代,每次返回


if __name__ == '__main__':
    lr = lr_model()
    data = lr.prepare_data()
    for train, validation in lr.linear_cross_validation(data, 5):
        X_train = train[:, :10]
        y_train = train[:, -1].reshape((-1, 1))
        X_valid = validation[:, :10]
        y_valid = validation[:, -1].reshape((-1, 1))
        loss5 = []
        loss, params, grads,loss_list = lr.linear_train(X_train, y_train, 0.001, 100000)

        plt.plot(loss_list, color='blue')
        plt.xlabel('epochs')
        plt.ylabel('loss')
        plt.show()

        loss5.append(loss)
        score = np.mean(loss5)

        print('five kold cross validation score is', score)#5类数据的测试分数
        y_pred = lr.predict(X_valid, params)
        plt.scatter(range(X_valid.shape[0]),y_valid)
        plt.scatter(range(X_valid.shape[0]),y_pred,color='red')
        plt.xlabel('x')
        plt.ylabel('y')
        plt.show()

        valid_score = np.sum(((y_pred - y_valid) ** 2)) / len(X_valid)
        print('valid score is', valid_score)

结果如下:

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • python GUI库图形界面开发之PyQt5开发环境配置与基础使用

    python GUI库图形界面开发之PyQt5开发环境配置与基础使用

    这篇文章主要介绍了python GUI库图形界面开发之PyQt5开发环境配置与基础使用,需要的朋友可以参考下
    2020-02-02
  • PyTorch安装与基本使用详解

    PyTorch安装与基本使用详解

    这篇文章主要介绍了PyTorch安装与基本使用详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-08-08
  • 利用Python实现热力图的绘制

    利用Python实现热力图的绘制

    热力图,是一种通过对色块着色来显示数据的统计图表。绘图时,需指定颜色映射的规则。本文主要用Python来实现热力图的制作,需要的可以参考一下
    2022-09-09
  • python 中Mixin混入类的使用方法详解

    python 中Mixin混入类的使用方法详解

    这篇文章主要介绍了python 中Mixin混入类的使用方法详解,Mixin 混入也可以说是编程模式,并不是什么新的语法,用好混入类可以使自己的代码结构清晰,功能明了,所以以后在设计类时要多考虑使用Mixin混入类的实现方式
    2022-07-07
  • PyCharm上安装Package的实现(以pandas为例)

    PyCharm上安装Package的实现(以pandas为例)

    这篇文章主要介绍了PyCharm上安装Package的实现(以pandas为例),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-09-09
  • Matplotlib绘图基础之刻度详解

    Matplotlib绘图基础之刻度详解

    Matplotlib中刻度是用于在绘图中表示数据大小的工具,通常以整数或小数表示,具体取决于坐标轴的类型和限制,下面就为大家介绍一下Matplotlib中刻度是具体设置与使用吧
    2023-07-07
  • django vue3实现大文件分段续传(断点续传)

    django vue3实现大文件分段续传(断点续传)

    本文介绍了使用Django和Vue3实现大文件分段上传(断点续传)的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2025-01-01
  • Python3如何使用多线程升程序运行速度

    Python3如何使用多线程升程序运行速度

    这篇文章主要介绍了Python3如何使用多线程升程序运行速度,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-08-08
  • 使用python进行文本预处理和提取特征的实例

    使用python进行文本预处理和提取特征的实例

    今天小编就为大家分享一篇使用python进行文本预处理和提取特征的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • 解读卷积神经网络的人脸识别

    解读卷积神经网络的人脸识别

    这篇文章主要介绍了解读卷积神经网络的人脸识别问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-11-11

最新评论