python机器学习逻辑回归随机梯度下降法

 更新时间:2021年11月13日 15:46:34   作者:RDSunday  
这篇文章主要为大家介绍了python机器学习逻辑回归随机梯度下降法的详细讲解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步

写在前面

随机梯度下降法就在随机梯度上。意思就是说当我们在初始点时想找到下一点的梯度,这个点是随机的。全批量梯度下降是从一个点接着一点是有顺序的,全部数据点都要求梯度且有顺序。

全批量梯度下降虽然稳定,但速度较慢;

SGD虽然快,但是不够稳定

随机梯度下降法

随机梯度下降法(Stochastic Gradient Decent,
SGD)是对全批量梯度下降法计算效率的改进算法。本质上来说,我们预期随机梯度下降法得到的结果和全批量梯度下降法相接近;SGD的优势是更快地计算梯度。

代码

'''
随机梯度下降法(Stochastic Gradient Decent, SGD)
是对全批量梯度下降法计算效率的改进算法。本
质上来说,我们预期随机梯度下降法得到的结果和全批量梯度下降法相接近;
SGD的优势是更快地计算梯度。
'''
import pandas as pd
import numpy as np
import os
os.getcwd()
# F:\\pythonProject3\\data\\data\\train.csv
# dataset_path = '..'
# 这是一个全批量梯度下降(full-batch gradient descent)的应用。
# 这个问题是一个回归问题
# 我们给出美国某大型问答社区从2010年10月1日到2016年11月30日,
# 每天新增的问题的个数和回答的个数。
# 任务是预测2016年12月1日到2017年5月1日,该问答网站每天新增的问题数和回答数。
train = pd.read_csv('..\\train.csv')
# 导入数据
# train = pd.read_csv('train.csv')
test = pd.read_csv('..\\test.csv')
submit = pd.read_csv('..\\sample_submit.csv')
path1=os.path.abspath('.')
print("path1@@@@@",path1)
path2=os.path.abspath('..')
print("path2@@@@@",path2)
print(train)
# 初始设置
beta = [1,1] #初始点
alpha = 0.2 #学习率,也就是步长
tol_L = 0.1 #阈值,也就是精度
# 对x进行归一化,train 是训练数据的二维表格
max_x = max(train['id']) #max_x是总共的id数
x = train['id'] / max_x #所有的id都除于max_x
y = train['questions'] # train二维表格中的questions列赋给y
type(train['id'])
print("train['id']#######\n",train['id'])
print("type(train['id'])###\n\n",x)
print("max_x#######",max_x)
#为了计算方向
def compute_grad_SGD(beta, x, y):
    '''
    :param beta: 是初始点
    :param x: 是自变量
    :param y: 是真是值
    :return: 梯度数组
    '''
    grad = [0, 0]
    r = np.random.randint(0, len(x)) #在0-len(x)之间随机生成一个数
    grad[0] = 2. * np.mean(beta[0] + beta[1] * x[r] - y[r]) #求beta[1,1],中第1个数的梯度
    grad[1] = 2. * np.mean(x * (beta[0] + beta[1] * x - y))#求beta[1,1],中第2个数的梯度
    return np.array(grad)
#为了计算下一个点在哪,
def update_beta(beta, alpha, grad):
    '''
    :param beta: 第一点,初始点
    :param alpha: 学习率,也就时步长
    :param grad: 梯度
    :return:
    '''
    new_beta = np.array(beta) - alpha * grad
    return new_beta
# 定义计算RMSE的函数
# 均方根误差(RMSE)
def rmse(beta, x, y):
    squared_err = (beta[0] + beta[1] * x - y) ** 2 # beta[0] + beta[1] * x是预测值,y是真实值,
    res = np.sqrt(np.mean(squared_err))
    return res
# 进行第一次计算
grad = compute_grad_SGD(beta, x, y) #调用计算梯度函数,计算梯度
loss = rmse(beta, x, y) #调用损失函数,计算损失
beta = update_beta(beta, alpha, grad) #更新下一点
loss_new = rmse(beta, x, y) #调用损失函数,计算下一个损失
# 开始迭代
i = 1
while np.abs(loss_new - loss) > tol_L:
    beta = update_beta(beta, alpha, grad)
    grad = compute_grad_SGD(beta, x, y)
    if i % 100 == 0:
        loss = loss_new
        loss_new = rmse(beta, x, y)
        print('Round %s Diff RMSE %s'%(i, abs(loss_new - loss)))
    i += 1
print('Coef: %s \nIntercept %s'%(beta[1], beta[0]))
res = rmse(beta, x, y)
print('Our RMSE: %s'%res)
from sklearn.linear_model import LinearRegression
lr = LinearRegression()
lr.fit(train[['id']], train[['questions']])
print('Sklearn Coef: %s'%lr.coef_[0][0])
print('Sklearn Coef: %s'%lr.intercept_[0])
res = rmse([936.051219649, 2.19487084], train['id'], y)
print('Sklearn RMSE: %s'%res)

参考文献

随机梯度下降法

相关文章

  • python eventlet绿化和patch原理

    python eventlet绿化和patch原理

    这篇文章主要介绍了python eventlet绿化和patch原理,帮助大家更好的理解和学习python eventlet工具的使用,感兴趣的朋友可以了解下
    2020-11-11
  • 如何使用python记录室友的抖音在线时间

    如何使用python记录室友的抖音在线时间

    这篇文章主要介绍了如何使用python记录室友的抖音在线时间,本文通过实例代码图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-06-06
  • Python详解如何动态给对象增加属性和方法

    Python详解如何动态给对象增加属性和方法

    python是动态语⾔,动态编程语⾔是⾼级程序设计语⾔的⼀个类别,在计算机科学领域已被⼴泛应⽤。它是⼀类在 运⾏时可以改变其结构 的语⾔ :例如新的函数、对象、甚⾄代码可以被引进,已有的函数可以被删除或是其他结构上的变化
    2022-07-07
  • Python File(文件) 方法整理

    Python File(文件) 方法整理

    在本篇文章中我们给大家整理了关于Python File(文件) 的用法以及相关知识点,有兴趣的朋友们学习下。
    2019-02-02
  • Python实现括号匹配方法详解

    Python实现括号匹配方法详解

    这篇文章主要介绍了python实现括号匹配方法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-02-02
  • Python实现生成密码字典的方法示例

    Python实现生成密码字典的方法示例

    这篇文章主要介绍了Python实现生成密码字典的方法,结合实例形式详细分析了Python密码字典的实现方法及相关操作注意事项,涉及字符串运算、文件读写等相关操作技巧,需要的朋友可以参考下
    2019-09-09
  • python实现石头剪刀布小游戏

    python实现石头剪刀布小游戏

    这篇文章主要为大家详细介绍了python实现石头剪刀布小游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-01-01
  • Python入门教程之pycharm安装/基本操作/快捷键

    Python入门教程之pycharm安装/基本操作/快捷键

    这篇文章主要介绍了Python入门教程之pycharm安装/基本操作/快捷键,Python是一门非常强大好用的语言,也有着易上手的特性,本文为入门教程,需要的朋友可以参考下
    2023-04-04
  • 单利模式及python实现方式详解

    单利模式及python实现方式详解

    单例模式(Singleton Pattern)是一种常用的软件设计模式,该模式的主要目的是确保 某一个类只有一个实例存在.这篇文章主要介绍了单利模式及python实现方式及Python单例模式的4种实现方法,需要的朋友可以参考下
    2018-03-03
  • Python try except finally资源回收的实现

    Python try except finally资源回收的实现

    这篇文章主要介绍了Python try except finally资源回收的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01

最新评论