R语言实现广义线性回归模型

 更新时间:2021年08月11日 11:11:15   作者:一天_pika  
本文主要介绍了R语言实现广义线性回归模型,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

广义线性模型(GLM)是常见正态线性模型的直接推广,它可以适用于连续数据和离散数据,特别是后者,如属性数据、计数数据。这在应用上,尤其是生物、医学、经济和社会数据的统计分析上,有着重要意义。

对于广义线性模型应有一下三个概念:

  • 第一是线性自变量,它表明第i个响应变量的期望值E(yi)只能通过线性自变量βTxi而依赖于xi,其中如通常一样,β是未知参数的(p+1)x1向量,可能包含截距。
  • 第二是连续函数,它说明线性自变量和E(yi)的关系,给出了线性模型的推广。
  • 第三是误差函数,它说明广义线性模型的最后一部分随机成分。

我们保留样本为相互独立的假设,但去掉可加和正态误差的假设。可以从指数型分布族中作选一个作为误差函数。

1 与广义线性模型有关的R函数

R软件提供了拟合计算广义线性模型的函数glm(),其命令格式如下:

image

其中:

  • formula是拟合公式,这里的意义与线性模型相同,
  • family是分布族,即前面讲到的广义线性模型的种类,如正态分布,Poisson分布,二项分布等。
  • data是数据框,这里的意义与线性模型相同。

对于每个分布族(family),提供了相应的连接函数,如表6.12所示:

image

有了这些分布族和连接函数,我么就可以完成相应的广义线性模型的拟合问题。

2 正态分布族

正态分布族的使用方法是:

image

式中link=identity可以不写,因为正态分布族的连接函数缺省值是恒等(identity)。事实上,整个参数family = gaussian也可以不写,因为分布族的缺省值就是正态分布。

从表6.11可以看出,正态分布族的广义线性模型实际上与线性模型是相同的,也就是说:

image

与线性模型

image

有完全相同的计算结果,但效率却低的多。

3 二项分布族

在二项分布族中,logistic回归模型是最重要的模型。在某些回归问题中,相应变量使分类的,经常是或者成功,或者失败。对于这些问题,正态线性模型显然是不合适的,因为正态误差不对应一个0-1相应。在这种情况下,可用一种重要的方法称为logistic回归。

用R软件计算logistic回归模型的公式为:

image

式中link=logit可以不写,因为logit是二项分布族连接函数是缺省状态。

在用glm()函数做logistic回归模型使,对于公式formula有两种输入方法,一种是输入成功和失败的次数,另一种像线性模型通常数据的输入方式。

例  R. Norell实验

为研究高压电线对牲畜的影响,R.Norell研究小的电流对农场动物的影响。他在实验中,选择了7头,6种电流强度,0,1,2,3,4,5毫安。每头牛被点击30下,每种强度5下,按随机的次序进行。然后重复整个实验,每头牛总共被点击60下。对每次电击,相应变量——嘴巴运动,或者出现,或者未出现。表6.13中的数据给出每种电击强度70次实验中相应的总次数。试分析电击对牛的影响。

image

解:用数据框形式输入数据,在构造矩阵,一列是成功(响应)的次数,另一列是失败(不响应)的次数,然后在做logistic回归。其程序如下:

首先构造出的数据框如下:

image

对构造好的数据框进行处理如下:

image

构建logistic模型如下:

image

image

与线性回归模型相同,在得到回归模型后,可以作出预测。例如,当电流强度为3.5毫安时,有相应的牛的概率为多少?

image

即:74.26%。

可以作出控制,如有50%的牛有相应,其电流强度为多少?

image

即:2.65毫安的电流强度,可以使50%的牛有响应。

最后画出相应的比例与logistic回归曲线。R软件的绘图命令如下:

image

在程序中,d是给出曲线横坐标的点,pre是计算预测值,p是相应的预测概率。用plot函数和lines函数给出散点图和对应的预测曲线。

到此这篇关于R语言实现广义线性回归模型的文章就介绍到这了,更多相关R语言 广义线性回归模型内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • R语言格式化输出sprintf实例讲解

    R语言格式化输出sprintf实例讲解

    这篇文章主要介绍了R语言格式化输出sprintf实例讲解,文中代码实例讲解的很清楚,有需要的同学可以研究下
    2021-03-03
  • R语言交叉验证的实现代码

    R语言交叉验证的实现代码

    这篇文章主要介绍了R语言交叉验证的实现,本文通过示例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-03-03
  • R语言绘图如何支持中文

    R语言绘图如何支持中文

    这篇文章主要介绍了R语言绘图如何支持中文,帮助大家更好的理解和学习使用R语言,感兴趣的朋友可以了解下
    2021-03-03
  • R语言数据框合并(merge)的几种方式小结

    R语言数据框合并(merge)的几种方式小结

    这篇文章主要介绍了R语言数据框合并(merge)的几种方式小结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-03-03
  • R语言数组实例用法及知识点总结

    R语言数组实例用法及知识点总结

    在本文里,我们给大家整理的是关于R语言数组的相关知识点,有兴趣的朋友们可以跟着学习参考下。
    2021-04-04
  • R语言-summary()函数的用法解读

    R语言-summary()函数的用法解读

    这篇文章主要介绍了R语言-summary()函数的用法解读,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04
  • R语言列表和数据框的具体使用

    R语言列表和数据框的具体使用

    本文主要介绍了R语言列表和数据框的具体使用,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-01-01
  • R语言数据可视化学习之图形参数修改详解

    R语言数据可视化学习之图形参数修改详解

    这篇文章主要给大家介绍了关于R语言数据可视化学习之图形参数修改的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-03-03
  • 使用R中merge()函数合并数据的方法

    使用R中merge()函数合并数据的方法

    这篇文章主要介绍了使用R中merge()函数合并数据,本文详细介绍R中merge()函数参数及合并数据类型,利用sql的表连接概念进行类比,简单易懂,需要的朋友可以参考下
    2023-03-03
  • R语言-如何循环读取excel并保存为RData

    R语言-如何循环读取excel并保存为RData

    这篇文章主要介绍了R语言循环读取excel并保存为RData的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04

最新评论