使用R中merge()函数合并数据的方法

 更新时间:2023年03月17日 11:08:47   作者:梦想画家  
这篇文章主要介绍了使用R中merge()函数合并数据,本文详细介绍R中merge()函数参数及合并数据类型,利用sql的表连接概念进行类比,简单易懂,需要的朋友可以参考下

使用R中merge()函数合并数据

在R中可以使用merge()函数去合并数据框,其强大之处在于在两个不同的数据框中标识共同的列或行。

如何使用merge()获取数据集中交叉部分

merge()最简单的形式为获取两个不同数据框中交叉部分。举例,获取cold.states和large.states完全匹配的数据。代码如下:

> merge(cold.states, large.states)
   Name Frost  Area
1  Alaska  152 566432
2 Colorado  166 103766
3 Montana  155 145587
4  Nevada  188 109889

如果你属性数据库语法SQL,你可能想merge()和数据库中JOIN功能很相似。确实如此,merge()函数的不同参数可以实现内join,left join,right join以及完整join。

merge()函数有很多参数,看起来非常吓人。但他们都几中类型参数有关:

  • x: 第一个数据框.
  • y: 第二个数据框.
  • by, by.x, by.y: 指定两个数据框中匹配列名称。缺省使用两个数据框中相同列名称。
  • all, all.x, all.y: 指定合并类型的逻辑值。缺省为false,all=FALSE (仅返回匹配的行).

最后一组参数all, all.x, all.y需要进一步解释,决定合并类型。

如何理解不同类型的合并

merge() 函数支持4种类型数据合并:

Natural join: 仅返回两数据框中匹配的数据框行,参数为:all=FALSE.

Full outer join: 返回两数据框中所有行, 参数为: all=TRUE.

Left outer join: 返回x数据框中所有行以及和y数据框中匹配的行,参数为: all.x=TRUE.

Right outer join: 返回y数据框中所有行以及和x数据框匹配的行,参数为: all.y=TRUE.

如何实现完整合并(full outer join)

返回示例数据中美国的州,执行完整合并cold和large state,使用参数all=TRUE.

> merge(cold.states, large.states, all=TRUE)
      Name Frost  Area
1     Alaska  152 566432
2    Arizona  NA 113417
3   California  NA 156361
....
13     Texas  NA 262134
14    Vermont  168   NA
15    Wyoming  173   NA

两个数据框有不同的名称,所以R基于两者state的name进行匹配。Frost来自cold.states数据框,Area来自large.states.

上面代码执行了完整合并,填充未匹配列值为NA。

总结

本文详细介绍R中merge()函数参数及合并数据类型。利用sql的表连接概念进行类比,简单易懂。

到此这篇关于使用R中merge()函数合并数据的文章就介绍到这了,更多相关R merge()函数合并数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • R语言数据可视化绘图Dot plot点图画法示例

    R语言数据可视化绘图Dot plot点图画法示例

    这篇文章主要为大家介绍了R语言数据可视化绘图Dot plot点图的画法示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步
    2022-02-02
  • R语言中文本文件分割 符号 sep的用法

    R语言中文本文件分割 符号 sep的用法

    这篇文章主要介绍了R语言中文本文件分割 符号 sep的用法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04
  • R语言-使用快捷键快速注释的实现

    R语言-使用快捷键快速注释的实现

    这篇文章主要介绍了R语言-使用快捷键快速注释的实现方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04
  • 详解R语言apply系列函数的使用

    详解R语言apply系列函数的使用

    R语言的循环效率并不高,所以并不推荐循环以及循环嵌套。为了实现循环功能的情况下,兼顾效率,R语言提供了apply系列函数,用于对规则的数据进行函数式的迭代处理,下面就来和大家聊聊它们的使用吧
    2023-03-03
  • R语言关于变量的知识点总结

    R语言关于变量的知识点总结

    在本篇文章里小编给大家整理了一篇关于R语言关于变量的知识点总结内容,有兴趣的朋友们可以学习下。
    2021-03-03
  • R语言绘制折线图实例分析

    R语言绘制折线图实例分析

    在本篇文章里小编给大家整理了一篇关于R语言绘制折线图实例分析内容,有需要的小伙伴可以跟着学习参考下。
    2021-04-04
  • R语言中因子相关知识点详解

    R语言中因子相关知识点详解

    在本篇内容里小编给大家总结了关于R语言中因子的相关知识点以及相关实例内容,有兴趣的朋友们可以学习下。
    2021-04-04
  • R语言控制结构知识点总结

    R语言控制结构知识点总结

    在本篇文章里小编给大家整理一篇关于R语言控制结构知识点总结内容,有兴趣的朋友们可以学习参考下。
    2021-03-03
  • 基于R语言 数据检验详解

    基于R语言 数据检验详解

    这篇文章主要介绍了R语言数据检验的相关知识,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-03-03
  • R语言-计算频数和频率的操作

    R语言-计算频数和频率的操作

    这篇文章主要介绍了R语言-计算频数和频率的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04

最新评论