Python pandas数据合并merge函数用法详解

 更新时间:2023年07月26日 09:35:53   作者:只有你最牛  
这篇文章主要给大家介绍了关于Python pandas数据合并merge函数用法的相关资料,数据分析中经常会遇到数据合并的基本问题,文中通过示例代码介绍的非常详细,需要的朋友可以参考下

一、语法格式

介绍一下数据分析中很常用的一个函数——merge,它能够进行高效的数据合并操作。先看一下语法格式及其初步解释:

pd.merge(left: 'DataFrame | Series',  # 左右两个需要合并的DataFrame对象。  
         right: 'DataFrame | Series',
         how: 'str' = 'inner',  # 要执行的合并类型,从{'left','right','outer','inner','cross'}中取值,默认为'inner'。
         on: 'IndexLabel | None' = None,  # 用于连接的键(即列标签名),该键必须存在于左右两个DataFrame中。若没有指定,则以列名的交集作为连接键。
         left_on: 'IndexLabel | None' = None, 
         right_on: 'IndexLabel | None' = None,  # 指定左右DataFrame对象中作为连接键的列名。适用于左右拟连接列名称有差异时。
         left_index: 'bool' = False,
         right_index: 'bool' = False,  # 和上,将左右frame的索引作为连接键,进行数据合并。
         sort: 'bool' = False,  # DataFrame对象结果中,按词典顺序排序,默认False。
         suffixes: 'Suffixes' = ('_x', '_y'),  # 当左右DataFrame存在相同列名时,通过该参数为其添加后缀。
         copy: 'bool' = True,
         indicator: 'bool' = False,  # 输出结果中添加_merge列,表明每一行使用的左右键来源情况。
         validate: 'str | None' = None  # 验证连接键在左侧、右侧或两侧是否唯一,即'1:1','1:m','m:1'。
        )

二、举例解释

(一)首先生成两个DataFrame对象,以供我们案例使用:

dep_inf = {'部门':['业务一部','业务二部','业务三部','办公室'],
           '城市': ['深圳','上海','北京','广州'],
           '部门名称':['业务一部','业务二部','业务三部','办公室']}
emp_inf = {'姓名':['张飞','赵云','金莲','关习','和珅','宋江'],
           '学历':['本科','硕士','本科','本科','博士','硕士'],
           '部门':['业务一部','业务一部','业务二部','业务三部','业务三部','业务四部'],
           '城市':['北京','深圳','广州','上海','深圳','深圳']}
df_d = pd.DataFrame(dep_inf)
df_e = pd.DataFrame(emp_inf)

生成的两个DataFrame对象如下:

(二)下面举个栗子,介绍一下主要参数

1、参数left,right:

将df_d作为左侧的frame,df_e作为右侧的frame,则参数left=df_d,right=df_e;

2、参数how:

当参数how='left':仅使用左侧frame的键;当参数how='right':仅使用右侧frame的键;当参数how='outer':使用左右两侧frame的键的并集;当参数how='inner':使用左右两侧frame的键的交集;

3、参数on:

df_d,df_e中都有“部门”列(键),则使用“部门”作为连接键,即参数on='部门'。

下面就以“部门”作为连接键,顺便看一下参数how的效果。

pd.merge(df_d, df_e, how='left',on='部门',indicator=True)
pd.merge(df_d, df_e, how='right',on='部门',indicator=True)
pd.merge(df_d, df_e, how='inner',on='部门',indicator=True)
pd.merge(df_d, df_e, how='outer',on='部门',indicator=True)

4、参数indicator:

在输出结果中添加_merge列,表明每一行使用的左右键来源情况,如上图所示。

同时,可以看一下merge参数的结果_merge列加深对参数how的理解。

5、参数left_on,right_on:

这两个参数其实和参数'on'是同一性质,当左右两个frame的连接键的名字相同时,可以直接用参数‘on’。但是如果像本例中,左侧frame键名为“部门名称”(假设左侧frame中没有“部门这一列”),右侧frame键名为“部门”,但是其内容实质相同。此时就用left_on和right_on参数以替代参数on。

6、参数suffixes:

该参数默认suffixes = ('_x', '_y'),所以命令中未写。

当左右frame存在相同列名时,通过该参数为其添加后缀。因为左侧frame和右侧frame均有城市、部门列,因此为了防止相同列互相覆盖,给左右两侧的列加了后缀_x和_y以保留数据。当然这个_x和_y是默认后缀,你也可以根据需要修改为其他形式。

其他参数请参照本文第一部分:语法格式中的解释。

总结

到此这篇关于Python pandas数据合并merge函数用法的文章就介绍到这了,更多相关pandas数据合并merge函数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 详解用python生成随机数的几种方法

    详解用python生成随机数的几种方法

    这篇文章主要介绍了详解用python生成随机数的几种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-08-08
  • linux centos 7.x 安装 python3.x 替换 python2.x的过程解析

    linux centos 7.x 安装 python3.x 替换 python2.x的过程解析

    这篇文章主要介绍了linux centos 7.x 安装 python3.x 替换 python2.x的过程解析,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-12-12
  • 使用Python快速制作可视化报表的方法

    使用Python快速制作可视化报表的方法

    今天小编就为大家分享一篇使用Python快速制作可视化报表的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • 对python读写文件去重、RE、set的使用详解

    对python读写文件去重、RE、set的使用详解

    今天小编就为大家分享一篇对python读写文件去重、RE、set的使用详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • Django项目搭建之实现简单的API访问

    Django项目搭建之实现简单的API访问

    这篇文章主要给大家介绍了关于Django项目搭建之实现简单的API访问的相关资料,文中通过图文以及示例代码介绍的非常详细,对大家学习或者使用Django具有一定的参考学习价值,需要的朋友可以参考下
    2023-02-02
  • Python深度学习之Pytorch初步使用

    Python深度学习之Pytorch初步使用

    今天给大家整理了Python深度学习之Pytorch初步使用的有关知识,文中介绍的非常详细,对正在学习python的小伙伴们有很好的帮助,需要的朋友可以参考下
    2021-05-05
  • Python 游戏大作炫酷机甲闯关游戏爆肝数千行代码实现案例进阶

    Python 游戏大作炫酷机甲闯关游戏爆肝数千行代码实现案例进阶

    本篇文章给大家带来Python的一个游戏大制作—机甲闯关冒险,数千行代码实现的游戏,过程很详细,对大家的学习或工作具有一定的借鉴价值,需要的朋友可以参考下
    2021-10-10
  • python中in在list和dict中查找效率的对比分析

    python中in在list和dict中查找效率的对比分析

    今天小编就为大家分享一篇python中in在list和dict中查找效率的对比分析,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05
  • 基于Flask+websocket实现一个在线聊天室

    基于Flask+websocket实现一个在线聊天室

    在今天的互联网时代,实时通信成为了许多应用和服务的核心特色,在本文中,我们将介绍如何使用 Flask 和 Websockets 通过 Flask-SocketIO 框架创建一个简单的在线聊天室,感兴趣的可以跟随小编一起了解下
    2023-09-09
  • 使用Pytest.main()运行时参数不生效问题解决

    使用Pytest.main()运行时参数不生效问题解决

    本文主要介绍了使用Pytest.main()运行时参数不生效问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-02-02

最新评论