详解Python3 pandas.merge用法

 更新时间:2019年09月05日 09:22:56   作者:Asher117  
pandas提供了一组高级的、灵活的、高效的核心函数,能够轻松的将数据规整化。这节主要对pandas合并数据集的merge函数进行详解,感兴趣的朋友跟随小编一起看看吧

摘要

数据分析与建模的时候大部分时间在数据准备上,包括对数据的加载、清理、转换以及重塑。pandas提供了一组高级的、灵活的、高效的核心函数,能够轻松的将数据规整化。这节主要对pandas合并数据集的merge函数进行详解。(用过SQL或其他关系型数据库的可能会对这个方法比较熟悉。)码字不易,喜欢请点赞!!!

1.merge函数的参数一览表

2.创建两个DataFrame

在这里插入图片描述

3.pd.merge()方法设置连接字段。

默认参数how是inner内连接,并且会按照相同的字段key进行合并,即等价于on=‘key'

在这里插入图片描述

也可以显示的设置on=‘key',这里也推荐这么做。

在这里插入图片描述

当两边合并字段不同时,可以使用left_on和right_on参数设置合并字段。当然这里合并字段都是key所以left_on和right_on参数值都是key。

在这里插入图片描述

4.pd.merge()方法设置连接方法。

主要包括inner(内连接)、outer(外链接)、left(左连接)、right(右连接)。

参数how默认值是inner内连接,上面的都是采用内连接,连接两边都有的值。

当采用outer外连接时,会取并集,并用NaN填充。

在这里插入图片描述

外连接其实左连接和右连接的并集。左连接是左侧DataFrame取全部数据,右侧DataFrame匹配左侧DataFrame。(右连接right和左连接类似)

在这里插入图片描述

5.pd.merge()方法索引连接,以及重复列名命名。

pd.merge()方法可以通过设置left_index或者right_index的值为True来使用索引连接,例如这里df1使用data1当连接关键字,而df2使用索引当连接关键字。

在这里插入图片描述

从上面可以发现两个DataFrame中都有key列,merge合并之后,pandas会自动在后面加上(_x,_y)来区分,我们也可以通过设置suffixes来设置名字。

在这里插入图片描述

总结

以上所述是小编给大家介绍的详解Python3 pandas.merge用法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

相关文章

  • Python中Array特性与应用实例深入探究

    Python中Array特性与应用实例深入探究

    这篇文章主要为大家介绍了Python中Array特性与应用实例深入探究,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2024-01-01
  • 使用用Pyspark和GraphX实现解析复杂网络数据

    使用用Pyspark和GraphX实现解析复杂网络数据

    GraphX是Spark提供的图计算API,它提供了一套强大的工具,这篇文章将详细为大家介绍如何在Python / pyspark环境中使用graphx进行图计算,感兴趣的可以了解下
    2024-01-01
  • 基于python的前后端分离的模拟实现

    基于python的前后端分离的模拟实现

    前后端分离核心是UI界面展示层(View)和数据处理层(Model)通过控制层(Controller)进行解耦合,在MVC设计模式中,前端主要负责数据展示和用户交互(View),后端处理业务逻辑和数据存储(Model),通过API接口进行通信,提高了开发效率,便于前后端分工合作,有利于代码的维护和迭代
    2024-10-10
  • 基于python+selenium自动健康打卡的实现代码

    基于python+selenium自动健康打卡的实现代码

    这篇文章主要介绍了基于python+selenium自动健康打卡,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • Python和Anaconda的版本对应关系

    Python和Anaconda的版本对应关系

    这篇文章主要为大家介绍了Python和Anaconda,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-06-06
  • 一文详解Python中logging模块的用法

    一文详解Python中logging模块的用法

    logging是Python标准库中记录常用的记录日志库,主要用于输出运行日志,可以设置输出日志的等级、日志保存路径、日志文件回滚等。本文主要来和大家聊聊它的具体用法,希望对大家有所帮助
    2023-02-02
  • python、PyTorch图像读取与numpy转换实例

    python、PyTorch图像读取与numpy转换实例

    今天小编就为大家分享一篇python、PyTorch图像读取与numpy转换实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01
  • Python读取txt内容写入xls格式excel中的方法

    Python读取txt内容写入xls格式excel中的方法

    今天小编就为大家分享一篇Python读取txt内容写入xls格式excel中的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • 对Python 两大环境管理神器 pyenv 和 virtualenv详解

    对Python 两大环境管理神器 pyenv 和 virtualenv详解

    今天小编就为大家分享一篇对Python 两大环境管理神器 pyenv 和 virtualenv详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • Python 通过监听端口实现唯一脚本运行方式

    Python 通过监听端口实现唯一脚本运行方式

    这篇文章主要介绍了Python 通过监听端口实现唯一脚本运行方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05

最新评论