pandas数据合并与重塑之merge详解

 更新时间:2024年02月20日 15:58:59   作者:卿卿553  
这篇文章主要介绍了pandas数据合并与重塑之merge,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

数据合并与重塑有merge,join,concat三种方法,本文先对merge进行讲解

1.merge参数概览

参数介绍
how连接方式(左连接left,右连接right,内连接inner,外连接outer)默认内连接
on用来做连接键的列名(两表必须相同)
left_on左表用来做连接键的列名
right_on右表用来做连接键的列名
left_indexTrue表示左表索引列作为连接键
right_indexTrue表示右表索引列作为连接键
suffix给两表的列加后缀进行区分

2.左右内外连接概念讲解

pandas中的左右内外连接和mysql中的大致相同,学过mysql的更容易理解

现在有两张表:表1和表2

(1)左连接

以表1为准,

将表2中与表1能根据连接键对应的数据与表1合并,和表1对应不上的数据则丢弃

在此过程中表1的数据是被完全保留下的

(2)右连接

与左连接相反,以表2为准

将表1中与表2能根据连接键对应的数据与表2合并,和表2对应不上的数据则丢弃

在此过程中表2的数据是被完全保留下的

(3)内连接

将表1和表2中根据连接键对应两边都有的数据合并

在此过程中表1只保留了能和表2对应的数据,表2也只保留下了能和表1对应的数据,有点类似于数学中的交集

(4)外连接

表1和表2的数据根据连接键对应合并

在此过程中表1表2的数据全都保留下来,相当于数学中的并集

3.merge数据合并

首先将两个表的数据进行读取

import pandas as pd
adress1="D:/pandas练习文件/merge1.xlsx"
adress2="D:/pandas练习文件/merge2.xlsx"
data1=pd.read_excel(adress1)
data2=pd.read_excel(adress2)

(1)当两个表用来做连接键的列名都相同时(以左连接为例)

A使用方法:

pd.merge(数据1,数据2,on=" ",how=" ")

all_data=pd.merge(data1,data2,on="姓名",how="left")

B数据合并前后对比:

(2)当两个表用来做连接键的列名都不相同时(本次默认内连接)

A使用方法

pd.merge(数据1,数据2,left_on="",right_on="")

all_data=pd.merge(data1,data2,left_on="姓名1",right_on="姓名2")

B数据合并前后对比

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 使用python实现正则匹配检索远端FTP目录下的文件

    使用python实现正则匹配检索远端FTP目录下的文件

    这篇文章主要介绍了使用python实现正则匹配检索远端FTP目录下的文件的方法,非常的简单实用,需要的小伙伴参考下
    2015-03-03
  • Python性能优化的20条建议

    Python性能优化的20条建议

    不论什么语言我们都需要注意性能优化问题,提高执行效率,这里就为大家分享下Python的性能优化技巧,需要的朋友可以参考下
    2014-10-10
  • Scrapy 配置动态代理IP的实现

    Scrapy 配置动态代理IP的实现

    这篇文章主要介绍了Scrapy 配置动态代理IP的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-09-09
  • pycharm与jupyter lab/notebook结合使用方式

    pycharm与jupyter lab/notebook结合使用方式

    这篇文章主要介绍了pycharm与jupyter lab/notebook结合使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-06-06
  • 深入讲解Python函数中参数的使用及默认参数的陷阱

    深入讲解Python函数中参数的使用及默认参数的陷阱

    这篇文章主要介绍了Python函数中参数的使用及默认参数的陷阱,文中将函数的参数分为必选参数、默认参数、可变参数和关键字参数来讲,要的朋友可以参考下
    2016-03-03
  • python中count函数知识点浅析

    python中count函数知识点浅析

    在本篇文章里小编给大家整理了一篇关于python中count函数知识点浅析内容,有兴趣的朋友们可以学习下。
    2020-12-12
  • 卸载PyCharm Professional全过程

    卸载PyCharm Professional全过程

    本文详细介绍了在Windows、Mac和Linux系统中卸载PyCharm Professional的方法,包括如何通过系统设置、自带工具、手动删除文件夹等方式卸载,还提供了卸载时需要注意的事项,如备份重要文件、取消自动登录设置、删除残留文件等
    2026-05-05
  • python global和nonlocal用法解析

    python global和nonlocal用法解析

    这篇文章主要介绍了python global和nonlocal用法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-02-02
  • 利用python生成一个导出数据库的bat脚本文件的方法

    利用python生成一个导出数据库的bat脚本文件的方法

    下面小编就为大家带来一篇利用python生成一个导出数据库的bat脚本文件的方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-12-12
  • python实现web应用框架之增加响应对象

    python实现web应用框架之增加响应对象

    这篇文章主要介绍了python利用web应用框架如何增加响应对象的,文中有相应的代码示例,对大家的学习或工作有一定的参考价值,需要的同学可以参考下
    2023-05-05

最新评论