pandas数据合并与重塑之merge详解

 更新时间:2024年02月20日 15:58:59   作者:卿卿553  
这篇文章主要介绍了pandas数据合并与重塑之merge,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

数据合并与重塑有merge,join,concat三种方法,本文先对merge进行讲解

1.merge参数概览

参数介绍
how连接方式(左连接left,右连接right,内连接inner,外连接outer)默认内连接
on用来做连接键的列名(两表必须相同)
left_on左表用来做连接键的列名
right_on右表用来做连接键的列名
left_indexTrue表示左表索引列作为连接键
right_indexTrue表示右表索引列作为连接键
suffix给两表的列加后缀进行区分

2.左右内外连接概念讲解

pandas中的左右内外连接和mysql中的大致相同,学过mysql的更容易理解

现在有两张表:表1和表2

(1)左连接

以表1为准,

将表2中与表1能根据连接键对应的数据与表1合并,和表1对应不上的数据则丢弃

在此过程中表1的数据是被完全保留下的

(2)右连接

与左连接相反,以表2为准

将表1中与表2能根据连接键对应的数据与表2合并,和表2对应不上的数据则丢弃

在此过程中表2的数据是被完全保留下的

(3)内连接

将表1和表2中根据连接键对应两边都有的数据合并

在此过程中表1只保留了能和表2对应的数据,表2也只保留下了能和表1对应的数据,有点类似于数学中的交集

(4)外连接

表1和表2的数据根据连接键对应合并

在此过程中表1表2的数据全都保留下来,相当于数学中的并集

3.merge数据合并

首先将两个表的数据进行读取

import pandas as pd
adress1="D:/pandas练习文件/merge1.xlsx"
adress2="D:/pandas练习文件/merge2.xlsx"
data1=pd.read_excel(adress1)
data2=pd.read_excel(adress2)

(1)当两个表用来做连接键的列名都相同时(以左连接为例)

A使用方法:

pd.merge(数据1,数据2,on=" ",how=" ")

all_data=pd.merge(data1,data2,on="姓名",how="left")

B数据合并前后对比:

(2)当两个表用来做连接键的列名都不相同时(本次默认内连接)

A使用方法

pd.merge(数据1,数据2,left_on="",right_on="")

all_data=pd.merge(data1,data2,left_on="姓名1",right_on="姓名2")

B数据合并前后对比

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • python文件名批量重命名脚本实例代码

    python文件名批量重命名脚本实例代码

    这篇文章主要给大家介绍了关于python文件名批量重命名脚本的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-04-04
  • PYQT5实现控制台显示功能的方法

    PYQT5实现控制台显示功能的方法

    今天小编大家分享一篇PYQT5实现控制台显示功能的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-06-06
  • 使用Python编写一个模仿CPU工作的程序

    使用Python编写一个模仿CPU工作的程序

    这篇文章主要介绍了使用Python编写一个模仿CPU工作的程序,包括简单的内存和输入输出的实现,本文中的例子需要一定的Python编程基础,是深入Python的实践,需要的朋友可以参考下
    2015-04-04
  • 爬虫训练前端基础Bootstrap5排版表格图像

    爬虫训练前端基础Bootstrap5排版表格图像

    这篇文章主要为大家介绍了爬虫训练前端基础Bootstrap5排版表格图像,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-02-02
  • python 普通克里金(Kriging)法的实现

    python 普通克里金(Kriging)法的实现

    这篇文章主要介绍了python 普通克里金(Kriging)法的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-12-12
  • 详解Python中的内建函数,可迭代对象,迭代器

    详解Python中的内建函数,可迭代对象,迭代器

    这篇文章主要介绍了Python内建函数,可迭代对象,迭代器,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-04-04
  • python编程-将Python程序转化为可执行程序[整理]

    python编程-将Python程序转化为可执行程序[整理]

    python编程-将Python程序转化为可执行程序[整理]...
    2007-04-04
  • python Web开发你要理解的WSGI & uwsgi详解

    python Web开发你要理解的WSGI & uwsgi详解

    这篇文章主要给大家介绍了关于python Web开发你一定要理解的WSGI & uwsgi的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面随着小编来一起学习学习吧
    2018-08-08
  • 在python代码中加入环境变量的语句操作

    在python代码中加入环境变量的语句操作

    这篇文章主要介绍了在python代码中加入环境变量的语句操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04
  • PyTorch使用GPU加速计算的实现

    PyTorch使用GPU加速计算的实现

    PyTorch利用NVIDIA CUDA库提供的底层接口来实现GPU加速计算,本文就来介绍一下PyTorch使用GPU加速计算的实现,具有一定的参考价值,感兴趣的可以了解一下
    2024-02-02

最新评论