Pandas数据合并的两种实现方法

更新时间：2023年11月26日 10:42:24 作者：GarsonW

本文主要介绍了Pandas数据合并的两种实现方法,DataFrame数据合并主要使用merge()方法和concat()方法,具有一定的参考价值,感兴趣的可以了解一下

1.数据合并（merge()方法）

Pandas模块的merge()进行数据合并时，两个DataFrame对象必须有相同的列。

1.常规合并

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '语文':[110,105,109],
                    '数学':[105,88,120],
                    '英语':[99,115,130]})

df2 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '体育':[34.5,39.7,38]})

df_merge=pd.merge(df1,df2,on='编号')
print(df_merge)

该示例中，编号是相同的，所以会将df2中“体育”作为新的一列加入到df1中。

2.通过索引合并

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '语文':[110,105,109],
                    '数学':[105,88,120],
                    '英语':[99,115,130]})

df2 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '体育':[34.5,39.7,38]})

df_merge=pd.merge(df1,df2,left_index=True,right_index=True)
print(df_merge)

3.对合并数据去重

使用到how属性，就是让df1保留所有的行列数据，df2则根据df1的行列进行补全。

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '语文':[110,105,109],
                    '数学':[105,88,120],
                    '英语':[99,115,130]})

df2 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '体育':[34.5,39.7,38]})

df_merge=pd.merge(df1,df2,on='编号',left_index=True,right_index=True)
print(df_merge)
df_merge=pd.merge(df1,df2,on='编号',how='left')
print(df_merge)

4.多对一的数据合并

根据共有列中的数据进行合并，df2根据df1的行列进行补全。

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '学生姓名':['明日同学','高猿员','钱多多']})

df2 = pd.DataFrame({'编号':['mr001','mr001','mr003'],
                    '语文':[110,105,109],
                    '数学':[105,88,120],
                    '英语':[99,115,130],
                    '时间':['1月','2月','1月']})

df_merge=pd.merge(df1,df2,on='编号')
print(df_merge)

5.多对多的数据合并

根据共有列中的数据进行合并，df2，df1相互补全。

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003','mr001','mr001'],
                    '体育':[34.5,39.7,38,33,35]})

df2 = pd.DataFrame({'编号':['mr001','mr002','mr003','mr003','mr003'],
                    '语文':[110,105,109,110,108],
                    '数学':[105,88,120,123,119],
                    '英语':[99,115,130,109,128]})

df_merge=pd.merge(df1,df2)
print(df_merge)

2.数据合并（concat()方法）

1.相同字段的表首尾相连

dfs = [df1,df2,df3]
result = pd.concat(dfs)

如果需要标记源数据来自于哪张表，可以使用：

result = pd.concat(dfs, keys=['第一张表','第二张表','第三张表'])

2.横向表合并（行对齐）

用于数据列名不一致，缺失的数据使用Nan填充。其中axis=1代表行合并。

result = pd.concat([df1,df4],axis=1)

3.交叉合并

交叉合并需要加上join参数，如值为inner，结果为两张表的交集；如果值为outer，结果为两张表的并集。

result = pd.concat([df1,df4],axis=1,join='inner')

4.指定表对其数据（行对齐）

如果指定参数join_axes，就可以指定根据哪张表来对齐数据。如下述代码，根据df4表对其，结果表的行术和df4的行术一致，在此基础上拼接df1表。

result = pd.concat([df1,df4],axis=1,join_axes[df4.index])

到此这篇关于Pandas数据合并的两种实现方法的文章就介绍到这了,更多相关Pandas数据合并内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python3 requests模块如何模仿浏览器及代理
这篇文章主要介绍了Python3 requests模块如何模仿浏览器及代理,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-06-06
Python程序中的观察者模式结构编写示例
观察者模式是最常用的设计模式之一,旨在观察目标和观察者之间建立一个抽象的耦合,减少对象之间的耦合,这里我们就来看一下Python程序中的观察者模式结构编写示例
2016-05-05
python+opencv3.4.0 实现HOG+SVM行人检测的示例代码
这篇文章主要介绍了python+opencv3.4.0 实现HOG+SVM行人检测的示例代码，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-01-01
python爬虫之selenium库的安装及使用教程
今天带大家来学习怎么安装使用selenium库,文中有非常详细的图文介绍,对正在学习python爬虫的小伙伴们很有帮助,需要的朋友可以参考下
2021-05-05
Flask学习笔记之日志操作配置实例讲解
这篇文章主要为大家介绍了Flask学习笔记之日志操作配置实例讲解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
2023-11-11
Python+request+unittest实现接口测试框架集成实例
这篇文章主要介绍了Python+request+unittest实现接口测试框架集成实例，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2018-03-03
解决tensorflow由于未初始化变量而导致的错误问题
今天小编就为大家分享一篇解决tensorflow由于未初始化变量而导致的错误问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-01-01
python报错: ''list'' object has no attribute ''shape''的解决
这篇文章主要介绍了python报错: 'list' object has no attribute 'shape'的解决，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-07-07
在django项目中导出数据到excel文件并实现下载的功能
这篇文章主要介绍了在django项目中导出数据到excel文件并实现下载的功能，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-03-03
基于python编写的shell脚本详细讲解
python相对于linux的shell脚本来说更简单，功能更强大，代码量也少很多，这里就为大家分享一下
2021-09-09