Pandas数据合并的两种实现方法

 更新时间:2023年11月26日 10:42:24   作者:GarsonW  
本文主要介绍了Pandas数据合并的两种实现方法,DataFrame数据合并主要使用merge()方法和concat()方法,具有一定的参考价值,感兴趣的可以了解一下

DataFrame数据合并主要使用merge()方法和concat()方法。

1.数据合并(merge()方法)

Pandas模块的merge()进行数据合并时,两个DataFrame对象必须有相同的列。

1.常规合并

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '语文':[110,105,109],
                    '数学':[105,88,120],
                    '英语':[99,115,130]})

df2 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '体育':[34.5,39.7,38]})

df_merge=pd.merge(df1,df2,on='编号')
print(df_merge)

该示例中,编号是相同的,所以会将df2中“体育”作为新的一列加入到df1中。 

2.通过索引合并

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '语文':[110,105,109],
                    '数学':[105,88,120],
                    '英语':[99,115,130]})

df2 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '体育':[34.5,39.7,38]})

df_merge=pd.merge(df1,df2,left_index=True,right_index=True)
print(df_merge)

3.对合并数据去重

使用到how属性,就是让df1保留所有的行列数据,df2则根据df1的行列进行补全。

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '语文':[110,105,109],
                    '数学':[105,88,120],
                    '英语':[99,115,130]})

df2 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '体育':[34.5,39.7,38]})

df_merge=pd.merge(df1,df2,on='编号',left_index=True,right_index=True)
print(df_merge)
df_merge=pd.merge(df1,df2,on='编号',how='left')
print(df_merge)

4.多对一的数据合并

根据共有列中的数据进行合并,df2根据df1的行列进行补全。

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '学生姓名':['明日同学','高猿员','钱多多']})

df2 = pd.DataFrame({'编号':['mr001','mr001','mr003'],
                    '语文':[110,105,109],
                    '数学':[105,88,120],
                    '英语':[99,115,130],
                    '时间':['1月','2月','1月']})

df_merge=pd.merge(df1,df2,on='编号')
print(df_merge)

5.多对多的数据合并

根据共有列中的数据进行合并,df2,df1相互补全。

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003','mr001','mr001'],
                    '体育':[34.5,39.7,38,33,35]})

df2 = pd.DataFrame({'编号':['mr001','mr002','mr003','mr003','mr003'],
                    '语文':[110,105,109,110,108],
                    '数学':[105,88,120,123,119],
                    '英语':[99,115,130,109,128]})

df_merge=pd.merge(df1,df2)
print(df_merge)

2.数据合并(concat()方法)

1.相同字段的表首尾相连

dfs = [df1,df2,df3]
result = pd.concat(dfs)

如果需要标记源数据来自于哪张表,可以使用:

result = pd.concat(dfs, keys=['第一张表','第二张表','第三张表']) 

2.横向表合并(行对齐)

用于数据列名不一致,缺失的数据使用Nan填充 。其中axis=1代表行合并。

result = pd.concat([df1,df4],axis=1)

3.交叉合并

交叉合并需要加上join参数,如值为inner,结果为两张表的交集;如果值为outer,结果为两张表的并集。 

result = pd.concat([df1,df4],axis=1,join='inner')

4.指定表对其数据(行对齐)

如果指定参数join_axes,就可以指定根据哪张表来对齐数据。如下述代码,根据df4表对其,结果表的行术和df4的行术一致,在此基础上拼接df1表。

result = pd.concat([df1,df4],axis=1,join_axes[df4.index])

到此这篇关于Pandas数据合并的两种实现方法的文章就介绍到这了,更多相关Pandas数据合并内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python中flatten()参数示例详解

    python中flatten()参数示例详解

    flatten是numpy.ndarray.flatten的一个函数,即返回一个一维数组,这篇文章主要给大家介绍了关于python中flatten()参数的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-03-03
  • 浅谈DataFrame和SparkSql取值误区

    浅谈DataFrame和SparkSql取值误区

    今天小编就为大家分享一篇浅谈DataFrame和SparkSql取值误区,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • Python人工智能学习PyTorch实现WGAN示例详解

    Python人工智能学习PyTorch实现WGAN示例详解

    这篇文章主要为大家介绍了人工智能学习PyTorch实现WGAN的示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步
    2021-11-11
  • Python 连接 MySQL 的几种方法

    Python 连接 MySQL 的几种方法

    这篇文章主要介绍了Python 连接 MySQL 的几种方法,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2020-09-09
  • python读取文件夹中图片的图片名并写入excel表格

    python读取文件夹中图片的图片名并写入excel表格

    这篇文章介绍了使用python读取文件夹中图片的图片名并写入excel表格的方法。对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-12-12
  • Python分析微信好友性别比例和省份城市分布比例的方法示例【基于itchat模块】

    Python分析微信好友性别比例和省份城市分布比例的方法示例【基于itchat模块】

    这篇文章主要介绍了Python分析微信好友性别比例和省份城市分布比例的方法,结合实例形式分析了Python基于itchat模块获取及计算微信好友相关信息操作技巧,需要的朋友可以参考下
    2020-05-05
  • pandas group分组与agg聚合的实例

    pandas group分组与agg聚合的实例

    这篇文章主要介绍了pandas group分组与agg聚合的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • 解决python3 Pycharm上连接数据库时报错的问题

    解决python3 Pycharm上连接数据库时报错的问题

    今天小编就为大家分享一篇解决python3 Pycharm上连接数据库时报错的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • selenium设置浏览器为headless无头模式(Chrome和Firefox)

    selenium设置浏览器为headless无头模式(Chrome和Firefox)

    这篇文章主要介绍了selenium设置浏览器为headless无头模式(Chrome和Firefox),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • 一文详解如何配置Pycharm进行远程开发

    一文详解如何配置Pycharm进行远程开发

    在搞深度学习的时候,我们在本地开发,但是需要在服务器去运行工程,所以需要使用Pycharm进行远程配置,下面这篇文章主要给大家介绍了关于如何配置Pycharm进行远程开发的相关资料,需要的朋友可以参考下
    2024-02-02

最新评论