关于python DataFrame的合并方法总结

 更新时间:2022年07月12日 16:39:27   作者:haha_point  
这篇文章主要介绍了关于python DataFrame的合并方法总结,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

python DataFrame的合并方法

Python的Pandas针对DataFrame,Series提供了多个合并函数,通过参数的调整可以轻松实现DatafFrame的合并。

首先,定义3个DataFrame df1,df2,df3,进行concat、merge、append函数的实验。

df1=pd.DataFrame([[1,2,3],[2,3,4]],columns=['a','b','c'])
df2=pd.DataFrame([[2,3,4],[3,4,5]],columns=['a','b','c'])
df3=pd.DataFrame([[1,2,3],[2,3,4]],columns=['a','b','d'])
df1
   a  b  c
0  1  2  3
1  2  3  4
df2
   a  b  c
0  2  3  4
1  3  4  5
df3
   a  b  d
0  1  2  3
1  2  3  4

#concat函数

pandas中concat函数的完整表达,包含多个参数,常用的有axis,join,ignore_index.

concat函数的第一个参数为objs,一般为一个list列表,包含要合并两个或多个DataFrame,多个Series

pandas.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
           keys=None, levels=None, names=None, verify_integrity=False,
           copy=True)

1.axis表示合并方向,默认axis=0,两个DataFrame按照索引方向纵向合并,axis=1则会按照columns横向合并。

pd.concat([df1,df2],axis=1)
   a  b  c  a  b  c
0  1  2  3  2  3  4
1  2  3  4  3  4  5

2.join表示合并方式,默认join=‘outer’,另外的取值为’inner’,只合并相同的部分,axis=0时合并结果为相同列名的数据,axis=1时为具有相同索引的数据

pd.concat([df2,df3],axis=0,join='inner')
   a  b
0  2  3
1  3  4
0  1  2
1  2  3
pd.concat([df2,df3],axis=1,join='inner')
   a  b  c  a  b  d
0  2  3  4  1  2  3
1  3  4  5  2  3  4

3.ignore_index表示索引的合并方式,默认为False,会保留原df的索引,如果设置ignore_index=True,合并后的df会重置索引。

pd.concat([df1,df2],ignore_index=True)
   a  b  c
0  1  2  3
1  2  3  4
2  2  3  4
3  3  4  5

#merge函数

merge函数是pandas提供的一种数据库式的合并方法。

on可以指定合并的列、索引,how则是与数据库join函数相似,取值为left,right,outer,inner.left,right分别对应left outer join, right outer join.

pandas.merge(left, right, how='inner', on=None, left_on=None, right_on=None,
          left_index=False, right_index=False, sort=False,
          suffixes=('_x', '_y'), copy=True, indicator=False,
          validate=None):

merge函数可以通过pandas.merge(df1,df2)、df1.merge(df2)两种形式来实现两个DataFrame的合并,df1.merge(df2)是默认left=self的情况。

df_merge =df1.merge(df3,on=['a','b'])
   a  b  c  d
0  1  2  3  3
1  2  3  4  4

#append函数

append函数是pandas针对DataFrame、Series等数据结构合并提供的函数。

df1.append(self, other, ignore_index=False, verify_integrity=False)

df1.append(df2)与pd.concat([df1,df2],ignore_index=False)具有相同的合并结果

df1.append(df2)
   a  b  c
0  1  2  3
1  2  3  4
0  2  3  4
1  3  4  5

更多使用方法可以参考pandas关于数据合并的官方文档http://pandas.pydata.org/pandas-docs/stable/merging.html

把两个dataframe合并成一个

1.merage

result = pd.merge(对象1, 对象2, on='key')

对象1 和 对象2分别为要合并的dataframe,key是在两个dataframe都存在的列(类似于数据库表中的主键)

2.append

result = df1.append(df2)
result = df1.append([df2, df3])
result = df1.append(df4, ignore_index=True)

3.join

result = left.join(right, on=['key1', 'key2'], how='inner')

4.concat

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
     keys=None, levels=None, names=None, verify_integrity=False,
     copy=True)
frames = [df1, df2, df3]
result = pd.concat(frames)
result = pd.concat(frames, keys=['x', 'y', 'z'])
result = pd.concat([df1, df4], ignore_index=True)

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 详解Django中异步任务之django-celery

    详解Django中异步任务之django-celery

    这篇文章主要介绍了详解Django中异步任务之django-celery,本文通过场景分析实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-11-11
  • python实现文本文件合并

    python实现文本文件合并

    本文给大家汇总介绍了3种合并文本文件的方法,程序的实现思路都非常不错,这里推荐给大家,有需要的小伙伴可以参考下。
    2015-12-12
  • 详解使用python的logging模块在stdout输出的两种方法

    详解使用python的logging模块在stdout输出的两种方法

    这篇文章主要介绍了详解使用python的logging模块在stdout输出的相关资料,需要的朋友可以参考下
    2017-05-05
  • Python基础知识之变量的详解

    Python基础知识之变量的详解

    这篇文章主要介绍了Python基础知识之变量的详解,文中有非常详细的代码示例,对正在学习python的小伙伴们有很好的帮助,需要的朋友可以参考下
    2021-04-04
  • python 实现数组list 添加、修改、删除的方法

    python 实现数组list 添加、修改、删除的方法

    下面小编就为大家分享一篇python 实现数组list 添加、修改、删除的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • 解决Django中调用keras的模型出现的问题

    解决Django中调用keras的模型出现的问题

    今天小编就为大家分享一篇解决Django中调用keras的模型出现的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • Opencv常见图像格式Data Type及代码实例

    Opencv常见图像格式Data Type及代码实例

    这篇文章主要介绍了Opencv常见图像格式Data Type及代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-11-11
  • python中dir函数用法分析

    python中dir函数用法分析

    这篇文章主要介绍了python中dir函数用法,实例分析了dir函数的功能及相应的使用技巧,需要的朋友可以参考下
    2015-04-04
  • 在python中计算ssim的方法(与Matlab结果一致)

    在python中计算ssim的方法(与Matlab结果一致)

    这篇文章主要介绍了在python中计算ssim的方法(与Matlab结果一致),本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-12-12
  • python、Matlab求定积分的实现

    python、Matlab求定积分的实现

    今天小编就为大家分享一篇python、Matlab求定积分的实现,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11

最新评论