Pandas中Concat与Append的实现与区别小结

 更新时间:2023年11月22日 09:30:27   作者:阿松爱睡觉  
本文主要介绍了Pandas中Concat与Append的实现与区别小结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

在Numpy中,我们介绍过可以用np.concatenatenp.stacknp.vstacknp.hstack实现合并功能。Pandas中有一个pd.concat()函数与concatenate语法类似,但是配置参数更多,功能也更强大。

主要参数:

pd.concat()可以简单地合并一维的SeriesDataFrame对象。

# Series合并
ser1 = pd.Series(['A', 'B', 'C'], index=[1, 2, 3])
ser2 = pd.Series(['D', 'E', 'F'], index=[4, 5, 6])
pd.concat([ser1,ser2])
Out:
 1 A 
 2 B 
 3 C 
 4 D 
 5 E 
 6 F 
 dtype: object
 
# DataFrame合并,将concat的axis参数设置为1即可横向合并
df1 = pd.DataFrame([["A1","B1"],["A2","B2"]],index=[1,2],columns=["A","B"])
df2 = pd.DataFrame([["A3","B3"],["A4","B4"]],index=[3,4],columns=["A","B"])
pd.concat([df1,df2])
Out:
    A  B
 1 A1 B1 
 2 A2 B2 
 3 A3 B3 
 4 A4 B4

合并时索引的处理

np.concatenate与pd.concat最主要的差异之一就是Pandas在合并时会保留索引,即使索引是重复的!

df3 = pd.DataFrame([["A1","B1"],["A2","B2"]],index=[1,2],columns=["A","B"])
df4 = pd.DataFrame([["A1","B1"],["A2","B2"]],index=[1,2],columns=["A","B"])
pd.concat([df3,df4])
Out:
    A  B
 1 A1 B1 
 2 A2 B2 
 1 A3 B3 
 2 A4 B4
  • 如果你想要检测pd.concat()合并的结果中是否出现了重复的索引,可以设置verify_integrity参数。将参数设置为True,合并时若有索引重复就会触发异常。
try: 
 pd.concat([df3, df4], verify_integrity=True) 
except ValueError as e: 
 print("ValueError:", e)
Out:
ValueError: Indexes have overlapping values: [0, 1]
  • 有时索引无关紧要,那么合并时就可以忽略它们,可以通过设置 ignore_index参数为True来实现。
pd.concat([df3,df4],ignore_index=True)
Out:
   A B 
0 A0 B0 
1 A1 B1 
2 A2 B2 
3 A3 B3
  • 另一种处理索引重复的方法是通过keys参数为数据源设置多级索引标签,这样结果数据就会带上多级索引。
pd.concat([df3, df4], keys=['x', 'y'])
Out:
     A B 
x 0 A0 B0 
  1 A1 B1 
y 0 A2 B2 
  1 A3 B3

join和join_axes参数

前面介绍的简单示例都有一个共同特点,那就是合并的DataFrame都是同样的列名。而在实际工作中,需要合并的数据往往带有不同的列名,而 pd.concat提供了一些参数来解决这类合并问题。

df5 = pd.DataFrame([["A1","B1","C1"],["A2","B2","C2"]],index=[1,2],columns=["A","B","C"])
df6 = pd.DataFrame([["B3","C3","D3"],["B4","C4","D4"]],index=[3,4],columns=["B","C","D"])
pd.concat([df5,df6])
Out:
    A  B  C  D
 1 A1  B1 C1 NaN
 2 A2  B2 C2 NaN
 3 NaN B3 C3 D3
 4 NaN B4 C4 D4

可以看到,结果中出现了缺失值,如果不想出现缺失值,可以使用join和join_axes参数。

pd.concat([df5,df6],join="inner") # 合并取交集
Out:
    B C 
 1 B1 C1 
 2 B2 C2 
 3 B3 C3 
 4 B4 C4
# join_axes的参数需为一个列表索引对象
pd.concat([df5,df6],join_axes=[pd.Index(["B","C"])])
Out:
    B C 
 1 B1 C1 
 2 B2 C2 
 3 B3 C3 
 4 B4 C4

append()方法

因为直接进行数组合并的需求非常普遍,所以SeriesDataFrame 对象都支持append方法,让你通过最少的代码实现合并功能。例如,df1.append(df2)效果与pd.concat([df1,df2])一样。

但是它和Python中的append不一样,每次使用Pandas中的append()都需要重新创建索引和数据缓存。

到此这篇关于Pandas中Concat与Append的实现的文章就介绍到这了,更多相关Pandas Concat与Append内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 一文详解Python中pip安装的提速全攻略

    一文详解Python中pip安装的提速全攻略

    在Python开发过程中,使用pip安装第三方包是最常见的操作之一,本文将为你详细介绍多种有效的pip安装提速方法,大家可以根据需要进行选择
    2025-08-08
  • Python基于wxPython和FFmpeg开发一个视频标签工具

    Python基于wxPython和FFmpeg开发一个视频标签工具

    在当今数字媒体时代,视频内容的管理和标记变得越来越重要,无论是研究人员需要对实验视频进行时间点标记,还是个人用户希望对家庭视频进行分类整理,一个高效的视频标签工具都是不可或缺的,本文将详细分析一个基于Python、wxPython和FFmpeg开发的视频标签工具
    2025-04-04
  • Python正则表达式的另类解答

    Python正则表达式的另类解答

    这篇文章主要为大家详细介绍了Python正则表达式,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-02-02
  • Python计算序列相似度的算法实例

    Python计算序列相似度的算法实例

    这篇文章主要介绍了Python计算序列相似度的算法实例,求两个序列转换的最少交换步骤和最小交换距离,本文提供了部分实现代码与解决思路,对开发非常有帮助,需要的朋友可以参考下
    2023-07-07
  • Python中cx_Oracle模块导入错误的解决办法详细指南

    Python中cx_Oracle模块导入错误的解决办法详细指南

    在Python中使用cx_Oracle模块连接和操作Oracle数据库时可能遇到的错误,这篇文章主要介绍了Python中cx_Oracle模块导入错误的解决办法,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2025-09-09
  • Django用户认证系统 Web请求中的认证解析

    Django用户认证系统 Web请求中的认证解析

    这篇文章主要介绍了Django用户认证系统 Web请求中的认证解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • Python实现将Json转换为Xml与Markdown

    Python实现将Json转换为Xml与Markdown

    这篇文章主要为大家详细介绍了如何利用Python实现将Json转换为Xml与Markdown格式,文中的示例代码讲解详细,有需要的小伙伴可以了解一下
    2025-07-07
  • 详解在python中如何使用zlib模块进行数据压缩和解压缩

    详解在python中如何使用zlib模块进行数据压缩和解压缩

    Python有一些内置库用于处理数据压缩和解压缩,其中一个就是zlib模块,这个模块为DEFLATE压缩算法和相关的gzip(文件格式)提供了支持,在这篇文章中,我们将深入探讨如何使用zlib模块进行数据压缩和解压缩
    2023-06-06
  • Django在视图中使用表单并和数据库进行数据交互的实现

    Django在视图中使用表单并和数据库进行数据交互的实现

    本文主要介绍了Django在视图中使用表单并和数据库进行数据交互,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-07-07
  • Python抓取聚划算商品分析页面获取商品信息并以XML格式保存到本地

    Python抓取聚划算商品分析页面获取商品信息并以XML格式保存到本地

    这篇文章主要为大家详细介绍了Python抓取聚划算商品分析页面获取商品信息,并以XML格式保存到本地的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-02-02

最新评论