Python pandas DataFrame数据拼接方法

 更新时间:2022年07月12日 09:20:07   作者:勤奋的大熊猫  
我们都知道在使用pandas处理数据的时候,往往会需要合并两个或者多个DataFrame的操作,下面这篇文章主要给大家介绍了关于Python pandas DataFrame数据拼接方法的相关资料,需要的朋友可以参考下

前言

在pandas模块中,通常我们都需要对类型为DataFrame的数据进行操作,其中最为常见的操作便是拼接了。比如我们将两个Excel表格中的数据读入,随后拼接完成后保存进一个新的Excel表格文件中。之前查找了相关的博客, 发现网络上鱼龙混杂。有些代码完全无法执行,为了提高效率,这里做一个详细地记录。

DataFrame数据拼接方法一:使用.append()方法。

# -*- coding:utf-8 -*-
import pandas as pd

df1 = pd.DataFrame([[1, 2], [3, 4]])
df2 = pd.DataFrame([[5, 6], [7, 8]])

df = df1.append(df2)

print("df1的值为:")
print(df1)
print("df2的值为:")
print(df2)
print("df的值为:")
print(df)
"""
运行结果:
df1的值为:
   0  1
0  1  2
1  3  4
df2的值为:
   0  1
0  5  6
1  7  8
df的值为:
   0  1
0  1  2
1  3  4
0  5  6
1  7  8
"""

我们可以看到,首先我们使用了类似于list列表的操作方式,使用.append()方法对df1与df2数据进行了操作,但是需要注意的是,不同于对列表对象的操作,这里的df1仍旧为原来的df1所拥有的内容,而我们赋值的对象df才是保存了二者拼接以后的结果。 所以记得一定要单独执行赋值才可以得到正确的结果!!!其次我们看到结果其实是有些问题的,df结果中的纵向索引值为0,1,0,1,仍旧保留了我们拼接前各自的索引值,这是不被我们需要的,因此我们需要设置 ignore_index=True来对索引值进行重新排列。代码如下:

# -*- coding:utf-8 -*-
import pandas as pd

df1 = pd.DataFrame([[1, 2], [3, 4]])
df2 = pd.DataFrame([[5, 6], [7, 8]])

df = df1.append(df2,  ignore_index=True)

print("df1的值为:")
print(df1)
print("df2的值为:")
print(df2)
print("df的值为:")
print(df)
"""
运行结果:
df1的值为:
   0  1
0  1  2
1  3  4
df2的值为:
   0  1
0  5  6
1  7  8
df的值为:
   0  1
0  1  2
1  3  4
2  5  6
3  7  8
"""

我们可以看到,此时的纵向索引值变正常了。

注意: df1 = pd.DataFrame([[1, 2], [3, 4]])创建DataFrame类型的数据时要使用双层中括号,单层中括号会导致数据纵向排列。

DataFrame数据拼接方法二:使用.concat()方法。

# -*- coding:utf-8 -*-
import pandas as pd

df1 = pd.DataFrame([[1, 2], [3, 4]])
df2 = pd.DataFrame([[5, 6], [7, 8]])

df = pd.concat([df1, df2], ignore_index=True)

print("df1的值为:")
print(df1)
print("df2的值为:")
print(df2)
print("df的值为:")
print(df)
"""
运行结果:
df1的值为:
   0  1
0  1  2
1  3  4
df2的值为:
   0  1
0  5  6
1  7  8
df的值为:
   0  1
0  1  2
1  3  4
2  5  6
3  7  8
"""

我们可以看到成功实现了拼接。

但是这样并不美观,我们发现,我们的纵向index还是用0,1在表示,那么我们可不可以自定义纵向index呢?答案是可以的,请看如下代码:

import pandas as pd

df1 = pd.DataFrame([[1, 2], [3, 4]], columns=["column1", "column2"])
df2 = pd.DataFrame([[5, 6], [7, 8]], columns=["column1", "column2"])

df = pd.concat([df1, df2], ignore_index=True)

print("df1的值为:")
print(df1)
print("df2的值为:")
print(df2)
print("df的值为:")
print(df)
"""
运行结果:
df1的值为:
   column1  column2
0        1        2
1        3        4
df2的值为:
   column1  column2
0        5        6
1        7        8
df的值为:
   column1  column2
0        1        2
1        3        4
2        5        6
3        7        8
"""

至此,DataFrame的拼接问题暂时告一段落,当然还存在其他方法,以后有机会了再补充,这两种方法均为比较直观和简洁的方法。推荐使用。此外, pd.concat()函数也适用于多个DataFrame的拼接, 只要将第一个参数变为一个列表,涵盖所有的DataFrame名称即可,如[df1, df2, df3]。

补充:Python同时合并多个DataFrame

pandas的merge函数只能同时合并三个dataframe,如果涉及到合并多个dataframe就比较麻烦

这种情况下我们可以创建一个我们需要合并的列表,然后将他们一次性合并在一起

# merge any number of dataframes
from functools import reduce
df_groups = [df2, group1, group2, group3, group4, group5, group6, group7, group8]
df_merged = reduce(lambda left, right: pd.merge(left, right, on=['title']), df_groups)
df_merged.head()

总结

到此这篇关于Python pandas DataFrame数据拼接的文章就介绍到这了,更多相关pandas DataFrame拼接内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Pytorch数据拼接与拆分操作实现图解

    Pytorch数据拼接与拆分操作实现图解

    这篇文章主要介绍了Pytorch数据拼接与拆分操作实现图解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-04-04
  • 一文详解PyQt5中实现不规则窗口的显示

    一文详解PyQt5中实现不规则窗口的显示

    这篇文章主要为大家详细介绍了Python PyQt5中实现不规则窗口的显示的相关资料,文中的示例代码讲解详细,具有一定的借鉴价值,需要的可以参考一下
    2022-12-12
  • pytorch 禁止/允许计算局部梯度的操作

    pytorch 禁止/允许计算局部梯度的操作

    这篇文章主要介绍了pytorch 禁止/允许计算局部梯度的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-05-05
  • Python多线程thread及模块使用实例

    Python多线程thread及模块使用实例

    这篇文章主要介绍了Python多线程thread及模块使用实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-04-04
  • Python实现获取当前日期的所属信息

    Python实现获取当前日期的所属信息

    在Python中,处理日期和时间是一个常见的任务,它涉及到许多方面,例如获取日期的年、月、日、星期几等等,本文将详细介绍如何使用Python来获取当前日期的各种相关信息,需要的可以了解下
    2024-01-01
  • python实现数字炸弹游戏程序

    python实现数字炸弹游戏程序

    这篇文章主要为大家详细介绍了python实现数字炸弹游戏程序,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-07-07
  • linux环境打包python工程为可执行程序的过程

    linux环境打包python工程为可执行程序的过程

    本次需求,在ubuntu上面开发的python代码程序需要打包成一个可执行程序然后交付给甲方,因为不能直接给源码给甲方,所以寻找方法将python开发的源码打包成一个可执行程序,本次在ubuntu上打包python源码的方法和在window上打包的有点类似,感兴趣的朋友跟随小编一起看看吧
    2024-01-01
  • Python去除字符串前后空格的三种方法汇总

    Python去除字符串前后空格的三种方法汇总

    这篇文章主要给大家介绍了关于Python去除字符串前后空格的三种方法,需要的朋友可以参考下
    2023-01-01
  • Python如何抓取天猫商品详细信息及交易记录

    Python如何抓取天猫商品详细信息及交易记录

    这篇文章主要为大家详细介绍了Python如何抓取天猫商品详细信息及交易记录,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-02-02
  • Python实现生命游戏的示例代码(tkinter版)

    Python实现生命游戏的示例代码(tkinter版)

    生命游戏是由剑桥大学约翰·何顿·康威设计的计算机程序,一时吸引了各行各业一大批人的兴趣。本文将用Python实现这一游戏,感兴趣的可以尝试一下
    2022-08-08

最新评论