pandas中concatenate和combine_first的用法详解

 更新时间:2023年01月11日 10:29:33   作者:我是小蚂蚁  
本文主要介绍了pandas中concatenate和combine_first的用法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

concatenate主要作用是拼接series和dataframe的数据。

combine_first可以做来填充数据。

其中numpy和panads中都有concatenate()方法,如:np.concatenate([arr1, arr2])、pd.concat([s1, s2])

Series类型可以使用 s2 中的数值来填充 s1,如:s1.combine_first(s2)
Dataframe类型同样可以使用 df2 中的数组来填充 df1, 如:df1.combine_first(df2)

import numpy as np
import pandas as pd
from pandas import Series, DataFrame

# 设置一个随机种子,方便调试
np.random.seed(666)

# Series
arr1 = np.arange(9).reshape(3, 3)
arr2 = np.arange(9).reshape(3, 3)

# numpy的 concatenate 用法
print(np.concatenate([arr1, arr2]))
'''
[[0 1 2]
 [3 4 5]
 [6 7 8]
 [0 1 2]
 [3 4 5]
 [6 7 8]]
'''

print(np.concatenate([arr1, arr2], axis=1))
'''
[[0 1 2 0 1 2]
 [3 4 5 3 4 5]
 [6 7 8 6 7 8]]
'''


s1 = Series([1, 2, 3], index=['A', 'B', 'C'])
s2 = Series([4, 5], index=['E', 'F'])
# 可以看出和numpy的效果一样
print(pd.concat([s1, s2]))
'''
A    1
B    2
C    3
E    4
F    5
dtype: int64
'''
# 用法和 np 一样 axis = 1, 等于增加了一列
print(pd.concat([s1, s2], axis=1))
# 但是,返回的是一个 <class 'pandas.core.frame.DataFrame'>
print(type(pd.concat([s1, s2], axis=1)))
'''
     0    1
A  1.0  NaN
B  2.0  NaN
C  3.0  NaN
E  NaN  4.0
F  NaN  5.0
'''


df1 = DataFrame(np.random.randn(4, 3), columns=['X', 'Y', 'Z'])
print(df1)
'''
          X         Y         Z
0  0.824188  0.479966  1.173468
1  0.909048 -0.571721 -0.109497
2  0.019028 -0.943761  0.640573
3 -0.786443  0.608870 -0.931012
'''

df2 = DataFrame(np.random.randn(3, 3), columns=['X', 'Y', 'A'])
print(df2)
'''
          X         Y         A
0  0.978222 -0.736918 -0.298733
1 -0.460587 -1.088793 -0.575771
2 -1.682901  0.229185 -1.756625
'''

print(pd.concat([df1, df2]))
'''
          A         X         Y         Z
0       NaN  0.824188  0.479966  1.173468
1       NaN  0.909048 -0.571721 -0.109497
2       NaN  0.019028 -0.943761  0.640573
3       NaN -0.786443  0.608870 -0.931012
0 -0.298733  0.978222 -0.736918       NaN
1 -0.575771 -0.460587 -1.088793       NaN
2 -1.756625 -1.682901  0.229185       NaN
'''

# combine

s1 = Series([2, np.nan, 4, np.nan], index=['A', 'B', 'C', 'D'])
s2 = Series([1, 2, 3, 4], index=['A', 'B', 'C', 'D'])

# 用 s2 中的数值来填充 s1
print(s1.combine_first(s2))

'''
A    2.0
B    2.0
C    4.0
D    4.0
dtype: float64
'''

df1 = DataFrame({
    'X':[1, np.nan, 3, np.nan],
    'Y':[5, np.nan, 7, np.nan],
    'Z':[9, np.nan, 11, np.nan]
})

df2 = DataFrame({
    'Z':[np.nan, 10, np.nan, 12],
    'A':[1, 2, 3, 4]
})

# 功能同样是填充
print(df1.combine_first(df2))
'''
     A    X    Y     Z
0  1.0  1.0  5.0   9.0
1  2.0  NaN  NaN  10.0
2  3.0  3.0  7.0  11.0
3  4.0  NaN  NaN  12.0
'''

到此这篇关于pandas中concatenate和combine_first的用法详解的文章就介绍到这了,更多相关pandas concatenate和combine_first内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python + Chrome抓取AJAX动态数据的两种方法

    Python + Chrome抓取AJAX动态数据的两种方法

    在现代 Web 开发中,AJAX技术被广泛应用于动态加载数据,使得网页能够在不刷新的情况下更新内容,本文将详细介绍 Python + Chrome 如何抓取 AJAX 动态数据,并提供两种方法的完整实现代码,需要的朋友可以参考下
    2025-04-04
  • Python的强大HTTP库Requests基本使用

    Python的强大HTTP库Requests基本使用

    这篇文章主要为大家介绍了Python的强大HTTP库Requests基本使用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-05-05
  • 利用Python实现从PDF到CSV的转换

    利用Python实现从PDF到CSV的转换

    将PDF转换为CSV极大地提升了数据的实用价值,Python作为一种强大的编程语言,能够高效完成这一转换任务,本文将介绍如何利用Python实现从PDF到CSV的转换,需要的朋友可以参考下
    2024-07-07
  • Python报错ValueError: cannot reindex from a duplicate axis的解决方法

    Python报错ValueError: cannot reindex from 

    当处理Pandas数据框(DataFrame)时,你是否遇到过ValueError: cannot reindex from a duplicate axis的报错?这个问题通常发生在尝试对DataFrame进行重索引时,如果索引有重复值,就会触发这个错误,下面,我们将探讨这个问题并提供解决方法
    2024-09-09
  • Python制作一个WiFi密码测试工具

    Python制作一个WiFi密码测试工具

    这篇文章主要为大家详细介绍了Python如何通过字典攻击方式帮助用户测试 Wi-Fi 网络的安全性,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下
    2025-01-01
  • Python3最长回文子串算法示例

    Python3最长回文子串算法示例

    这篇文章主要介绍了Python3最长回文子串算法,结合实例形式分析了暴力算法及动态规划算法判断最长回文子串的相关操作技巧,需要的朋友可以参考下
    2019-03-03
  • Django一小时写出账号密码管理系统

    Django一小时写出账号密码管理系统

    这篇文章主要介绍了Django一小时写出账号密码管理系统,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-04-04
  • 通过Python来使用七牛云存储的方法详解

    通过Python来使用七牛云存储的方法详解

    这篇文章主要介绍了通过Python来使用七牛云存储的方法详解,七牛云存储是国内领先的服务器数据备份解决方案商,需要的朋友可以参考下
    2015-08-08
  • python密码学对称和非对称密码教程

    python密码学对称和非对称密码教程

    这篇文章主要为大家介绍了python密码学对称和非对称密码教程,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • 解决python Markdown模块乱码的问题

    解决python Markdown模块乱码的问题

    今天小编就为大家分享一篇解决python Markdown模块乱码的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02

最新评论