pandas对齐运算的实现示例

更新时间：2021年10月29日 16:32:49 作者：芒果去核

本文主要介绍了pandas对齐运算的实现示例，文中通过示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下

1.算术运算和数据对齐

import numpy as np
import pandas as pd

1.1 Series

a1 = pd.Series(np.arange(4),index=['a','b','c','d'])
a2 = pd.Series(np.arange(5),index=['a','r','c','u','k'])
print(a1)
print("="*20)
print(a2)

a    0
b    1
c    2
d    3
dtype: int32
====================
a    0
r    1
c    2
u    3
k    4
dtype: int32

有相同的索引值相加后结果变为浮点数，不相同则返回NAN值。

a1 + a2

a    0.0
b    NaN
c    4.0
d    NaN
k    NaN
r    NaN
u    NaN
dtype: float64

1.2 DataFrame

a3 = pd.DataFrame(np.arange(12).reshape(3,4),index=['a','b','c'],columns=['q','w','e','r'])
a4 = pd.DataFrame(np.arange(9).reshape(3,3),index=['a','u','c'],columns=['m','e','r'])
print(a3)
print("="*20)
print(a4)

   q w   e   r
a 0 1   2   3
b 4 5   6   7
c 8 9 10 11
====================
   m e r
a 0 1 2
u 3 4 5
c 6 7 8

只有行和列索引都相同的才能运算，否则返回NAN值

a3 + a4

e   m     q   r     w
a 3.0   NaN NaN   5.0 NaN
b NaN   NaN NaN   NaN NaN
c 17.0 NaN NaN   19.0 NaN
u NaN   NaN NaN   NaN NaN

2.使用填充值的算术方法

2.1 Series

a1 = pd.Series(np.arange(4),index=['a','b','c','d'])
a2 = pd.Series(np.arange(5),index=['a','r','c','u','k'])
print(a1)
print("="*20)
print(a2)
print("="*20)
print(a1 + a2)    #有相同的索引值相加后结果变为浮点数，不相同索引值相加则返回NAN

a    0
b    1
c    2
d    3
dtype: int32
====================
a    0
r    1
c    2
u    3
k    4
dtype: int32
====================
a    0.0
b    NaN
c    4.0
d    NaN
k    NaN
r    NaN
u    NaN
dtype: float64

使用填充值，不会返回NAN值，如果a1,a2的索引值相同则将对应的值作算术运算，如果不同则作为一行新的数据，形成一个新的Series索引

a1.add(a2,fill_value=0)  #a1+a2 忽略NAN影响

a    0.0
b    1.0
c    4.0
d    3.0
k    4.0
r    1.0
u    3.0
dtype: float64

2.2 DataFrame

a3 = pd.DataFrame(np.arange(12).reshape(3,4),index=['a','b','c'],columns=['q','w','e','r'])
a4 = pd.DataFrame(np.arange(9).reshape(3,3),index=['a','u','c'],columns=['m','e','r'])
print(a3)
print("="*20)
print(a4)
print("="*20)
print(a3 + a4)   #只有行索引和列索引都相同的才能运算，否则返回NAN

   q w   e   r
a 0 1   2   3
b 4 5   6   7
c 8 9 10 11
====================
   m e r
a 0 1 2
u 3 4 5
c 6 7 8
====================
    e     m     q     r     w
a   3.0   NaN   NaN   5.0   NaN
b   NaN   NaN   NaN   NaN   NaN
c 17.0   NaN   NaN   19.0 NaN
u   NaN   NaN   NaN   NaN   NaN

只有当两个DataFrame索引独有的行和列独有的索引对应的值才返回NAN，例如下面的 b行m列返回NAN值，其索引值是由a3独有的b和a4独有的m组成的，行和列其中之一的索引值不是独有的，则返回对应DataFrame中的值，例如a行q列中的是a3,a4都有的，返回a3中 a行q列对应的值。

#使用填充值，
a3.add(a4,fill_value=0)

    e    m q     r    w
a 3.0    0.0 0.0 5.0    1.0
b 6.0    NaN 4.0 7.0    5.0
c 17.0   6.0 8.0 19.0   9.0
u 4.0    3.0 NaN 5.0    NaN

r 开头字母表示会翻转参数

1/a3

q w e r
a inf 1.000000 0.500000 0.333333
b 0.250 0.200000 0.166667 0.142857
c 0.125 0.111111 0.100000 0.090909

a3.rdiv(1)   #翻转div（除法），结果等同 1/a3

q w e r
a inf 1.000000 0.500000 0.333333
b 0.250 0.200000 0.166667 0.142857
c 0.125 0.111111 0.100000 0.090909

reindex指定索引和缺失值

将a3的列索引替换为a4的列索引，如果索引名字不相同，则返回NAN（不改变原DataFrame索引）

a3.reindex(columns=a4.columns)）

m e r
a NaN 2 3
b NaN 6 7
c NaN 10 11

#对NAN进行填充
a3.reindex(columns=a4.columns,fill_value=66)  #把所有的NAN替换为66(可指定任意值)

m e r
a 66 2 3
b 66 6 7
c 66 10 11

3.DataFrame和Series混合运算

3.1 按行广播

arr = np.arange(12).reshape(3,4)
arr

array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])

取出第一行

arr[0] #取出第一行

array([0, 1, 2, 3])

每一行都减去第一行（按行进行广播）

arr - arr[0] #每一行都减去第一行（按行进行广播）

array([[0, 0, 0, 0],
[4, 4, 4, 4],
[8, 8, 8, 8]])

a3 = pd.DataFrame(np.arange(12).reshape(3,4),index=['a','b','c'],columns=['q','w','e','r'])
a3

q w e r
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11

位置索引 iloc[m,n] 第一个参数m表示行，第二个参数n表示列

s1 = a3.iloc[0]   #取出第一行
s1

q    0
w    1
e    2
r    3
Name: a, dtype: int32

每一行都减去第一行（按行进行广播）

a3-s1    #每一行都减去第一行（按行进行广播）

q w e r
a 0 0 0 0
b 4 4 4 4
c 8 8 8 8

3.2 按列广播

取出q这一列

s2 = a3['q']  #取出q这一列
s2

a    0
b    4
c    8
Name: q, dtype: int32

默认是行axis=1，指定axis='index'或axis=0，按列进行广播(a3所有列分别减去第q列)

a3.sub(s2,axis='index')  #默认是行axis=1，指定axis='index'(或axis=0)，按列进行广播(a3所有列分别减去第q列)

q w e r
a 0 1 2 3
b 0 1 2 3
c 0 1 2 3

a3.sub(s2,axis=0)  #默认是行axis=1，指定axis=0(或)axis='index'，按列进行广播(a3所有列分别减去第q列)

q w e r
a 0 1 2 3
b 0 1 2 3
c 0 1 2 3

a3.sub(s2)  #默认情况 axis=1

a b c e q r w
a NaN NaN NaN NaN NaN NaN NaN
b NaN NaN NaN NaN NaN NaN NaN
c NaN NaN NaN NaN NaN NaN NaN

到此这篇关于pandas对齐运算的实现示例的文章就介绍到这了,更多相关pandas对齐运算内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

MediaPipe API实现骨骼识别功能分步讲解流程
MediaPipe是用于构建多模态（例如视频、音频或任何时间序列数据）、跨平台（即eAndroid、IOS、web、边缘设备）应用ML管道的框架。这篇文章主要介绍了MediaPipe API实现骨骼识别功能分步流程
2022-09-09
详解python编程slice与indices函数用法示例
这篇文章主要介绍了详解python编程中slice与indices使用示例，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2021-09-09
Python3中对json格式数据的分析处理
这篇文章主要介绍了Python3中对json格式数据的分析处理,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2021-01-01
Python中浅拷贝copy与深拷贝deepcopy的简单理解
今天小编就为大家分享一篇关于Python中浅拷贝copy与深拷贝deepcopy的简单理解，小编觉得内容挺不错的，现在分享给大家，具有很好的参考价值，需要的朋友一起跟随小编来看看吧
2018-10-10
Python利用multiprocessing实现最简单的分布式作业调度系统实例
这篇文章主要给大家介绍了关于Python利用multiprocessing如何实现最简单的分布式作业调度系统的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面来一起看看吧。
2017-11-11
Python通过select实现异步IO的方法
这篇文章主要介绍了Python通过select实现异步IO的方法,实例分析了Python中select模块的使用技巧,需要的朋友可以参考下
2015-06-06
win10下python2和python3共存问题解决方法
在本篇文章里小编给大家整理了关于win10下python2和python3共存问题解决方法，有兴趣的朋友们参考下。
2019-12-12
PyTorch 中的 torch.utils.data 解析(推荐)
这篇文章主要介绍了PyTorch torch.utils.data.Dataset概述案例详解,主要介绍对 torch.utils.data.Dataset 的理解，需要的朋友可以参考下
2023-02-02
Python 中单例模式的实现方法
这篇文章主要介绍了Python 中单例模式的实现方法，文章围绕主题展开详细的内容介绍，具有一定的参考价值，感兴趣的小伙伴可以学习一下下面文章详细内容
2022-08-08
Python实现字符串模糊匹配详解
这篇文章主要为大家详细介绍了Python实现字符串模糊匹配的相关知识,文中的示例代码讲解详细,具有一定的借鉴价值,感兴趣的小伙伴可以了解下
2023-11-11