Pandas 处理DataFrame中的inf值实现

 更新时间:2024年04月03日 11:13:24   作者:是杰夫呀  
Inf 表示正无穷大或负无穷大,通常是在数学计算中产生的结果,本文主要介绍了Pandas 处理DataFrame中的inf值实现,具有一定的参考价值,感兴趣的可以了解一下

Inf 表示正无穷大或负无穷大,通常是在数学计算中产生的结果。

例如,

import numpy as np

# 创建一个包含 Infinity 的数组
arr = np.array([3.0, 4.0, np.inf, -np.inf])
print(arr)

1)通过where方法和isinf方法查找Inf行和列

import pandas as pd
import numpy as np

df = pd.DataFrame(np.arange(18).reshape(3,6), index=list('abc'), columns=list('uvwxyz'))
print('*'*36)
# 将df的第一列变成Inf
df.u = np.inf
print(df)
print('*'*36)
#输出结果,是一个tuple,前面array是横坐标,后面的array是纵坐标。
print(np.where(np.isinf(df)))

2)数据处理

import pandas as pd
import numpy as np

df = pd.DataFrame(np.arange(18).reshape(3,6), index=list('abc'), columns=list('uvwxyz'))
print('*'*36)
# 将df的第一列变成NaN
df.u = np.inf
print(df)
print('*'*36)
#输出结果,是一个tuple,前面array是横坐标,后面的array是纵坐标。
print(np.where(np.isinf(df)))
print('*'*36)
# 使用 replace 替换整个 DataFrame 中的 Inf 值为特定值
print(df.replace(np.inf, 1, inplace=False))
print('*'*36)
#使用np.isinf()
df[np.isinf(df)]=11.0
print(df)
print('*'*36)
# 创建一个包含 Inf 的数组
arr = np.array([3.0, 4.0, np.inf, 6.0])
# 将Inf值为5
arr[np.isinf(arr)]=5
print(arr)

3)删除有Inf的行

import pandas as pd
import numpy as np

x=np.arange(0,30).reshape(5,6)
x=np.array(x,dtype=float)
x[2,3]=np.inf
x[0,4]=np.inf
print(x)
print('*'*36)
#删除包含Inf的行
x1=np.delete(x,np.where(np.isinf(x))[0],axis=0)
print(x1)

注意:np.inf和np.nan的处理方法基本相同,注意调用处理时方法名。None是Python中用于标识空缺数据,Nan是nunpy和pandas中用于标识空缺数据,None是一个Python特殊的数据类型, 但是NaN却是用一个特殊的float。

在用DataFrame计算变化率时,例如(今天-昨天) / 昨天恰好为(2-0) / 0时,这些结果数据会变为inf。

为了方便后续处理,可以利用numpy,将这些inf值进行替换。

1. 将某1列(series格式)中的 inf 替换为数值。

import numpy as np

df['Col'][np.isinf(df['Col'])] = -1

2. 将某1列(series格式)中的 inf 替换为NA值。

import numpy as np

df['Col'][np.isinf(df['Col'])] = np.nan

3. 将整个DataFrame中的 inf 替换为数值(空值同理)。#感谢评论区的补充

import numpy as np

df.replace(np.inf, -1) #替换正inf为-1

#替换正负inf为NA,加inplace参数 
df.replace([np.inf, -np.inf], np.nan, inplace=True)

相关文章

  • 解决redis与Python交互取出来的是bytes类型的问题

    解决redis与Python交互取出来的是bytes类型的问题

    这篇文章主要介绍了解决redis与Python交互取出来的是bytes类型的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-07-07
  • python 统计文件中的字符串数目示例

    python 统计文件中的字符串数目示例

    今天小编就为大家分享一篇python 统计文件中的字符串数目示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • python 装饰器的使用示例

    python 装饰器的使用示例

    这篇文章主要介绍了python 装饰器的使用示例,帮助大家更好的理解和使用python装饰器,感兴趣的朋友可以了解下
    2020-10-10
  • python如何按顺序批量修改文件名

    python如何按顺序批量修改文件名

    这篇文章主要介绍了python如何按顺序批量修改文件名问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-08-08
  • Python密码学概述双倍强度加密教程

    Python密码学概述双倍强度加密教程

    这篇文章主要为大家介绍了Python密码学概述双倍强度加密教程详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪<BR>
    2022-05-05
  • Python类与实例的使用详解

    Python类与实例的使用详解

    面向对象最重要的概念就是类(Class)和实例(Instance),必须牢记类是抽象的模板,比如Student类,而实例是根据类创建出来的一个个具体的“对象”,每个对象都拥有相同的方法,但各自的数据可能不同
    2022-08-08
  • 基于Python3.6+splinter实现自动抢火车票

    基于Python3.6+splinter实现自动抢火车票

    这篇文章主要为大家详细介绍了基于Python3.6+splinter实现自动抢火车票,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-09-09
  • Python解决非线性规划中经济调度问题

    Python解决非线性规划中经济调度问题

    Scipy是Python算法库和数学工具包,包括最优化、线性代数、积分、插值、特殊函数、傅里叶变换等模块。scipy.optimize模块中提供了多个用于非线性规划问题的方法,适用于不同类型的问题。本文将利用起解决经济调度问题,感兴趣的可以了解一下
    2022-05-05
  • numpy库reshape用法详解

    numpy库reshape用法详解

    这篇文章主要介绍了numpy库reshape用法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-04-04
  • python通过scapy获取局域网所有主机mac地址示例

    python通过scapy获取局域网所有主机mac地址示例

    这篇文章主要介绍了python通过scapy获取局域网所有主机mac地址示例,需要的朋友可以参考下
    2014-05-05

最新评论