Pandas 如何处理DataFrame中的inf值

 更新时间:2022年05月09日 10:16:49   作者:是杰夫呀  
这篇文章主要介绍了Pandas 如何处理DataFrame中的inf值,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

如何处理DataFrame的inf值

在用DataFrame计算变化率时,例如(今天-昨天) / 昨天恰好为(2-0) / 0时,这些结果数据会变为inf。

为了方便后续处理,可以利用numpy,将这些inf值进行替换。

1. 将某1列(series格式)中的 inf 替换为数值。

import numpy as np
 
df['Col'][np.isinf(df['Col'])] = -1

2. 将某1列(series格式)中的 inf 替换为NA值。

import numpy as np
 
df['Col'][np.isinf(df['Col'])] = np.nan

3. 将整个DataFrame中的 inf 替换为数值(空值同理)。#感谢评论区的补充

import numpy as np
 
df.replace(np.inf, -1) #替换正inf为-1
 
#替换正负inf为NA,加inplace参数 
df.replace([np.inf, -np.inf], np.nan, inplace=True)

DataFrame有关inf的处理技巧

numpy中inf的相关文档

什么是inf?

IEEE 754浮点表示(正)无穷大。

为什么会产生?

>>> np.NINF
-inf
>>> np.inf
inf
>>> np.log(0)
-inf
>>> np.array([1,2])/0 #碰到的最多的情况
array([ inf,  inf])

产生inf有什么好处?

目前没看到有什么好处,只是单纯用inf表示无穷大,方便理解和表示。

产生inf有什么坏处?

对用户而言,对inf需要特殊处理,加大了工作量。

为什么需要特殊处理?因为许多机器学习算法库并不支持对inf的处理。

怎么处理?

常见的处理方法:

  • 不处理
  • 替换

怎么获取到inf的所在位置并进行填补?

  • isinf:显示哪些元素为正或负无穷大
  • isposinf:显示哪些元素为正无穷大
  • isneginf:显示哪些元素为负无穷大
  • isnan:显示哪些元素不是数字
  • isfinite:显示哪些元素是有限的(不是非数字,正无穷大和负无穷大中的一个)
'''
>>> np.isinf(np.inf) #其他函数同理使用,isinf使用最多。
True
>>> np.isinf(np.array([1,np.inf]))
array([False,  True], dtype=bool)
>>>np.isinf(pd.DataFrame(np.array([1,np.inf])))
       0
0  False
1   True
>>>s1 = pd.Series([1,2,3,np.inf])
>>>s1
0    1.0
1    2.0
2    3.0
3    NaN
dtype: float64
#对inf填补 999
>>>s1[np.isinf(s1)] = 999
>>>s1
0    1.0
1    2.0
2    3.0
3  999.0
dtype: float64
#对inf填补np.nan (较为常用)
>>>s1[np.isinf(s1)] = np.nan
>>>s1
0    1.0
1    2.0
2    3.0
3    NaN
dtype: float64

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • python基于plotly实现画饼状图代码实例

    python基于plotly实现画饼状图代码实例

    这篇文章主要介绍了python基于plotly实现画饼状图代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-12-12
  • Python实现115网盘自动下载的方法

    Python实现115网盘自动下载的方法

    这篇文章主要介绍了Python实现115网盘自动下载的方法,可实现自动调用115客户端进行下载的功能,非常实用,需要的朋友可以参考下
    2014-09-09
  • Python使用matplotlib绘图无法显示中文问题的解决方法

    Python使用matplotlib绘图无法显示中文问题的解决方法

    这篇文章主要介绍了Python使用matplotlib绘图无法显示中文问题的解决方法,结合具体实例形式分析了Python使用matplotlib绘图时出现中文乱码的原因与相关解决方法,需要的朋友可以参考下
    2018-03-03
  • 在Python中利用Pandas库处理大数据的简单介绍

    在Python中利用Pandas库处理大数据的简单介绍

    这篇文章简单介绍了在Python中利用Pandas处理大数据的过程,Pandas库的使用能够很好地展现数据结构,是近来Python项目中经常被使用使用的热门技术,需要的朋友可以参考下
    2015-04-04
  • python编码问题汇总

    python编码问题汇总

    这篇文章主要给大家分享的是python编码问题汇总,字符编码简单介绍和发展史及使用方法的一些介绍,文章内容详细,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-03-03
  • python实现去掉字符串中的\xa0、\t、\n

    python实现去掉字符串中的\xa0、\t、\n

    这篇文章主要介绍了python实现去掉字符串中的\xa0、\t、\n方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-08-08
  • python简单猜数游戏实例

    python简单猜数游戏实例

    这篇文章主要介绍了python简单猜数游戏,涉及Python随机数及流程控制的相关技巧,需要的朋友可以参考下
    2015-07-07
  • python二进制文件的转译详解

    python二进制文件的转译详解

    这篇文章主要介绍了python二进制文件的转译详解的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • Python使用Paramiko实现轻松判断文件类型

    Python使用Paramiko实现轻松判断文件类型

    Paramiko是一个用于SSHv2协议的Python实现,提供了客户端和服务器功能,下面我们就来看看如何使用Paramiko判断文件类型,并提取文件的上级目录吧
    2025-03-03
  • python字符串连接方法分析

    python字符串连接方法分析

    这篇文章主要介绍了python字符串连接方法,结合实例形式对比分析了常用的字符串连接技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2016-04-04

最新评论