pandas如何将dataframe中的NaN替换成None

 更新时间:2023年08月15日 14:31:45   作者:什么都干的派森  
这篇文章主要介绍了pandas如何将dataframe中的NaN替换成None问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

pandas将dataframe的NaN替换成None

df = df.where(df.notnull(), None)

dataframe缺失值(NaN)处理

在进行机器学习的特征工程时,常常需要根据选择的机器学习算法,采用合适的数据预处理方式,特别是对于对于空值(NaN)的处理,常常使人感到困惑。

一般对于NaN,常常有两种处理方式:

  • 第一种——填补。
  • 第二种——不处理。

当你使用sklearn库进行机器学习训练时,一般对于缺失值要求较为严格,因此,需要进行填补,至于填补为何值,则需要根据业务需求进行。

当你使用lightgbm库一类库进行机器学习训练时,一般不需要处理缺失值,因为这类算法,天然支持缺失值处理,它会将缺失值单独分为一类。

本人认为,数据的缺失,在实际中是存在一定的业务含义的,例如月收入的缺失,就反应人对于自己收入的不自信,因此在风控领域就存在更容易逾期现象。但此时若是进行均值的缺失值填补,则会使该业务含义消失,因此我觉得是不可取的。

数据的特征工程决定数据质量,数据质量决定模型效果上限,模型参数决定训练的模型能否逼近理论模型,特征工程的难易复杂程度决定模型最终上线的工作量。

(以上为本人的一点点见解)

判断缺失值的函数有:np.isnan()/ pd.isna()/pd.isnull()。

  • np.isnan():一般用于单个值,也可以用于Series或者DataFrame,但是这里存在一个坑,np.isnan()判断datetime类型的Series或者DataFrame会报错。
  • pd.isna()pd.isnull():用的比较多,一般推荐使用pd.isna()
s1 = pd.Series([1,2,3,np.nan])
np.isnan(s1)
>>> 0    False
	1    False
	2    False
	3     True
	dtype: bool
pd.isna(s1)
>>> 0    False
	1    False
	2    False
	3     True
	dtype: bool
pd.isnull(s1)
>>> 0    False
	1    False
	2    False
	3     True
	dtype: bool

除了以上的方法之外,还有一种较为方便和万能的方法来判断缺失值,取出非缺失值进行处理(本人一般也采用这种方法)。    

通过对np.nan==np.nan发现,np.nan是不会等于np.nan,因此我们可以通过以下方式取出非缺失值。

np.nan==np.nan
>>> False
s1 = pd.Series([1,2,3,np.nan])
s1==s1
>>> 0     True
	1     True
	2     True
	3    False
	dtype: bool
#获取非缺失值
s1[s1==s1]
>>> 0    1.0
	1    2.0
	2    3.0
	dtype: float64
#获取非缺失值的数量
len(s1[s1==s1])
>>>3
#对缺失值进行填补(除了fillna外的方式)
s1[~(s1==s1)]=0
s1
>>> 0    1.0
	1    2.0
	2    3.0
	3    0.0
	dtype: float64

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • PyTorch函数torch.cat与torch.stac的区别小结

    PyTorch函数torch.cat与torch.stac的区别小结

    Pytorch中常用的两个拼接函数torch.cat() 和 torch.stack(),本文主要介绍了这两个函数的用法加区别,具有一定的参考价值,感兴趣的可以了解一下
    2023-09-09
  • 如何利用python制作时间戳转换工具详解

    如何利用python制作时间戳转换工具详解

    这篇文章主要给大家介绍了关于如何利用python制作时间戳转换工具的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-09-09
  • Python迭代器与生成器基本用法分析

    Python迭代器与生成器基本用法分析

    这篇文章主要介绍了Python迭代器与生成器基本用法,结合实例形式分析了Python迭代器与生成器的基本功能、定义及使用方法,需要的朋友可以参考下
    2018-07-07
  • 浅谈对Python变量的一些认识理解

    浅谈对Python变量的一些认识理解

    变量(variable)是编程的基础概念,Python 的变量看似简单,深入了解却不易.文中有非常详细的介绍及代码示例,对正在学习python的小伙伴们很有帮助,需要的朋友可以参考下
    2021-05-05
  • 关于Python调用百度语音合成SDK实现文字转音频的方法

    关于Python调用百度语音合成SDK实现文字转音频的方法

    这篇文章主要介绍了关于Python调用百度语音合成SDK实现文字转音频的方法,AipSpeech是语音合成的Python SDK客户端,为使用语音合成的开发人员提供了一系列的交互方法,需要的朋友可以参考下
    2023-07-07
  • 520必备!这些Python表白代码祝你脱单成功

    520必备!这些Python表白代码祝你脱单成功

    不会还有程序猿没有女朋友吧?没关系,今天特地为大家整理了这些Python花式表白代码,你就放心大胆的去吧,需要的朋友可以参考下
    2021-05-05
  • Python实现打地鼠游戏

    Python实现打地鼠游戏

    这篇文章主要为大家详细介绍了Python利用Pygame模块实现简单打地鼠游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-12-12
  • 用python-webdriver实现自动填表的示例代码

    用python-webdriver实现自动填表的示例代码

    这篇文章主要介绍了用python-webdriver实现自动填表的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • Python使用combinations实现排列组合的方法

    Python使用combinations实现排列组合的方法

    今天小编就为大家分享一篇Python使用combinations实现排列组合的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • Python wxPython库消息对话框MessageDialog用法示例

    Python wxPython库消息对话框MessageDialog用法示例

    这篇文章主要介绍了Python wxPython库消息对话框MessageDialog用法,结合实例形式简单分析了wxPython库的基本事件与相关使用技巧,需要的朋友可以参考下
    2018-09-09

最新评论