pandas缺失值np.nan, np.isnan, None, pd.isnull, pd.isna

 更新时间:2024年04月03日 10:49:59   作者:每天都想躺平的大喵  
本文主要介绍了pandas缺失值np.nan, np.isnan, None, pd.isnull, pd.isna

np.nan != np.nan

在计算机中本没有绝对绝对相等的数据,所谓的相等只是精度允许的条件下相等!np.nan 原意为 not a number。

概括:

  • 对某个值是否为nan进行判断,只能用np.isnan(i),绝不可用 i == np.nan 来判断,因为nan具有不等于自身的属性,应该使用np.isnan来测试nan值,如np.isnan(np.nan)将产生True;
  • np.nan非空对象,其类型为基本数据类型float;

np.nan

np.nan
not a membernan的含义是“not a number“,它是对array中缺失的数值的占位符
type 为 float因为代表缺失的数值,np.nan的type是float
可参与计算np.nan的type是float,所以np.nan可参与计算,且占主导地位,也就是算出的值都为np.nan
不等于自身如果用np.nan==np.nan,会发现返回的结果为False,如果用np.nan in array,也不能发现array中是否包含np.nan
np.isnan判断是否存在np.nannp.nan因为没有等于的概念,所以要判断是否存在np.nan,只可以用np.isnan来判断
np.isnan只可以判断数值型如果用np.isnan对其余type的array判断,会报错,np.isnan只可以判断数字型array
忽略np.nan的numpy计算
nansum()
nanmax()
nanmin()
nanargmax()
nanargmin()

nan和None 

  • python自带的 None ,为 NoneType 类型, 代表空类型,不能参与运算
  • numpy中的 isnan 对应的是 NaN 值,代表“不是数字”,数值类型为 float ,数组中显示为nan,能参与运算,但结果显示为NaN;

None

None
NoneTypeNone的type为NoneType,是python内置的
不可参与计算None不可参与计算,否则报错
None is None 或者 None==None这两种方式返回值都是True

pd.isnull 和 pd.isna

pd.isnull pd.isna
pd.isnull 和 pd.isna是同一个东西用命令pd.isnull==pd.isna,会发现返回值为True
None和np.nan在pandas中都是缺省值None和np.nan都会被pd.isnull或者pd.isna判断为True
可以判断List或者单独一个值pd.isnull和pd.isna的判断对象可以为一个值或者一个list
pandas中缺省值不参与计算当使用df.min()等计算时,会发现缺省值不参与计算

代码示例

只可以用np.isnan判断array中是否包含np.nan

a = np.array([1,2,3,4,np.nan])
a == np.nan
>>> array([False, False, False, False, False])
np.nan in a
>>> False
np.isnan(a)
>>> array([False, False, False, False,  True])

np.nan可参与计算,np.nan占主导地位

a = np.array([1,2,3,4,np.nan])
a.max()
>>> np.nan
a.min()
>>> np.nan
b = np.array([1,np.nan,3,4,5])
a+b
>>> array([ 2., nan,  6.,  8., nan])

np.isnan只可以对数值型array判断,当array中其余的元素为字符串是,array会将np.nan转换成’nan’

在这里插入图片描述

在pandas中,np.nan和None都被视为缺省值

df = pd.DataFrame({'col1':['a','b','c','d'], 'col2':[1,2,3,4]})
df.loc[1,'col1'] = np.nan
df.loc[2,'col1'] = None
df
>>> col1	col2
0	a	1
1	NaN	2
2	None	3
3	d	4

pd.isna(df)
>>>	col1	col2
0	False	False
1	True	False
2	True	False
3	False	False

pandas中缺省值不参与计算

df = pd.DataFrame(np.arange(8).reshape(2,4))
df.iloc[0,1] = None
df.iloc[0,2] = np.nan
df
>>> 0	1	2	3
0	0	NaN	NaN	3
1	4	5.0	6.0	7

df.min(axis=1)
>>> 0    0.0
1    4.0
dtype: float64

到此这篇关于pandas缺失值np.nan, np.isnan, None, pd.isnull, pd.isna的文章就介绍到这了,更多相关 np.nan, np.isnan, None, pd.isnull, pd.isna内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • pandas DataFrame索引行列的实现

    pandas DataFrame索引行列的实现

    这篇文章主要介绍了pandas DataFrame索引行列的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-06-06
  • Python tkinter的grid布局及Text动态显示方法

    Python tkinter的grid布局及Text动态显示方法

    今天小编就为大家分享一篇Python tkinter的grid布局及Text动态显示方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • Python split() 函数拆分字符串将字符串转化为列的方法

    Python split() 函数拆分字符串将字符串转化为列的方法

    今天小编就为大家分享一篇Python split() 函数拆分字符串将字符串转化为列的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • pandas Dataframe行列读取的实例

    pandas Dataframe行列读取的实例

    今天小编就为大家分享一篇pandas Dataframe行列读取的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • python使用Berkeley DB数据库实例

    python使用Berkeley DB数据库实例

    这篇文章主要介绍了python使用Berkeley DB数据库的方法,以实例形式讲述了完整的操作过程,并总结了具体的操作步骤,非常具有实用性,需要的朋友可以参考下
    2014-09-09
  • Python语言编写电脑时间自动同步小工具

    Python语言编写电脑时间自动同步小工具

    家里有台很多年前买的电脑,CMOS电池残废了,经常遇到开机后系统时间被重置的情况,老妈向我反映用起来很不方便。于是身为一个程序员的我想到写个小工具来帮老妈排忧解难
    2013-03-03
  • 如何利用pandas将Excel转为html格式

    如何利用pandas将Excel转为html格式

    工作中经常会遇到Excel转为html格式这种需求,下面这篇文章主要给大家介绍了关于如何利用pandas将Excel转为html格式的相关资料,主要利用的是pd.to_html,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2021-08-08
  • python简单贪吃蛇开发

    python简单贪吃蛇开发

    这篇文章主要为大家详细介绍了python简单贪吃蛇开发,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-01-01
  • 基于Python爬取爱奇艺资源过程解析

    基于Python爬取爱奇艺资源过程解析

    这篇文章主要介绍了基于Python爬取爱奇艺资源过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-03-03
  • 关于Python 3中print函数的换行详解

    关于Python 3中print函数的换行详解

    最近在学习python3,发现了一个问题想着总结出来,所以下面这篇文章主要给大家介绍了关于Python 3中print函数换行的相关资料,文中通过示例代码介绍的非常详细,对需要的朋友们具有一定的参考学习价值,感兴趣的朋友们下面随着小编来一起学习学习吧。
    2017-08-08

最新评论