pandas 缺失值与空值处理的实现方法

 更新时间:2019年10月12日 14:43:55   作者:lwgkzl  
这篇文章主要介绍了pandas 缺失值与空值处理的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

1.相关函数

  • df.dropna()
  • df.fillna()
  • df.isnull()
  • df.isna()

2.相关概念

空值:在pandas中的空值是""

缺失值:在dataframe中为nan或者naT(缺失时间),在series中为none或者nan即可

3.函数具体解释

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

函数作用:删除含有空值的行或列

axis:维度,axis=0表示index行,axis=1表示columns列,默认为0

how:"all"表示这一行或列中的元素全部缺失(为nan)才删除这一行或列,"any"表示这一行或列中只要有元素缺失,就删除这一行或列

thresh:一行或一列中至少出现了thresh个才删除。

subset:在某些列的子集中选择出现了缺失值的列删除,不在子集中的含有缺失值得列或行不会删除(有axis决定是行还是列)

inplace:刷选过缺失值得新数据是存为副本还是直接在原数据上进行修改。

例子:

df = pd.DataFrame({"name": ['Alfred', 'Batman', 'Catwoman'],
        "toy": [np.nan, 'Batmobile', 'Bullwhip'],
         "born": [pd.NaT, pd.Timestamp("1940-04-25"),pd.NaT]})
 
print df


默认参数:删除行,只要有空值就会删除,不替换。

print df.dropna()
print df


print "delete colums"
print df.dropna(axis=1) #delete col


print "所有值全为缺失值才删除"
print df.dropna(how='all')


print "至少出现过两个缺失值才删除"
print df.dropna(thresh=2)


print "删除这个subset中的含有缺失值的行或列"
print df.dropna(subset=['name', 'born'])


DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)

函数作用:填充缺失值

value:需要用什么值去填充缺失值

axis:确定填充维度,从行开始或是从列开始

method:ffill:用缺失值前面的一个值代替缺失值,如果axis =1,那么就是横向的前面的值替换后面的缺失值,如果axis=0,那么则是上面的值替换下面的缺失值。backfill/bfill,缺失值后面的一个值代替前面的缺失值。注意这个参数不能与value同时出现

limit:确定填充的个数,如果limit=2,则只填充两个缺失值。

示例:

df = pd.DataFrame([[np.nan, 2, np.nan, 0],
         [3, 4, np.nan, 1],
         [np.nan, np.nan, np.nan, 5],
        [np.nan, 3, np.nan, 4]],
         columns=list('ABCD'))
 
print df
 
print "横向用缺失值前面的值替换缺失值"
print df.fillna(axis=1,method='ffill')
 
print "纵向用缺失值上面的值替换缺失值"
print df.fillna(axis=0,method='ffill')


print df.fillna(0)


不同的列用不同的值填充:


对每列出现的替换值有次数限制,此处限制为一次


DataFrame.isna()

判断是不是缺失值:


isnull同上。

替换空值:

df = pd.DataFrame([[np.nan, 2, np.nan, 0],
         [3, 4, "", 1],
         [np.nan, np.nan, np.nan, 5],
        [np.nan, 3, "", 4]],
         columns=list('ABCD'))
 
print df


如上,缺失值是NAN,空值是没有显示。

替换空值代码:需要把含有空值的那一列提出来单独处理,然后在放进去就好。

clean_z = df['C'].fillna(0)
clean_z[clean_z==''] = 'hello'
df['C'] = clean_z
print df


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • python机器学习理论与实战(六)支持向量机

    python机器学习理论与实战(六)支持向量机

    这篇文章主要介绍了python机器学习理论与实战第六篇,支持向量机的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-01-01
  • python利用rsa库做公钥解密的方法教程

    python利用rsa库做公钥解密的方法教程

    RSA是一种公钥密码算法,RSA的密文是对代码明文的数字的 E 次方求mod N 的结果。下面这篇文章主要给大家介绍了关于python利用rsa库做公钥解密的方法教程,文中通过示例代码介绍的非常详细,需要的朋友可以参考下。
    2017-12-12
  • python openpyxl的使用方法

    python openpyxl的使用方法

    Python借助openpyxl可以对xlsx文件进行操作,帮助大家高效办公,处理excel文件,下面就介绍一下相关的方法,以及一个小例子。
    2021-06-06
  • windows10在visual studio2019下配置使用openCV4.3.0

    windows10在visual studio2019下配置使用openCV4.3.0

    这篇文章主要介绍了windows10在visual studio2019下配置使用openCV4.3.0,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-07-07
  • Python编程实现输入某年某月某日计算出这一天是该年第几天的方法

    Python编程实现输入某年某月某日计算出这一天是该年第几天的方法

    这篇文章主要介绍了Python编程实现输入某年某月某日计算出这一天是该年第几天的方法,涉及Python针对日期时间的转换与运算相关操作技巧,需要的朋友可以参考下
    2017-04-04
  • Python中xml和json格式相互转换操作示例

    Python中xml和json格式相互转换操作示例

    这篇文章主要介绍了Python中xml和json格式相互转换操作,结合实例形式分析了xmltodict库的安装及xml格式与json格式数据相互转换操作技巧,需要的朋友可以参考下
    2018-12-12
  • Python中encode和encoding的区别小结

    Python中encode和encoding的区别小结

    encode和encoding在Python中虽然都与字符编码相关,但它们的角色和用途是不同的,本文主要介绍了Python中encode和encoding的区别小结,具有一定的参考价值,感兴趣的可以了解一下
    2024-03-03
  • Python爬虫实例之2021猫眼票房字体加密反爬策略(粗略版)

    Python爬虫实例之2021猫眼票房字体加密反爬策略(粗略版)

    这篇文章主要介绍了Python爬虫实例之2021猫眼票房字体加密反爬策略(粗略版),本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-02-02
  • python2.7 安装pip的方法步骤(管用)

    python2.7 安装pip的方法步骤(管用)

    这篇文章主要介绍了python2.7 安装pip的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-05-05
  • PyTorch实现卷积神经网络的搭建详解

    PyTorch实现卷积神经网络的搭建详解

    这篇文章主要为大家介绍了PyTorch实现卷积神经网络的搭建详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05

最新评论