Python缺失值处理方法

 更新时间:2022年05月18日 17:00:47   作者:​ FizzH   ​  
这篇文章主要介绍了Python缺失值处理方法,文章围绕主题展开详细内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下

前言:

前面python重复值处理得方法我们讲了重复值是怎么处理的,今天就来说说缺失值。缺失值主要分为机械原因和人为原因。机械原因就是存储器坏了,机器故障等等原因导致某段时间未能收集到数据。人为原因的情况种类就更多了,如刻意隐瞒等等。

先构建一个含有缺失值的DataFrame,如下:

import pandas as pd
import numpy as np
data = pd.DataFrame([[1,np.nan,3],[np.nan,5,np.nan]],columns = ['a','b','c'])
print(data)

看出来了吗?np.nan就是NAN值,空值的意思。

在numpy中有一个函数可以用来查看空值,不对,是两个,isnull()和isna()这两函数。

我们分别来试试它们的效果:

import pandas as pd
import numpy as np
data = pd.DataFrame([[1,np.nan,3],[np.nan,5,np.nan]],columns = ['a','b','c'])
data.isnull()
data.isna()

可以看出,这两函数的作用就是判断数据是不是空值,如果是,就返回true,不是就是false。

通常,对空值的处理有两种方法,一种就是把空值删除,另外一种就是把它填上,我们先说第一种,删除空值,我们可以dropna()这一函数来把空值删除。要注意,它会把含有空值的整行都删掉。例如:

import pandas as pd
import numpy as np
data = pd.DataFrame([[1,np.nan,3],[np.nan,5,np.nan]],columns = ['a','b','c'])
data.dropna()

上面的例子用了drop函数后,啥都没啦! 

我们可以设置当每行空值多余2个时再删除(低于2个保留),这时候要用到dropna()的参数thresh。

补充空值的话有挺多的方法,有用均值补充,中位数补充等,我们要用到fillna()这一函数。例如,我们用均值来填充上文中的data,

代码如下:

import pandas as pd
import numpy as np
data = pd.DataFrame([[1,np.nan,3],[np.nan,5,np.nan]],columns = ['a','b','c'])
data.fillna(data.mean())

代码运行的结果如下,可以看到空值都被对应列的均值所填充。

到此这篇关于Python缺失值处理方法的文章就介绍到这了,更多相关Python 缺失值 内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python采集某度贴吧排行榜实战示例

    Python采集某度贴吧排行榜实战示例

    这篇文章主要为大家介绍了Python采集某度贴吧排行榜实战示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-04-04
  • Python使用Webargs实现简化Web应用程序的参数处理

    Python使用Webargs实现简化Web应用程序的参数处理

    在开发Web应用程序时,参数处理是一个常见的任务,Python的Webargs模块为我们提供了一种简单而强大的方式来处理这些参数,下面我们就来学习一下具体操作吧
    2024-02-02
  • Python读写文件基础知识点

    Python读写文件基础知识点

    在本篇文章中小编给大家整理了关于Python读写文件的基础知识内容,有兴趣的朋友们跟着学习下。
    2019-06-06
  • Python报错TypeError: unhashable type: ‘numpy.ndarray‘的解决办法

    Python报错TypeError: unhashable type: ‘numpy.nd

    在Python编程中,尤其是在处理数据时,我们经常使用numpy数组,然而,当我们尝试将numpy数组用作字典的键或集合的元素时,就会遇到TypeError: unhashable type: 'numpy.ndarray',本文将探讨这个错误的原因,并给出几种可能的解决方案,需要的朋友可以参考下
    2024-09-09
  • Python 获取md5值(hashlib)常用方法

    Python 获取md5值(hashlib)常用方法

    这篇文章主要介绍了Python获取md5值(hashlib)常用方法,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-07-07
  • 从零学python系列之新版本导入httplib模块报ImportError解决方案

    从零学python系列之新版本导入httplib模块报ImportError解决方案

    在使用新版python打开旧版本代码的时候,可能会有些报错或者不兼容的情况出现,今天我们就来分析其中的一种情况
    2014-05-05
  • 使用Python自建轻量级的HTTP调试工具

    使用Python自建轻量级的HTTP调试工具

    这篇文章主要为大家详细介绍了如何使用Python自建一个轻量级的HTTP调试工具,文中的示例代码讲解详细,感兴趣的小伙伴可以参考一下
    2025-04-04
  • 利用python计算时间差(返回天数)

    利用python计算时间差(返回天数)

    这篇文章主要给大家介绍了关于如何利用python计算时间差(返回天数)的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用python具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-09-09
  • Python 整行读取文本方法并去掉readlines换行\n操作

    Python 整行读取文本方法并去掉readlines换行\n操作

    这篇文章主要介绍了Python 整行读取文本方法并去掉readlines换行\n操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-09-09
  • 利用Python中xlwt模块操作excel的示例详解

    利用Python中xlwt模块操作excel的示例详解

    在开发中,我们最常见的数据问题之一,就是对数据进行导出整理给运营人员,所以操作excel就显得重中之重,在python中操作excel可以借助xlwt模块。感兴趣的可以跟随小编一起学习一下这篇文章
    2022-01-01

最新评论