python中dropna()函数的作用举例说明

 更新时间:2023年11月13日 11:46:36   作者:Wzideng  
这篇文章主要给大家介绍了关于python中dropna()函数的相关资料,dropna()是pandas库中的一个函数,用于删除DataFrame中的缺失值,文中通过代码介绍的非常详细,需要的朋友可以参考下

在Python中,dropna()是一个Pandas库中的函数,用于从数据框(DataFrame)中删除包含缺失值(NaN)的行或列。它用于数据清洗和预处理阶段,以便去除缺失值,使数据更加规整。

dropna()函数的语法如下:

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

参数说明:

  • axis:可选参数,表示删除行还是列。默认值为0,表示删除包含缺失值的行;设置为1表示删除包含缺失值的列。
  • how:可选参数,表示删除的条件。默认值为’any’,表示只要存在一个缺失值就删除整行或整列;设置为’all’表示只有当整行或整列都是缺失值时才删除。
  • thresh:可选参数,表示在删除之前需要满足的非缺失值的最小数量。如果行或列中的非缺失值数量小于等于thresh,则会被删除。
  • subset:可选参数,用于指定要检查缺失值的特定列名或行索引。
  • inplace:可选参数,表示是否对原始数据进行就地修改。默认值为False,表示不修改原始数据,而是返回一个新的数据框。

下面是一些使用dropna()函数的示例:

import pandas as pd

# 创建包含缺失值的数据框
data = {'A': [1, 2, None, 4],
        'B': [None, 6, 7, 8],
        'C': [9, 10, 11, 12]}
df = pd.DataFrame(data)

# 删除包含缺失值的行
cleaned_df = df.dropna()

# 删除包含缺失值的列
cleaned_df = df.dropna(axis=1)

# 只删除整行或整列都是缺失值的行或列
cleaned_df = df.dropna(how='all')

# 至少需要2个非缺失值才保留行或列
cleaned_df = df.dropna(thresh=2)

# 只在特定列中检查缺失值
cleaned_df = df.dropna(subset=['A', 'C'])

# 在原始数据上进行就地修改
df.dropna(inplace=True)

这些示例展示了dropna()函数的不同用法,根据你的具体需求选择合适的参数设置。

附:Python丢弃含空值的行、列

创建DataFrame数据:

import numpy as np
import pandas as pd
 
a = np.ones((11,10))
for i in range(len(a)):
    a[i,:i] = np.nan
 
d = pd.DataFrame(data=a)
print(d)

按行删除:存在空值,即删除该行

# 按行删除:存在空值,即删除该行
print(d.dropna(axis=0, how='any'))

按行删除:所有数据都为空值,即删除该行

#  按行删除:所有数据都为空值,即删除该行
print(d.dropna(axis=0, how='all'))

按列删除:该列非空元素小于5个的,即删除该列

# 按列删除:该列非空元素小于5个的,即删除该列
print(d.dropna(axis='columns', thresh=5))

设置子集:删除第0、5、6、7列都为空的行

# 设置子集:删除第0、5、6、7列都为空的行
print(d.dropna(axis='index', how='all', subset=[0,5,6,7]))

设置子集:删除第5、6、7行存在空值的列

# 设置子集:删除第5、6、7行存在空值的列
print(d.dropna(axis=1, how='any', subset=[5,6,7]))

原地修改

# 原地修改
print(d.dropna(axis=0, how='any', inplace=True))
print("==============================")
print(d)

总结

到此这篇关于python中dropna()函数的文章就介绍到这了,更多相关python dropna()函数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Django使用Celery实现异步发送邮件

    Django使用Celery实现异步发送邮件

    这篇文章主要为大家详细介绍了Django如何使用Celery实现异步发送邮件的功能,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2023-04-04
  • python神经网络tfrecords文件的写入读取及内容解析

    python神经网络tfrecords文件的写入读取及内容解析

    这篇文章主要为大家介绍了python神经网络tfrecords文件的写入读取及内容解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • flask的orm框架SQLAlchemy查询实现解析

    flask的orm框架SQLAlchemy查询实现解析

    这篇文章主要介绍了flask的orm框架SQLAlchemy查询实现解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-12-12
  • Python根据已知邻接矩阵绘制无向图操作示例

    Python根据已知邻接矩阵绘制无向图操作示例

    这篇文章主要介绍了Python根据已知邻接矩阵绘制无向图操作,涉及Python使用networkx、matplotlib进行数值运算与图形绘制相关操作技巧,需要的朋友可以参考下
    2018-06-06
  • Django框架视图函数设计示例

    Django框架视图函数设计示例

    这篇文章主要介绍了Django框架视图函数设计,结合实例形式分析了Django框架视图函数处理流程、原理与相关操作注意事项,需要的朋友可以参考下
    2019-07-07
  • python文件转为exe文件的方法及用法详解

    python文件转为exe文件的方法及用法详解

    py2exe是一个将python脚本转换成windows上的可独立执行的可执行程序(*.exe)的工具,这样,你就可以不用装python而在windows系统上运行这个可执行程序。本文重点给大家介绍python文件转为exe文件的方法,感兴趣的朋友跟随小编一起看看吧
    2019-07-07
  • Python使用Pandas对比两列数据取最大值的五种方法

    Python使用Pandas对比两列数据取最大值的五种方法

    本文主要介绍使用 Pandas 对比两列数据取最大值的五种方法,包括使用 max 方法、apply 方法结合 lambda 函数、函数、clip 方法、where 方法结合条件赋值,并通过案例进行详细说明,需要的朋友可以参考下
    2025-02-02
  • python中dict使用方法详解

    python中dict使用方法详解

    这篇文章主要介绍了python中dict使用方法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • python uv包管理小结

    python uv包管理小结

    uv 是一个高性能的 Python 包管理工具,它不仅能够高效地处理包管理和依赖解析,还提供了对 Python 版本管理的支持,本文主要介绍了python uv包管理小结,具有一定的参考价值,感兴趣的可以了解一下
    2025-04-04
  • Django中Q查询及Q()对象 F查询及F()对象用法

    Django中Q查询及Q()对象 F查询及F()对象用法

    这篇文章主要介绍了Django中Q查询及Q()对象 F查询及F()对象用法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-07-07

最新评论