pandas读取excel统计空值数量错误的解决方法

 更新时间:2024年04月02日 11:07:21   作者:想当运维的程序猿  
pd.read_excel()读取excel数据后,用pd.isnull().sum()统计空值数量不对,本文主要介绍了pandas读取excel统计空值数量错误的解决方法,感兴趣的可以了解一下

问题: pd.read_excel()读取excel数据后,用pd.isnull().sum()统计空值数量不对,代码如下

import pandas as pd

df = pd.read_excel('test.xlsx',dtype=str)
# 剔除空格
df = df.applymap(lambda x : str(x).strip())
print("b列为空的个数为"+ str(pd.isnull(df['b']).sum())) # 打印出来b列中为空的是0个

excel数据长这样,B2是一个空格,希望得到空值为2的结果

在这里插入图片描述

问题分析:

读取excel后的df是这样

在这里插入图片描述

使用applymap剔除空格后的df是这样

在这里插入图片描述

读取excel后的df的值(df.values)

在这里插入图片描述

使用applymap剔除空格后的df的值(df.values)

在这里插入图片描述

可以看到,在applymap方法处理后

值values的变化:一个空格变成了’’,之前的nan变成了’nan’(这里是字符串nan,当然不为空)

pd.isnull()只会统计NaN的数量,一个是字符串’‘,一个是字符串’nan’,因此都统计不到

解决: 将’'和’nan’全部替换为np.nan,isnull就可以统计到

import numpy as np
import pandas as pd

df = pd.read_excel('test.xlsx',dtype=str)
# 剔除空格
df = df.applymap(lambda x : str(x).strip())
df[df == ''] = np.nan
df[df == 'nan'] = np.nan
print("b列为空的个数为"+ str(pd.isnull(df['b']).sum())) # 打印出来b列中为空的是2个

到此这篇关于pandas读取excel统计空值数量错误的解决方法的文章就介绍到这了,更多相关pandas读取excel空值内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家! 

 

相关文章

  • pycharm中使用request和Pytest进行接口测试的方法

    pycharm中使用request和Pytest进行接口测试的方法

    这篇文章主要介绍了pycharm中使用request和Pytest进行接口测试的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-07-07
  • pytorch 移动端部署之helloworld的使用

    pytorch 移动端部署之helloworld的使用

    这篇文章主要介绍了pytorch 移动端部署之helloworld的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-10-10
  • Python -m参数原理及使用方法解析

    Python -m参数原理及使用方法解析

    这篇文章主要介绍了Python -m参数原理及使用方法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-08-08
  • Python os.path.exists()函数总是返回false的解决方案

    Python os.path.exists()函数总是返回false的解决方案

    这篇文章主要介绍了Python os.path.exists()函数总是返回false的解决方案,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • Python虚拟环境venv的使用方法

    Python虚拟环境venv的使用方法

    venv 是 Python 里的一个标准工具,它的主要功能是帮助用户管理和控制虚拟环境,venv 的使用方法其实非常简单,下面我将详细介绍如何创建虚拟环境,如何激活虚拟环境,以及如何退出虚拟环境的操作步骤,需要的朋友可以参考下
    2024-03-03
  • pytorch如何自定义forward和backward函数

    pytorch如何自定义forward和backward函数

    PyTorch自动求导功能强大,但在特定情况下需要用户自行定义backward函数,通过实例解释了保存变量、计算梯度、链式法则等核心概念,并展示了如何通过自定义函数集成到网络中以及如何正确返回梯度,此外,还讨论了多输出情况下的梯度传递
    2024-10-10
  • 在Python中使用defaultdict初始化字典以及应用方法

    在Python中使用defaultdict初始化字典以及应用方法

    今天小编就为大家分享一篇在Python中使用defaultdict初始化字典以及应用方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • Python入门案例之找出文件中出现次数最多的10个单词

    Python入门案例之找出文件中出现次数最多的10个单词

    这篇文章主要为大家带来一个简单的Python入门案例——找出文件中出现次数最多的10个单词,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2023-02-02
  • python PaddleSpeech实现婴儿啼哭识别

    python PaddleSpeech实现婴儿啼哭识别

    这篇文章主要为大家介绍了python PaddleSpeech实现婴儿啼哭识别操作详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-08-08
  • Python构建机器学习API服务的操作过程

    Python构建机器学习API服务的操作过程

    这篇文章主要介绍了Python构建机器学习API服务的操作过程,通过本文的指导,读者可以学习如何使用Python构建机器学习模型的API服务,并了解到在实际应用中需要考虑的一些关键问题和解决方案,从而为自己的项目提供更好的支持和服务,需要的朋友可以参考下
    2024-04-04

最新评论