pandas读取excel统计空值数量错误的解决方法

 更新时间:2024年04月02日 11:07:21   作者:想当运维的程序猿  
pd.read_excel()读取excel数据后,用pd.isnull().sum()统计空值数量不对,本文主要介绍了pandas读取excel统计空值数量错误的解决方法,感兴趣的可以了解一下

问题: pd.read_excel()读取excel数据后,用pd.isnull().sum()统计空值数量不对,代码如下

import pandas as pd

df = pd.read_excel('test.xlsx',dtype=str)
# 剔除空格
df = df.applymap(lambda x : str(x).strip())
print("b列为空的个数为"+ str(pd.isnull(df['b']).sum())) # 打印出来b列中为空的是0个

excel数据长这样,B2是一个空格,希望得到空值为2的结果

在这里插入图片描述

问题分析:

读取excel后的df是这样

在这里插入图片描述

使用applymap剔除空格后的df是这样

在这里插入图片描述

读取excel后的df的值(df.values)

在这里插入图片描述

使用applymap剔除空格后的df的值(df.values)

在这里插入图片描述

可以看到,在applymap方法处理后

值values的变化:一个空格变成了’’,之前的nan变成了’nan’(这里是字符串nan,当然不为空)

pd.isnull()只会统计NaN的数量,一个是字符串’‘,一个是字符串’nan’,因此都统计不到

解决: 将’'和’nan’全部替换为np.nan,isnull就可以统计到

import numpy as np
import pandas as pd

df = pd.read_excel('test.xlsx',dtype=str)
# 剔除空格
df = df.applymap(lambda x : str(x).strip())
df[df == ''] = np.nan
df[df == 'nan'] = np.nan
print("b列为空的个数为"+ str(pd.isnull(df['b']).sum())) # 打印出来b列中为空的是2个

到此这篇关于pandas读取excel统计空值数量错误的解决方法的文章就介绍到这了,更多相关pandas读取excel空值内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家! 

 

相关文章

  • python检测IP地址变化并触发事件

    python检测IP地址变化并触发事件

    这篇文章主要为大家详细介绍了python检测IP地址变化并触发事件,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-12-12
  • Python中的Popen函数demo演示

    Python中的Popen函数demo演示

    在Python的subprocess模块中,Popen函数用于创建子进程并与之通信,相较于os.system(),Popen提供了更多灵活性,如可捕获子进程的标准输出和错误,exe_path参数用于指定要执行的文件或命令,本文给大家介绍Python中的Popen函数,感兴趣的朋友一起看看吧
    2024-09-09
  • Python语言中的重要函数对象用法小结

    Python语言中的重要函数对象用法小结

    Python作为一种强大的编程语言,提供了多种高级函数对象,如lambda匿名函数、map()、reduce()函数,以及迭代器和生成器的使用,本文给大家介绍Python语言中的重要函数对象用法,感兴趣的朋友跟随小编一起看看吧
    2024-09-09
  • python 函数内部修改外部变量的方法

    python 函数内部修改外部变量的方法

    今天小编就为大家分享一篇python 函数内部修改外部变量的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • 如何使用 profile 进行python代码性能分析

    如何使用 profile 进行python代码性能分析

    对代码优化的前提是需要了解性能瓶颈在什么地方,程序运行的主要时间是消耗在哪里,对于比较复杂的代码可以借助一些工具来定位,python 内置了丰富的性能分析工具,本文介绍如何使用profile进行python代码性能分析,感兴趣的朋友一起看看吧
    2024-12-12
  • 关于Python中模块的简介、定义与使用

    关于Python中模块的简介、定义与使用

    这篇文章主要介绍了关于Python中模块的简介、定义与使用,模块是Python的重要组成部分,需要的朋友可以参考下
    2023-04-04
  • Python中的标签编码和独热编码示例详解

    Python中的标签编码和独热编码示例详解

    标签编码是一种用于将分类列转换为数值列的技术,以便它们可以通过仅采用数值数据的机器学习模型进行拟合,这篇文章主要介绍了Python中的标签编码和独热编码,需要的朋友可以参考下
    2023-07-07
  • 关于TensorFlow新旧版本函数接口变化详解

    关于TensorFlow新旧版本函数接口变化详解

    今天小编就为大家分享一篇关于TensorFlow新旧版本函数接口变化详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • Python实现合并两个字典的8种方法

    Python实现合并两个字典的8种方法

    Python有多种方法可以通过使用各种函数和构造函数来合并字典,本文主要介绍了Python实现合并两个字典的8种方法,具有一定的参考价值,感兴趣的可以了解一下
    2024-07-07
  • Python 读取 Word 文档操作

    Python 读取 Word 文档操作

    这篇文章主要介绍了Python读取Word文档操作,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-08-08

最新评论