Python datacompy 找出两个DataFrames不同的地方

 更新时间:2022年05月31日 11:51:03   作者:温欣'  
本文主要介绍了Python datacompy 找出两个DataFrames不同的地方,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧<BR>

本篇博客解决在两个几乎完全相同的DataFrame当中如何找出不相同的元素,并使用datacompy直观的显示出来。

x表:

让x1和x2都是x的副本,则此时x1和x2的值是相同:

x1=x.copy()
x2=x.copy()

将其中x2的一个数据赋值为2000

x2.loc['罗梓烜']['20220125']=2000
x1[x1==x2].head(25) # 如何对不相等的数据进行纠正

此时可以看到下图这个数据是NaN值,说明对于这个数据来说x1和x2是不相同的

x1[x1==x2].isnull().sum()

下图说明在20220125这一列当中存在一个NaN值,也就是我们刚刚赋值的地方:

但是现在还是不能确定出有异常值(也就是不相等的值的那行数据),因此我们考虑使用datacompy

安装:

pip install datacompy
import datacompy,pandas as pd,sys
compy=datacompy.Compare(x1,x2,on_index=True)
compy
print(compy.matches())
print(compy.report())

此时就可以很清晰的看到两个DataFrame当中不相同的值了:

 到此这篇关于Python datacompy 找出两个DataFrames不同的地方 的文章就介绍到这了,更多相关Python 两个Dataframe不同内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python中geopandas库安装出现各种问题的解决办法

    python中geopandas库安装出现各种问题的解决办法

    这篇文章主要介绍了关于python中geopandas库安装出现各种问题的解决办法,总结了在Windows下两种安装geopandas库的方法,方法一是在新环境下使用conda命令安装,方法二通过离线安装GDAL、Fiona、Pyproj、Rtree、Shapely五个库,再用pip安装geopandas,需要的朋友可以参考下
    2024-11-11
  • Python除法保留两位小数点的三种方法实现

    Python除法保留两位小数点的三种方法实现

    这篇文章主要给大家介绍了关于Python除法保留两位小数点的三种方法实现,在py应用中有许多拿结果中的多个整数进行运算,难免少不了除法(如单位换算等),但是整数进行运算后只会返回整数,一般结果基本需要精确到后两位,需要的朋友可以参考下
    2023-08-08
  • python Dataframe 合并与去重详情

    python Dataframe 合并与去重详情

    这篇文章主要介绍了python Dataframe 合并与去重详情,文章围绕主题展开详细的内容介绍,具有一定参考价值,需要的朋友可以参考一下
    2022-08-08
  • 趣味Python实战练习之自动更换桌面壁纸脚本附源码

    趣味Python实战练习之自动更换桌面壁纸脚本附源码

    读万卷书不如行万里路,学的扎不扎实要通过实战才能看出来,本篇文章手把手带你编写一个自动更换桌面壁纸的脚本,代码简洁而且短,相信你一定看得懂,大家可以在过程中查缺补漏,看看自己掌握程度怎么样
    2021-10-10
  • Python写的一个简单监控系统

    Python写的一个简单监控系统

    这篇文章主要介绍了Python写的一个简单监控系统,本文讲解了详细的编码步骤,并给给出相应的实现代码,需要的朋友可以参考下
    2015-06-06
  • Python+OpenCV实现边缘检测与角点检测详解

    Python+OpenCV实现边缘检测与角点检测详解

    这篇文章主要为大家详细介绍了如何通过Python+OpenCV实现边缘检测与角点检测,文中的示例代码讲解详细,对我们学习Python与OpenCV有一定的帮助,需要的可以参考一下
    2023-02-02
  • Python实现类别变量的独热编码

    Python实现类别变量的独热编码

    这篇文章主要为大家详细介绍了基于Python下OneHotEncoder与pd.get_dummies两种方法,实现机器学习中最优的编码方法——独热编码的方法,需要的可以参考一下
    2023-02-02
  • Python接口自动化浅析如何处理动态数据

    Python接口自动化浅析如何处理动态数据

    本文是python接口自动化系列文章,主要介绍了接口自动化过程中,动态数据如何生成、动态数据与数据库数据进行对比并替换,有需要的朋友可以参考下
    2021-08-08
  • Python获取文件所在目录和文件名的方法

    Python获取文件所在目录和文件名的方法

    下面小编就为大家带来一篇Python获取文件所在目录和文件名的方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-01-01
  • 详谈python read readline readlines的区别

    详谈python read readline readlines的区别

    下面小编就为大家带来一篇详谈python read readline readlines的区别。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-09-09

最新评论