Python数据挖掘中常用的五种AutoEDA 工具总结

 更新时间:2021年11月19日 09:52:22   作者:Python学习与数据挖掘  
大家好,我们都知道在数据挖掘的过程中,数据探索性分析一直是非常耗时的一个环节,但也是绕不开的一个环节,本篇文章带你盘点数据挖掘中常见的5种 AutoEDA 工具

我们能否使用一些自动化工具代替人来完成数据分析的过程呢,现有一些成熟的 AutoEDA 工具可以一定程度上完成上述过程。本文中,我将盘点常见的 AutoEDA 工具,欢迎收藏学习,喜欢点赞支持,文末提供技术交流群,欢迎畅聊。

1、Pandas Profiling

https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html

Pandas Profiling是款比较成熟的工具,可以直接传入DataFrame即可完成分析过程,将结果展示为HTML格式,同时分析功能也比较强大。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、重复行分析
  • 耗时:较少

图片

2、AutoViz

https://github.com/AutoViML/AutoViz

AutoViz是款美观的数据分析工具,在进行可视化的同时将结果保存为图片格式。

  • 功能:相关性分析、数值变量箱线图、数值变量分布图
  • 耗时:较多

图片

3、Dataprep

https://dataprep.ai/

Dataprep是款比较灵活也比较强大的工具,也是笔者最喜欢的。它可以指定列进行分析,同时也可以在Notebook中进行交互式分析。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、交互式分析。
  • 耗时:较多

图片

4、SweetViz

https://github.com/fbdesignpro/sweetviz

SweetViz是款强大的数据分析工具,可以很好的分析训练集和测试集,以及目标标签与特征之间的关系。

  • 功能:数据集对比分析、字段类型分析、变量分布分析、目标变量分析
  • 耗时:中等

图片

5、D-Tale

https://github.com/man-group/dtale

D-Tale是款功能最为强大的数据分析工具,对单变量的分析过程支持比较好。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、交互式分析。
  • 耗时:中等

图片

技术交流

欢迎转载、收藏、有所收获点赞支持一下!

在这里插入图片描述

到此这篇关于Python数据挖掘中常用的五种AutoEDA 工具总结的文章就介绍到这了,更多相关Python 数据挖掘内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python组合数据类型详解

    Python组合数据类型详解

    这篇文章主要介绍了Python组合数据类型详解,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的朋友可以参考一下
    2022-08-08
  • Queue 实现生产者消费者模型(实例讲解)

    Queue 实现生产者消费者模型(实例讲解)

    下面小编就为大家带来一篇Queue 实现生产者消费者模型(实例讲解)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-11-11
  • python中bottle使用实例代码

    python中bottle使用实例代码

    这篇文章主要介绍了python bottle使用实例,主要是搞懂python中如何来组织包,如何调用包,如何读取配置文件,连接数据库,设置路由,路由分组,具体示例代码跟随小编一起看看吧
    2021-08-08
  • python 列表,集合和字典的增删改查

    python 列表,集合和字典的增删改查

    这篇文章主要介绍了python 列表,集合和字典的增删改查,本文分别对他们一一说明,小编觉得这篇文章写的还不错,需要的朋友可以参考下,希望能够给你带来帮助
    2021-10-10
  • python生成式的send()方法(详解)

    python生成式的send()方法(详解)

    下面小编就为 大家带来一篇python生成式的send()方法(详解)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-05-05
  • Python实现新版正方系统滑动验证码识别

    Python实现新版正方系统滑动验证码识别

    这篇文章主要介绍了基于Python实现新版正方系统滑动验证码识别算法和方案,文中示例代码对我们的学习和工作有一定的帮助,感兴趣的可以了解一下
    2021-12-12
  • Python图片检索之以图搜图

    Python图片检索之以图搜图

    由于很多论文里面的测试图片没有标号,就不能确定它们是Testset数据集中哪几张图片.为了能解决这个问题,需要完成以图片去搜索整个数据集文件目录的任务.本文有非常详细的图文示例,需要的朋友可以参考下
    2021-05-05
  • NumPy 与 Python 内置列表计算标准差区别详析

    NumPy 与 Python 内置列表计算标准差区别详析

    这篇文章主要介绍了NumPy与Python内置列表计算标准差区别详析,NumPy,是Numerical Python的简称,用于高性能科学计算和数据分析的基础包,更多相关内容需要的朋友可以参考一下
    2022-07-07
  • Python编程二分法实现冒泡算法+快速排序代码示例

    Python编程二分法实现冒泡算法+快速排序代码示例

    这篇文章主要介绍了Python编程二分法实现冒泡算法+快速排序代码示例,具有一定借鉴价值,需要的朋友可以参考下
    2018-01-01
  • Python灰度变换中位图切割分析实现

    Python灰度变换中位图切割分析实现

    灰度变换是指根据某种目标条件按一定变换关系逐点改变源图像中每个像素灰度值的方法。目的是改善画质,使图像显示效果更加清晰。图像的灰度变换处理是图像增强处理技术中的一种非常基础、直接的空间域图像处理方法,也是图像数字化软件和图像显示软件的一个重要组成部分
    2022-10-10

最新评论