Python数据挖掘中常用的五种AutoEDA 工具总结

 更新时间:2021年11月19日 09:52:22   作者:Python学习与数据挖掘  
大家好,我们都知道在数据挖掘的过程中,数据探索性分析一直是非常耗时的一个环节,但也是绕不开的一个环节,本篇文章带你盘点数据挖掘中常见的5种 AutoEDA 工具

我们能否使用一些自动化工具代替人来完成数据分析的过程呢,现有一些成熟的 AutoEDA 工具可以一定程度上完成上述过程。本文中,我将盘点常见的 AutoEDA 工具,欢迎收藏学习,喜欢点赞支持,文末提供技术交流群,欢迎畅聊。

1、Pandas Profiling

https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html

Pandas Profiling是款比较成熟的工具,可以直接传入DataFrame即可完成分析过程,将结果展示为HTML格式,同时分析功能也比较强大。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、重复行分析
  • 耗时:较少

图片

2、AutoViz

https://github.com/AutoViML/AutoViz

AutoViz是款美观的数据分析工具,在进行可视化的同时将结果保存为图片格式。

  • 功能:相关性分析、数值变量箱线图、数值变量分布图
  • 耗时:较多

图片

3、Dataprep

https://dataprep.ai/

Dataprep是款比较灵活也比较强大的工具,也是笔者最喜欢的。它可以指定列进行分析,同时也可以在Notebook中进行交互式分析。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、交互式分析。
  • 耗时:较多

图片

4、SweetViz

https://github.com/fbdesignpro/sweetviz

SweetViz是款强大的数据分析工具,可以很好的分析训练集和测试集,以及目标标签与特征之间的关系。

  • 功能:数据集对比分析、字段类型分析、变量分布分析、目标变量分析
  • 耗时:中等

图片

5、D-Tale

https://github.com/man-group/dtale

D-Tale是款功能最为强大的数据分析工具,对单变量的分析过程支持比较好。

  • 功能:字段类型分析、变量分布分析、相关性分析、缺失值分析、交互式分析。
  • 耗时:中等

图片

技术交流

欢迎转载、收藏、有所收获点赞支持一下!

在这里插入图片描述

到此这篇关于Python数据挖掘中常用的五种AutoEDA 工具总结的文章就介绍到这了,更多相关Python 数据挖掘内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python中bisect的使用方法

    Python中bisect的使用方法

    这篇文章主要介绍了Python中bisect的使用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-12-12
  • 详解Python的条件语句

    详解Python的条件语句

    这篇文章主要为大家介绍了Python的条件语句,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-01-01
  • python基础while循环及if判断的实例讲解

    python基础while循环及if判断的实例讲解

    下面小编就为大家带来一篇python基础while循环及if判断的实例讲解。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-08-08
  • Python实现SSH隧道功能的示例代码

    Python实现SSH隧道功能的示例代码

    SSH隧道是利用SSH协议建立一个加密通道,以保护通过不安全网络传输的数据,本文将介绍如何使用Python来实现SSH隧道功能,感兴趣的可以了解下
    2025-02-02
  • 在python中使用pyspark读写Hive数据操作

    在python中使用pyspark读写Hive数据操作

    这篇文章主要介绍了在python中使用pyspark读写Hive数据操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • Python生成动态路由轨迹图的示例详解

    Python生成动态路由轨迹图的示例详解

    在当今的数据驱动时代,可视化技术在数据分析和决策支持中扮演着越来越重要的角色,本文将介绍如何使用Python来生成动态的路由轨迹图,需要的可以了解下
    2025-02-02
  • 使用python实现离散时间傅里叶变换的方法

    使用python实现离散时间傅里叶变换的方法

    这篇文章主要介绍了使用python实现离散时间傅里叶变换的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-09-09
  • Python 处理文件的几种方式

    Python 处理文件的几种方式

    这篇文章主要介绍了Python 处理文件的几种方式,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-08-08
  • 详述numpy中的np.random.random()系列函数用法

    详述numpy中的np.random.random()系列函数用法

    本文主要介绍了详述numpy中的np.random.random()系列函数用法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03
  • Matplotlib中文乱码的两种详细解决方案

    Matplotlib中文乱码的两种详细解决方案

    最近手头有公司的数据资源,正好拿来练习了matplotlib的画图,期间碰到一个坑,就是中文在图表中显示的是方框,下面这篇文章主要给大家介绍了关于Matplotlib中文乱码的两种详细解决方案,需要的朋友可以参考下
    2022-07-07

最新评论