python Sweetviz探索性数据可视化分析库使用特征详解

 更新时间:2024年01月30日 10:15:26   作者:程序员小寒  
这篇文章主要为大家介绍了python Sweetviz探索性数据可视化分析库特征使用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

python Sweetviz库

今天给大家分享一个神奇的 python 库,Sweetviz

https://github.com/fbdesignpro/sweetviz 

探索性数据分析是一个我们倾向于使用可视化方法来分析数据集并总结数据集主要特征的过程。

EDA 非常重要,因为如果你不熟悉正在处理的数据集,那么你将无法从该数据中推断出某些内容。然而,EDA通常需要花费大量时间。

但是,如果我告诉你 python 可以在一些库的帮助下自动化 EDA 过程呢?

在本文中,我们将使用 「Sweetviz」 实现 EDA 自动化。

它是一个 Python 库,可以生成「漂亮的高密度可视化」效果,从而通过一行代码启动 EDA(探索性数据分析)。输出是一个完全独立的 HTML 应用程序。

该系统是围绕快速可视化目标值和比较数据集而构建的。其目标是帮助快速分析目标特征、训练与测试数据以及其他此类数据表征任务。

安装库

与任何其他 python 库一样,我们可以使用下面给出的 pip install 命令来安装 sweetviz。

pip install sweetviz

分析数据集

让我们使用来自 Kaggle 的鸢尾花数据集

你可以从此处下载数据集文件 ( https://www.kaggle.com/arshid/iris-flower-dataset)

# Import sweetviz and pandas libraries
import sweetviz as sv
import pandas as pd
# Now read the dataset using pd.read_csv() function
data = pd.read_csv('IRIS.csv')
# Split first 125 entries/rows into train data frame
train = data.iloc[:125]
# Split next rows from 125 until end into test data frame
test = data.iloc[125:]

现在你可以使用 show_html() 方法将数据框的分析结果显示为 HTML 文件。

report=sv.analyze(train)
report.show_html()

现在,如果你想比较两个数据帧(即训练集、测试集)之间的分析,你可以使用 sweetviz 库中的 compare() 函数。

compare_report=sv.compare(train,test)

compare_report.show_html()

如果你想比较两个子群体之间的分析,那么你可以使用 sweetviz 库中的 compare_intra() 函数。

请注意,在内部,这会创建 2 个单独的数据框来表示每个结果组。

compare_intra_report=sv.compare_intra(train,train['species']=='Iris-setosa',['setosa','other'])

compare_intra_report.show_html()

更多的功能期待大家去尝试,以上就是python Sweetviz探索性数据可视化分析库使用特征详解的详细内容,更多关于python Sweetviz库的资料请关注脚本之家其它相关文章!

相关文章

  • 解读Python中字典的key都可以是什么

    解读Python中字典的key都可以是什么

    这篇文章主要介绍了解读Python中字典的key都可以是什么,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-09-09
  • python中map、any、all函数用法分析

    python中map、any、all函数用法分析

    这篇文章主要介绍了python中map、any、all函数用法,实例分析了map、any、all函数的相关使用技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-04-04
  • Python PyQt5中窗口数据传递的示例详解

    Python PyQt5中窗口数据传递的示例详解

    开发应用程序时,若只有一个窗口则只需关心这个窗口里面的各控件之间如何传递数据。如果程序有多个窗口,就要关心不同的窗口之间是如何传递数据。本文介绍了PyQt5中三种窗口数据传递,需要的可以了解一下
    2022-12-12
  • Python中的图像处理之Python图像平滑操作

    Python中的图像处理之Python图像平滑操作

    本文主要介绍在Python中调用OpenCV库对图像进行图像平滑滤波处理与图像加噪处理,如双边滤波,高斯双边滤波,图像加随机噪声等操作,对Python图像平滑操作感兴趣的朋友一起看看吧
    2022-06-06
  • python+pygame实现坦克大战

    python+pygame实现坦克大战

    这篇文章主要为大家详细介绍了python+pygame实现坦克大战,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-09-09
  • 如何升级python包到指定版本

    如何升级python包到指定版本

    这篇文章主要介绍了如何升级python包到指定版本问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-03-03
  • Python是什么 Python的用处

    Python是什么 Python的用处

    在本篇文章里小编给大家分享的是关于python的作用和用途知识点,有兴趣的朋友们可以参考下。
    2020-05-05
  • Python3 实现串口两进程同时读写

    Python3 实现串口两进程同时读写

    今天小编就为大家分享一篇Python3 实现串口两进程同时读写,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-06-06
  • python3.7通过thrift操作hbase的示例代码

    python3.7通过thrift操作hbase的示例代码

    HBase是一个分布式的、面向列的开源数据库,其是Apache的Hadoop项目的子项目。这篇文章主要介绍了python3.7通过thrift操作hbase的示例代码,需要的朋友可以参考下
    2020-01-01
  • Python爬虫之重放攻击原理实例详解

    Python爬虫之重放攻击原理实例详解

    重放攻击是一种网络攻击方式,攻击者通过截获合法用户的请求,并将其重新发送,以模拟合法用户的行为,在Python爬虫领域,了解重放攻击的原理和防范方法至关重要,本文将深入介绍重放攻击的概念、示例代码演示以及防范措施,帮助大家更好地理解和应对这一威胁
    2023-12-12

最新评论