python Sweetviz探索性数据可视化分析库使用特征详解

更新时间：2024年01月30日 10:15:26 作者：程序员小寒

这篇文章主要为大家介绍了python Sweetviz探索性数据可视化分析库特征使用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

python Sweetviz库

今天给大家分享一个神奇的 python 库，Sweetviz。

https://github.com/fbdesignpro/sweetviz

探索性数据分析是一个我们倾向于使用可视化方法来分析数据集并总结数据集主要特征的过程。

EDA 非常重要，因为如果你不熟悉正在处理的数据集，那么你将无法从该数据中推断出某些内容。然而，EDA通常需要花费大量时间。

但是，如果我告诉你 python 可以在一些库的帮助下自动化 EDA 过程呢？

在本文中，我们将使用 「Sweetviz」 实现 EDA 自动化。

它是一个 Python 库，可以生成「漂亮的高密度可视化」效果，从而通过一行代码启动 EDA（探索性数据分析）。输出是一个完全独立的 HTML 应用程序。

该系统是围绕快速可视化目标值和比较数据集而构建的。其目标是帮助快速分析目标特征、训练与测试数据以及其他此类数据表征任务。

安装库

与任何其他 python 库一样，我们可以使用下面给出的 pip install 命令来安装 sweetviz。

pip install sweetviz

分析数据集

让我们使用来自 Kaggle 的鸢尾花数据集。

你可以从此处下载数据集文件 ( https://www.kaggle.com/arshid/iris-flower-dataset)

# Import sweetviz and pandas libraries
import sweetviz as sv
import pandas as pd
# Now read the dataset using pd.read_csv() function
data = pd.read_csv('IRIS.csv')
# Split first 125 entries/rows into train data frame
train = data.iloc[:125]
# Split next rows from 125 until end into test data frame
test = data.iloc[125:]

现在你可以使用 show_html() 方法将数据框的分析结果显示为 HTML 文件。

report=sv.analyze(train)
report.show_html()

现在，如果你想比较两个数据帧（即训练集、测试集）之间的分析，你可以使用 sweetviz 库中的 compare() 函数。

compare_report=sv.compare(train,test)

compare_report.show_html()

如果你想比较两个子群体之间的分析，那么你可以使用 sweetviz 库中的 compare_intra() 函数。

请注意，在内部，这会创建 2 个单独的数据框来表示每个结果组。

compare_intra_report=sv.compare_intra(train,train['species']=='Iris-setosa',['setosa','other'])

compare_intra_report.show_html()

更多的功能期待大家去尝试，以上就是python Sweetviz探索性数据可视化分析库使用特征详解的详细内容，更多关于python Sweetviz库的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

Python利用memory_profiler查看内存占用情况
memory_profiler是第三方模块，用于监视进程的内存消耗以及python程序内存消耗的逐行分析。本文将利用memory_profiler查看代码运行占用内存情况，感兴趣的可以了解一下
2022-06-06
Python 获取当前路径3种方法
本文主要介绍了Python 获取当前路径3种方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2023-01-01
python实现购物车功能
这篇文章主要为大家详细介绍了python实现购物车功能，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2022-02-02
python使用datetime模块计算各种时间间隔的方法
这篇文章主要介绍了python使用datetime模块计算各种时间间隔的方法,实例分析了Python使用datetime模块进行各种常用的时间操作技巧,具有一定参考借鉴价值,需要的朋友可以参考下
2015-03-03
python opencv实现灰度图和彩色图的互相转换
这篇文章主要给大家介绍了关于python opencv实现灰度图和彩色图的互相转换,文中通过实例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2022-01-01
总结Python图形用户界面和游戏开发知识点
在本篇文章里小编给大家整理了关于Python图形用户界面和游戏开发知识点以及实例代码，需要的朋友们学习下。
2019-05-05
Python实现返回数组中第i小元素的方法示例
这篇文章主要介绍了Python实现返回数组中第i小元素的方法,结合实例形式分析了Python针对数组的遍历、排序、运算等相关操作技巧,需要的朋友可以参考下
2017-12-12
编写Python爬虫抓取豆瓣电影TOP100及用户头像的方法
这篇文章主要介绍了编写Python爬虫抓取豆瓣电影TOP100及用户头像的方法,用到了Python的urllib和urllib2模块,需要的朋友可以参考下
2016-01-01
python 监控服务器是否有人远程登录（详细思路+代码）
这篇文章主要介绍了python 监控服务器是否有人远程登录的方法，帮助大家利用python 监控服务器，感兴趣的朋友可以了解下
2020-12-12
Python中的模式匹配库Pampy使用实例解析
这篇文章主要为大家介绍了Python中的模式匹配库Pampy使用实例解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
2024-01-01