python Sweetviz探索性数据可视化分析库使用特征详解

 更新时间:2024年01月30日 10:15:26   作者:程序员小寒  
这篇文章主要为大家介绍了python Sweetviz探索性数据可视化分析库特征使用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

python Sweetviz库

今天给大家分享一个神奇的 python 库,Sweetviz

https://github.com/fbdesignpro/sweetviz 

探索性数据分析是一个我们倾向于使用可视化方法来分析数据集并总结数据集主要特征的过程。

EDA 非常重要,因为如果你不熟悉正在处理的数据集,那么你将无法从该数据中推断出某些内容。然而,EDA通常需要花费大量时间。

但是,如果我告诉你 python 可以在一些库的帮助下自动化 EDA 过程呢?

在本文中,我们将使用 「Sweetviz」 实现 EDA 自动化。

它是一个 Python 库,可以生成「漂亮的高密度可视化」效果,从而通过一行代码启动 EDA(探索性数据分析)。输出是一个完全独立的 HTML 应用程序。

该系统是围绕快速可视化目标值和比较数据集而构建的。其目标是帮助快速分析目标特征、训练与测试数据以及其他此类数据表征任务。

安装库

与任何其他 python 库一样,我们可以使用下面给出的 pip install 命令来安装 sweetviz。

pip install sweetviz

分析数据集

让我们使用来自 Kaggle 的鸢尾花数据集

你可以从此处下载数据集文件 ( https://www.kaggle.com/arshid/iris-flower-dataset)

# Import sweetviz and pandas libraries
import sweetviz as sv
import pandas as pd
# Now read the dataset using pd.read_csv() function
data = pd.read_csv('IRIS.csv')
# Split first 125 entries/rows into train data frame
train = data.iloc[:125]
# Split next rows from 125 until end into test data frame
test = data.iloc[125:]

现在你可以使用 show_html() 方法将数据框的分析结果显示为 HTML 文件。

report=sv.analyze(train)
report.show_html()

现在,如果你想比较两个数据帧(即训练集、测试集)之间的分析,你可以使用 sweetviz 库中的 compare() 函数。

compare_report=sv.compare(train,test)

compare_report.show_html()

如果你想比较两个子群体之间的分析,那么你可以使用 sweetviz 库中的 compare_intra() 函数。

请注意,在内部,这会创建 2 个单独的数据框来表示每个结果组。

compare_intra_report=sv.compare_intra(train,train['species']=='Iris-setosa',['setosa','other'])

compare_intra_report.show_html()

更多的功能期待大家去尝试,以上就是python Sweetviz探索性数据可视化分析库使用特征详解的详细内容,更多关于python Sweetviz库的资料请关注脚本之家其它相关文章!

相关文章

  • Python中BeautifulSoup模块详解

    Python中BeautifulSoup模块详解

    大家好,本篇文章主要讲的是Python中BeautifulSoup模块详解,感兴趣的同学赶紧来看一看吧,对你有帮助的话记得收藏一下
    2022-02-02
  • 关于对python中进程的几个概念理解

    关于对python中进程的几个概念理解

    进程由程序,数据和进程控制块组成,是正在执行的程,程序的一次执行过程,是资源调度的基本单位,下面这篇文章主要给大家介绍了关于对python中进程的几个概念理解,需要的朋友可以参考下
    2021-10-10
  • 玩转python爬虫之cookie使用方法

    玩转python爬虫之cookie使用方法

    Cookie用于服务器实现会话,用户登录及相关功能时进行状态管理,这篇文章主要介绍了使用python处理cookie的方法,感兴趣的小伙伴们可以参考一下
    2016-02-02
  • Numpy中的shape、reshape函数的区别

    Numpy中的shape、reshape函数的区别

    本文主要介绍了Numpy中的shape、reshape函数的区别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-07-07
  • Python如何查看数据的类型

    Python如何查看数据的类型

    这篇文章主要介绍了Python如何查看数据的类型方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2025-03-03
  • Python利用openpyxl操作Excel表格的完整指南

    Python利用openpyxl操作Excel表格的完整指南

    存测试数据有时候有大批量的数据,存到TXT文件里面显然不是最佳的方式,我们可以存到Excel里面去,下面我们就来看看如何使用Python自动化操作Excel表格吧
    2026-03-03
  • python 实现的发送邮件模板【普通邮件、带附件、带图片邮件】

    python 实现的发送邮件模板【普通邮件、带附件、带图片邮件】

    这篇文章主要介绍了python 实现的发送邮件模板,包含Python发送普通邮件、带附件及带图片邮件相关实现技巧,需要的朋友可以参考下
    2019-07-07
  • python set集合使用方法解析

    python set集合使用方法解析

    这篇文章主要介绍了python set集合使用方法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • python 自动识别并连接串口的实现

    python 自动识别并连接串口的实现

    这篇文章主要介绍了python 自动识别并连接串口的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • python 使用csv模块读写csv格式文件的示例

    python 使用csv模块读写csv格式文件的示例

    这篇文章主要介绍了python 使用csv模块读写csv格式文件的示例,帮助大家更好的理解和学习python,感兴趣的朋友可以了解下
    2020-12-12

最新评论