python数据挖掘使用Evidently创建机器学习模型仪表板

更新时间：2021年11月22日 15:37:34 作者：Python学习与数据挖掘

在本文中，我们将探索 Evidently 并创建交互式报告/仪表板。有需要的朋友欢迎大家收藏学习，希望能够有所帮助，祝大家多多进步早日升职加薪

1、安装包

使用 pip 软件包管理器安装，运行

$ pip install evidently

该工具允许在 Jupyter notebook 中以及作为单独的HTML文件构建交互式报告。如果你只想将交互式报告生成为HTML文件或导出为JSON配置文件，则安装现已完成。

为了能够在 Jupyter notebook 中构建交互式报告，我们使用Jupyter nbextension。如果想在 Jupyter notebook 中创建报告，那么在安装之后，您应该在 terminal 中运行以下两个命令。

要安装 jupyter Nbextion，请运行：

$ jupyter nbextension install --sys-prefix --symlink --overwrite --py evidently

运行

jupyter nbextension enable evidently --py --sys-prefix

有一点需要注意：安装后单次运行就足够了。无需每次都重复最后两个命令。

2、导入所需的库

在这一步中，我们将导入创建ML模型所需的库。我们还将导入用于创建用于分析模型性能的仪表板的库。此外，我们将导入 pandas 以加载数据集。

import pandas as pd
import numpy as np
from sklearn.ensemble import RandomForestRegressor
from evidently.dashboard import Dashboard
from evidently.tabs import RegressionPerformanceTab
from evidently.model_profile import Profile
from evidently.profile_sections import RegressionPerformanceProfileSection

3、加载数据集

在这一步中，我们将加载数据并将其分离为参考数据和预测数据。

raw_data = pd.read_csv('/content/day.csv', header = 0, sep = ',', parse_dates=['dteday'])
ref_data = raw_data[:120]
prod_data = raw_data[120:150]
ref_data.head()

4、创建模型

在这一步中，我们将创建机器学习模型，对于这个特定的数据集，我们将使用随机森林回归模型。

target = 'cnt'
datetime = 'dteday'
numerical_features = ['mnth', 'temp', 'atemp', 'hum', 'windspeed']
categorical_features = ['season', 'holiday', 'weekday', 'workingday', 'weathersit',]
features = numerical_features + categorical_features
model = RandomForestRegressor(random_state = 0)
model.fit(ref_data[features], ref_data[target])
ref_data['prediction']  = model.predict(ref_data[features])
prod_data['prediction'] = model.predict(prod_data[features])

5、创建仪表板

在这一步中，我们将创建仪表板来解释模型性能并分析模型的不同属性，如 MAE、MAPE、误差分布等。

column_mapping = {}
column_mapping['target'] = target
column_mapping['prediction'] = 'prediction'
column_mapping['datetime'] = datetime
column_mapping['numerical_features'] = numerical_features
column_mapping['categorical_features'] = categorical_features
dashboard = Dashboard(tabs=[RegressionPerformanceTab])
dashboard .calculate(ref_data, prod_data, column_mapping=column_mapping)
dashboard.save('bike_sharing_demand_model_perfomance.html')

在上图中，可以清楚地看到显示模型性能的报告，可以使用上述代码下载并创建的 HTML 报告。

6、可用报告类型

1)数据漂移

检测特征分布的变化

2)数值目标漂移

检测数值目标和特征行为的变化。

3)分类目标漂移

检测分类目标和特征行为的变化

4)回归模型性能

分析回归模型的性能和模型误差

5)分类模型性能

分析分类模型的性能和错误。适用于二元和多类模型

6)概率分类模型性能

分析概率分类模型的性能、模型校准的质量和模型错误。适用于二元和多类模型。

以上就是python数据挖掘使用Evidently创建机器学习模型仪表板的详细内容，更多关于Evidently创建机器学习模型仪表板的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

Python使用CMD模块更优雅的运行脚本
这篇文章主要介绍了Python使用CMD模块更优雅的运行脚本的方法,实例分析了Python中cmd模块的相关使用技巧,具有一定参考借鉴价值,需要的朋友可以参考下
2015-05-05
在Python的Django框架的视图中使用Session的方法
这篇文章主要介绍了在Python的Django框架的视图中使用Session的方法,包括相关的设置测试Cookies的方法,需要的朋友可以参考下
2015-07-07
1秒钟使用python建立文件服务器的方法步骤
本文主要介绍了1秒钟使用python建立文件服务器的方法步骤，文中通过示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2021-10-10
aws 通过boto3 python脚本打pach的实现方法
这篇文章主要介绍了aws 通过boto3 python脚本打pach的实现方法，本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-05-05
跟老齐学Python之模块的加载
这篇文章主要介绍了跟老齐学Python之模块的加载,需要的朋友可以参考下
2014-10-10
Python如何处理JSON数据详解
读取json数据实际上是把json格式变成python中字典、列表等格式化的数据,极大地方便索引查找,下面这篇文章主要给大家介绍了关于Python如何处理JSON数据的相关资料,需要的朋友可以参考下
2022-10-10
Python遍历某目录下的所有文件夹与文件路径
这篇文章主要介绍了Python遍历某目录下的所有文件夹与文件路径以及输出中文乱码问题的解决方法，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-03-03
Python+Delorean实现时间格式智能转换
DeLorean是一个Python的第三方模块，基于 pytz 和 dateutil 开发，用于处理Python中日期时间的格式转换。本文将详细讲讲DeLorean的使用，感兴趣的可以了解一下
2022-04-04
python3.6中anaconda安装sklearn踩坑实录
这篇文章主要介绍了python3.6中anaconda安装sklearn踩坑实录，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-07-07
深入浅析python变量加逗号,的含义
这篇文章主要介绍了python变量加逗号,的含义,本文通过实例代码给大家介绍的非常详细，具有一定的参考借鉴价值，需要的朋友可以参考下
2020-02-02