pyCaret效率倍增开源低代码的python机器学习工具

 更新时间:2021年11月22日 12:38:59   作者:Python学习与数据挖掘  
这篇文章主要介绍了pyCaret一款可以使效率倍增的开源低代码的python机器学习工具,有需要的朋友可以借鉴参考下,希望能够有所帮助

PyCaret 是一个开源、低代码的 Python 机器学习库,可自动执行机器学习工作流。它是一种端到端的机器学习和模型管理工具,可以以指数方式加快实验周期并提高您的工作效率。欢迎收藏学习,喜欢点赞支持,文末提供技术交流群。

与其他开源机器学习库相比,PyCaret 是一个替代的低代码库,可用于仅用几行代码替换数百行代码。 这使得实验速度和效率呈指数级增长。 PyCaret 本质上是围绕多个机器学习库和框架(例如 scikit-learn、XGBoost、LightGBM、CatBoost、spaCy、Optuna、Hyperopt、Ray 等)的 Python 包装器。

PyCaret 的设计和简单性受到数据科学家这一新兴角色的启发,可以执行以前需要更多技术专长的简单和中等复杂的分析任务。

PyCaret 时间序列模块

PyCaret 的新时间序列模块现已提供测试版。 秉承 PyCaret 的简单性,它与现有的 API 保持一致,并带有很多功能。 统计测试、模型训练和选择(30 多种算法)、模型分析、自动超参数调优、实验记录、云部署等, 所有这一切只需要几行代码(就像 pycaret 的其他模块一样)。 如果您想尝试一下,请查看官方的快速入门笔记本。

您可以使用 pip 安装此库。 如果你在同一个环境中安装了 PyCaret,由于依赖冲突,你必须为 pycaret-ts-alpha 创建一个单独的环境。

pip install pycaret-ts-alpha

接下来安排如下

PyCaret 的时间序列模块中的工作流程非常简单。 它从设置功能开始,您可以在其中定义预测范围 fh 和折叠次数。 您还可以将 fold_strategy 定义为扩展或滑动。

设置后,著名的 compare_models 函数训练和评估从 ARIMA 到 XGboost(TBATS、FBProphet、ETS 等)的 30 多种算法。

plot_model 函数可以在训练之前或之后使用。 在训练前使用时,它使用 plotly 界面收集了大量时间序列 EDA 图。 与模型一起使用时,plot_model 处理模型残差,并可用于访问模型拟合。

最后,predict_model 用于生成预测。

加载数据

import pandas as pd
from pycaret.datasets import get_data
data = get_data('pycaret_downloads')
data['Date'] = pd.to_datetime(data['Date'])
data = data.groupby('Date').sum()
data = data.asfreq('D')
data.head()

在这里插入图片描述

# plot the data
data.plot()

在这里插入图片描述

这个时间序列是从 pip 每天下载 PyCaret 库的次数。

初始化设置

# with functional API
from pycaret.time_series import *
setup(data, fh = 7, fold = 3, session_id = 123)
# with new object-oriented API
from pycaret.internal.pycaret_experiment import TimeSeriesExperiment
exp = TimeSeriesExperiment()
exp.setup(data, fh = 7, fold = 3, session_id = 123)

在这里插入图片描述

统计测试

check_stats()

在这里插入图片描述

探索性数据分析

# functional API
plot_model(plot = 'ts')
# object-oriented API
exp.plot_model(plot = 'ts')

在这里插入图片描述

# cross-validation plot
plot_model(plot = 'cv')

在这里插入图片描述

# ACF plot
plot_model(plot = 'acf')

在这里插入图片描述

# Diagnostics plot
plot_model(plot = 'diagnostics')

在这里插入图片描述

# Decomposition plot
plot_model(plot = 'decomp_stl')

在这里插入图片描述

模型训练和选择

# functional API
best = compare_models()
# object-oriented API
best = exp.compare_models()

在这里插入图片描述

时间序列模块中的 create_model 就像在其他模块中一样。

# create fbprophet model
prophet = create_model('prophet')
print(prophet)

在这里插入图片描述

在这里插入图片描述

tune_model 也没有太大不同。

tuned_prophet = tune_model(prophet)
print(tuned_prophet)

在这里插入图片描述

plot_model(best, plot = 'forecast')

在这里插入图片描述

# forecast in unknown future
plot_model(best, plot = 'forecast', data_kwargs = {'fh' : 30})

在这里插入图片描述

# in-sample plot
plot_model(best, plot = 'insample')

在这里插入图片描述

# residuals plot
plot_model(best, plot = 'residuals')

在这里插入图片描述

# diagnostics plot
plot_model(best, plot = 'diagnostics')

在这里插入图片描述

保存模型

# finalize model
final_best = finalize_model(best)
# generate predictions
predict_model(final_best, fh = 90)

在这里插入图片描述

# save the model
save_model(final_best, 'my_best_model')

在这里插入图片描述

以上就是pyCaret效率倍增开源低代码的python机器学习工具的详细内容,更多关于python机器学习工具Pycaret的资料请关注脚本之家其它相关文章!

相关文章

  • Python实现提取文章摘要的方法

    Python实现提取文章摘要的方法

    这篇文章主要介绍了Python实现提取文章摘要的方法,实例分析了Python提取文章摘要的原理与实现技巧,需要的朋友可以参考下
    2015-04-04
  • 手把手教你在Pycharm中新建虚拟环境并使用(超详细!)

    手把手教你在Pycharm中新建虚拟环境并使用(超详细!)

    使用python开发项目通常都会创建一个虚拟环境,将项目依赖包安装到虚拟环境中,避免一台电脑上开发多个项目时依赖包版本号不兼容造成冲突,下面这篇文章主要给大家介绍了关于如何在Pycharm中新建虚拟环境并使用的相关资料,需要的朋友可以参考下
    2022-06-06
  • 超详细注释之OpenCV Haar级联检测器进行面部检测

    超详细注释之OpenCV Haar级联检测器进行面部检测

    这篇文章主要介绍了OpenCV Haar级联检测器进行面部检测,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-09-09
  • python创建一个最简单http webserver服务器的方法

    python创建一个最简单http webserver服务器的方法

    这篇文章主要介绍了python创建一个最简单http webserver服务器的方法,实例分析了Python操作http创建服务器端的相关技巧,需要的朋友可以参考下
    2015-05-05
  • Python淘宝或京东等秒杀抢购脚本实现(秒杀脚本)

    Python淘宝或京东等秒杀抢购脚本实现(秒杀脚本)

    本篇文章主要介绍了Python 通过selenium实现毫秒级自动抢购的示例代码,通过扫码登录即可自动完成一系列操作,抢购时间精确至毫秒,可抢加购物车等待时间结算的,也可以抢聚划算、火车票等的商品,感兴趣的朋友跟随小编一起看看吧
    2022-10-10
  • 通过实例解析python描述符原理作用

    通过实例解析python描述符原理作用

    这篇文章主要介绍了通过实例解析python描述符原理作用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-01-01
  • Python的哈希hashlib模块详细解读

    Python的哈希hashlib模块详细解读

    这篇文章主要介绍了Python的哈希hashlib模块详细解读,hashlib是一个提供字符加密功能的模块,包含MD5和SHA的加密算法,具体支持md5,sha1, sha224, sha256, sha384, sha512等算法, 该模块在用户登录认证方面应用广泛,对文本加密也很常见,需要的朋友可以参考下
    2023-09-09
  • python多线程实现同时执行两个while循环的操作

    python多线程实现同时执行两个while循环的操作

    这篇文章主要介绍了python多线程实现同时执行两个while循环的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • 对pandas处理json数据的方法详解

    对pandas处理json数据的方法详解

    今天小编就为大家分享一篇对pandas处理json数据的方法详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • Python批量按比例缩小图片脚本分享

    Python批量按比例缩小图片脚本分享

    这篇文章主要介绍了Python批量按比例缩小图片脚本分享,本文直接给出实现代码,需要的朋友可以参考下
    2015-05-05

最新评论