python lazypredict构建大量基本模型简化机器学习

 更新时间:2024年01月22日 10:57:34   作者:小寒聊python  
这篇文章主要介绍了python lazypredict构建大量基本模型简化机器学习,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

python库lazypredict

今天给大家分享一个神奇的 python 库,lazypredict

https://github.com/shankarpandala/lazypredict 

lazypredict 是一个开源的 Python 库,旨在简化机器学习模型的构建和评估过程。使用 lazypredict 无需太多代码即可帮助构建大量基本模型,并有助于了解哪些模型在无需任何参数调整的情况下效果更好。

此外,该库还自动执行预处理措施,包括使用 SimpleImputer 处理缺失值、使用独热编码或基于特征基数的序数编码对分类特征进行编码,以及使用标准缩放器缩放数据。

库的安装

可以直接使用 pip 进行安装。

pip install lazypredict

回归问题

lazypredict 库中的 LazyRegressor 类用于解决回归问题。

这里,我们使用的数据集是房价预测数据集,它包含数字和分类特征。

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from lazypredict.Supervised import LazyRegressor
housing_data = pd.read_csv('Housing.csv')
housing_data

接下来,我们将数据切分为训练集和测试集。

# dropping the target column from the input feature
x_data = housing_data.drop('price', axis=1)

# assigning the target feature 
y_data = housing_data['price']

# splitting the data to train and test set
X_train, X_test, y_train, y_test = train_test_split(x_data, y_data,test_size=.2,random_state =123)

然后,让我们使用 LazyRegressor 定义回归模型。

lzy_regressor = LazyRegressor(verbose=0,ignore_warnings=True, custom_metric=None, predictions=True, regressors ='all' )
regressor_model,predictions = lzy_regressor.fit(X_train, X_test, y_train, y_test)
regressor_model

执行后,结果会显示模型名称、R 方、均方根误差 (RMSE) 以及运行相应模型所需的时间。

分类问题

在分类问题中,使用的是 LazyClassifier 类。

这里,我使用的数据集是中风预测数据集来作为演示。

# load the data
stroke_data = pd.read_csv('healthcare-dataset-stroke-data.csv')
stroke_data= stroke_data.drop('id', axis =1) # remove unnecessary column
stroke_data

from lazypredict.Supervised import LazyClassifier

# defining x_input and y_target 
x_data = stroke_data.drop('stroke', axis=1)
y_data = stroke_data['stroke']

# train-test split
X_train, X_test, y_train, y_test = train_test_split(x_data, y_data,test_size=0.2,random_state =123)

# define the lazyclassifiy model and run
lzy_classifier = LazyClassifier(verbose=0,ignore_warnings=True, custom_metric=None, predictions=True, classifiers='all' )
classifier_model ,predictions = lzy_classifier.fit(X_train, X_test, y_train, y_test)
classifier_model

以上就是python lazypredict构建大量基本模型简化机器学习的详细内容,更多关于python lazypredict机器学习的资料请关注脚本之家其它相关文章!

相关文章

  • Python from import导入模块所有内容的方法

    Python from import导入模块所有内容的方法

    在Python的编程世界中,from module import是一种看似便捷的导入方式,它允许你一次性导入模块中的所有公共对象,然而,正如所有看似简单的解决方案一样,from import背后隐藏着一系列潜在陷阱,今天,我们就来深入探讨这个主题,揭示它的优缺点,并提供更安全的实践指南
    2026-06-06
  • Python 对数字的千分位处理方式

    Python 对数字的千分位处理方式

    这篇文章主要介绍了Python 对数字的千分位处理方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-05-05
  • Python基础课程之猜数字游戏完整代码示例

    Python基础课程之猜数字游戏完整代码示例

    猜数字游戏是一个经典的编程练习,适合初学者学习和掌握Python的基本语法和逻辑控制,这篇文章主要介绍了Python基础课程之猜数字游戏的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2026-03-03
  • python 利用pyttsx3文字转语音过程详解

    python 利用pyttsx3文字转语音过程详解

    这篇文章主要介绍了python 利用pyttsx3文字转语音过程详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-09-09
  • Jupyter notebook 更改文件打开的默认路径操作

    Jupyter notebook 更改文件打开的默认路径操作

    这篇文章主要介绍了Jupyter notebook 更改文件打开的默认路径操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-05-05
  • python爬虫系列网络请求案例详解

    python爬虫系列网络请求案例详解

    这篇文章主要介绍了【Python从零到壹】python爬虫系列-网络请求,从零开始学习Python网络爬虫,如何从中获取需要的数据信息,现整理出零基础如何学爬虫技术以供学习
    2021-04-04
  • python实现将多个txt文件的内容合并为一个

    python实现将多个txt文件的内容合并为一个

    这篇文章主要为大家详细介绍了如何使用Python编写一个脚本,可以将指定目录中的多个.txt文件的内容合并到一个文件中,有需要的小伙伴可以参考下
    2024-12-12
  • 基于Python和Unstructured的多格式文档处理方案

    基于Python和Unstructured的多格式文档处理方案

    作为一名热衷于Python开发的工程师,我最近开发了一个基于 unstructured 库的文档解析服务,旨在提供一个高效、灵活的解决方案,能够处理多种格式的文档,在这篇博客中,我将详细介绍项目的背景、功能、代码结构、实现细节以及潜在的应用场景,需要的朋友可以参考下
    2025-08-08
  • python实现顺时针打印矩阵

    python实现顺时针打印矩阵

    这篇文章主要为大家详细介绍了python实现顺时针打印矩阵,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-03-03
  • python获取指定目录下所有文件名列表的方法

    python获取指定目录下所有文件名列表的方法

    这篇文章主要介绍了python获取指定目录下所有文件名列表的方法,涉及Python目录及文件操作的相关技巧,需要的朋友可以参考下
    2015-05-05

最新评论