python lazypredict构建大量基本模型简化机器学习
python库lazypredict
今天给大家分享一个神奇的 python 库,lazypredict
https://github.com/shankarpandala/lazypredict
lazypredict 是一个开源的 Python 库,旨在简化机器学习模型的构建和评估过程。使用 lazypredict 无需太多代码即可帮助构建大量基本模型,并有助于了解哪些模型在无需任何参数调整的情况下效果更好。
此外,该库还自动执行预处理措施,包括使用 SimpleImputer 处理缺失值、使用独热编码或基于特征基数的序数编码对分类特征进行编码,以及使用标准缩放器缩放数据。
库的安装
可以直接使用 pip 进行安装。
pip install lazypredict
回归问题
lazypredict 库中的 LazyRegressor 类用于解决回归问题。
这里,我们使用的数据集是房价预测数据集,它包含数字和分类特征。
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from lazypredict.Supervised import LazyRegressor
housing_data = pd.read_csv('Housing.csv')
housing_data
接下来,我们将数据切分为训练集和测试集。
# dropping the target column from the input feature
x_data = housing_data.drop('price', axis=1)
# assigning the target feature
y_data = housing_data['price']
# splitting the data to train and test set
X_train, X_test, y_train, y_test = train_test_split(x_data, y_data,test_size=.2,random_state =123)然后,让我们使用 LazyRegressor 定义回归模型。
lzy_regressor = LazyRegressor(verbose=0,ignore_warnings=True, custom_metric=None, predictions=True, regressors ='all' ) regressor_model,predictions = lzy_regressor.fit(X_train, X_test, y_train, y_test) regressor_model
执行后,结果会显示模型名称、R 方、均方根误差 (RMSE) 以及运行相应模型所需的时间。

分类问题
在分类问题中,使用的是 LazyClassifier 类。
这里,我使用的数据集是中风预测数据集来作为演示。
# load the data
stroke_data = pd.read_csv('healthcare-dataset-stroke-data.csv')
stroke_data= stroke_data.drop('id', axis =1) # remove unnecessary column
stroke_data
from lazypredict.Supervised import LazyClassifier
# defining x_input and y_target
x_data = stroke_data.drop('stroke', axis=1)
y_data = stroke_data['stroke']
# train-test split
X_train, X_test, y_train, y_test = train_test_split(x_data, y_data,test_size=0.2,random_state =123)
# define the lazyclassifiy model and run
lzy_classifier = LazyClassifier(verbose=0,ignore_warnings=True, custom_metric=None, predictions=True, classifiers='all' )
classifier_model ,predictions = lzy_classifier.fit(X_train, X_test, y_train, y_test)
classifier_model
以上就是python lazypredict构建大量基本模型简化机器学习的详细内容,更多关于python lazypredict机器学习的资料请关注脚本之家其它相关文章!
相关文章
Jupyter notebook 更改文件打开的默认路径操作
这篇文章主要介绍了Jupyter notebook 更改文件打开的默认路径操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧2021-05-05
基于Python和Unstructured的多格式文档处理方案
作为一名热衷于Python开发的工程师,我最近开发了一个基于 unstructured 库的文档解析服务,旨在提供一个高效、灵活的解决方案,能够处理多种格式的文档,在这篇博客中,我将详细介绍项目的背景、功能、代码结构、实现细节以及潜在的应用场景,需要的朋友可以参考下2025-08-08


最新评论