pyCaret效率倍增开源低代码的python机器学习工具

pyCaret效率倍增开源低代码的python机器学习工具
目录
  • PyCaret 时间序列模块
  • 加载数据
  • 初始化设置
  • 统计测试
  • 探索性数据分析
  • 模型训练和选择
  • 保存模型

PyCaret 是一个开源、低代码的 Python 机器学习库,可自动执行机器学习工作流。它是一种端到端的机器学习和模型管理工具,可以以指数方式加快实验周期并提高您的工作效率。欢迎收藏学习,喜欢点赞支持,文末提供技术交流群。

与其他开源机器学习库相比,PyCaret 是一个替代的低代码库,可用于仅用几行代码替换数百行代码。 这使得实验速度和效率呈指数级增长。 PyCaret 本质上是围绕多个机器学习库和框架(例如 scikit-learn、XGBoost、LightGBM、CatBoost、spaCy、Optuna、Hyperopt、Ray 等)的 Python 包装器。

PyCaret 的设计和简单性受到数据科学家这一新兴角色的启发,可以执行以前需要更多技术专长的简单和中等复杂的分析任务

PyCaret 时间序列模块

PyCaret 的新时间序列模块现已提供测试版。 秉承 PyCaret 的简单性,它与现有的 API 保持一致,并带有很多功能。 统计测试、模型训练和选择(30 多种算法)、模型分析、自动超参数调优、实验记录、云部署等, 所有这一切只需要几行代码(就像 pycaret 的其他模块一样)。 如果您想尝试一下,请查看官方的快速入门笔记本。

您可以使用 pip 安装此库。 如果你在同一个环境中安装了 PyCaret,由于依赖冲突,你必须为 pycaret-ts-alpha 创建一个单独的环境。

?1pip install pycaret-ts-alpha

接下来安排如下

PyCaret 的时间序列模块中的工作流程非常简单。 它从设置功能开始,您可以在其中定义预测范围 fh 和折叠次数。 您还可以将 fold_strategy 定义为扩展或滑动。

设置后,著名的 compare_models 函数训练和评估从 ARIMA 到 XGboost(TBATS、FBProphet、ETS 等)的 30 多种算法。

plot_model 函数可以在训练之前或之后使用。 在训练前使用时,它使用 plotly 界面收集了大量时间序列 EDA 图。 与模型一起使用时,plot_model 处理模型残差,并可用于访问模型拟合。

最后,predict_model 用于生成预测。

加载数据

?1234567import pandas as pdfrom pycaret.datasets import get_datadata = get_data('pycaret_downloads')data['Date'] = pd.to_datetime(data['Date'])data = data.groupby('Date').sum()data = data.asfreq('D')data.head()

?12# plot the datadata.plot()

这个时间序列是从 pip 每天下载 PyCaret 库的次数。

初始化设置

?1234567# with functional APIfrom pycaret.time_series import *setup(data, fh = 7, fold = 3, session_id = 123)# with new object-oriented APIfrom pycaret.internal.pycaret_experiment import TimeSeriesExperimentexp = TimeSeriesExperiment()exp.setup(data, fh = 7, fold = 3, session_id = 123)

统计测试

?1check_stats()

探索性数据分析

?1234# functional APIplot_model(plot = 'ts')# object-oriented APIexp.plot_model(plot = 'ts')

?12# cross-validation plotplot_model(plot = 'cv')

?12# ACF plotplot_model(plot = 'acf')

?12# Diagnostics plotplot_model(plot = 'diagnostics')

?12# Decomposition plotplot_model(plot = 'decomp_stl')

模型训练和选择

?1234# functional APIbest = compare_models()# object-oriented APIbest = exp.compare_models()

时间序列模块中的 create_model 就像在其他模块中一样。

?123# create fbprophet modelprophet = create_model('prophet')print(prophet)

tune_model 也没有太大不同。

?12tuned_prophet = tune_model(prophet)print(tuned_prophet)

?1plot_model(best, plot = 'forecast')

?12# forecast in unknown futureplot_model(best, plot = 'forecast', data_kwargs = {'fh' : 30})

?12# in-sample plotplot_model(best, plot = 'insample')

?12# residuals plotplot_model(best, plot = 'residuals')

?12# diagnostics plotplot_model(best, plot = 'diagnostics')

保存模型

?1234# finalize modelfinal_best = finalize_model(best)# generate predictionspredict_model(final_best, fh = 90)

?12# save the modelsave_model(final_best, 'my_best_model')

以上就是pyCaret效率倍增开源低代码的python机器学习工具的详细内容,更多关于python机器学习工具Pycaret的资料请关注脚本之家其它相关文章!

您可能感兴趣的文章:
  • python机器学习创建基于规则聊天机器人过程示例详解
  • python机器学习Github已达8.9Kstars模型解释器LIME
  • python解释模型库Shap实现机器学习模型输出可视化
  • python数据挖掘使用Evidently创建机器学习模型仪表板
  • python人工智能human learn绘图创建机器学习模型
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
相关文章
返回顶部