Databricks开源项目MLflow入门学习

2,324 阅读1分钟

An open source platform for the machine learning lifecycle mlflow.org/

上下文

  • 为开发者提供类似谷歌TFX、Facebook FBLearner Flow等平台类似好处
  • 可以支持任何工具和算法

项目架构

MLflow Tracking

MLflow Projects

MLflow Models

Model Registry

项目使用

  • Anaconda环境安装,可以便捷获取包且对包能够进行管理,同时对环境可以统一管理的发行版本

mlflow安装

pip install mlflow
OR
conda install mlflow

UI启动

  • examples/mlflow_tracking.py
cd examples
mlflow ui

模型运行

# 模型生成
python3 sklearn_logistic_regression/train.py
# API启动
mlflow models serve -m runs:/<Model_id>/model --port 1234
可能报错:mlflow.utils.process.ShellCommandException: Non-zero exitcode: 1
mlflow models serve -m runs:/<Model_id>/model --port 1234 --no-conda

流处理Demo

思考

  • 官方待引入(MLflow Monitoring)
  • MLFlow现阶段还是类似Pipeline的辅助工具,定义了Pipeline工具和标准,缺少AI平台概念
  • 如何与Spark、Docker做集成

That's all!