MLFlow を用いた Iris データセットのランダムフォレスト分類モデル学習パイプラインです。
- Python 3.8 以上
- Docker
- MLFlow
- カレントディレクトリ
$ pwd
~/ml-system-in-actions/chapter2_training/iris_sklearn_rf
- ライブラリインストール 本プログラムで仕様するライブラリはrequirements.txtに示すとおりです。
$ make dev
# 実行されるコマンド
# pip install -r requirements.txt
# 出力は省略
- 学習用 Docker イメージのビルド 学習で使用する Docker イメージをビルドします。
$ make d_build
# 実行されるコマンド
# docker build \
# -t shibui/ml-system-in-actions:training_pattern_iris_sklearn_rf_0.0.1 \
# -f Dockerfile .
# 出力は省略
# dockerイメージとしてshibui/ml-system-in-actions:training_pattern_iris_sklearn_rf_0.0.1がビルドされます。
- 学習パイプラインの実行 mlflow で学習パイプラインを実行します。
$ make train
# 実行されるコマンド
# mlflow run . --no-conda
# 出力例
# 2021/02/11 11:25:49 INFO mlflow.projects.docker: === Building docker image iris_sklearn_rf:6fa928e ===
# 2021/02/11 11:25:59 INFO mlflow.projects.utils: === Created directory /var/folders/v8/bvkzgn8j1ws6y76t4z5nt6280000gn/T/tmpmr52x6kk for downloading remote URIs passed to arguments of type 'path' ===
# 2021/02/11 11:25:59 INFO mlflow.projects.backend.local: === Running command 'docker run --rm -v ~/book/ml-system-in-actions/chapter2_training/iris_sklearn_rf/mlruns:/mlflow/tmp/mlruns -v ~/book/ml-system-in-actions/chapter2_training_patterns/iris_sklearn_rf/mlruns/0/63250dc8faed4917b9870ebfbbe32aa3/artifacts:~/book/ml-system-in-actions/chapter2_training_patterns/iris_sklearn_rf/mlruns/0/63250dc8faed4917b9870ebfbbe32aa3/artifacts -e MLFLOW_RUN_ID=63250dc8faed4917b9870ebfbbe32aa3 -e MLFLOW_TRACKING_URI=file:///mlflow/tmp/mlruns -e MLFLOW_EXPERIMENT_ID=0 iris_sklearn_rf:6fa928e python -m iris_train \
# --test_size 0.3 ' in run with ID '63250dc8faed4917b9870ebfbbe32aa3' ===
# 2021/02/11 11:26:05 INFO mlflow.projects: === Run (ID '63250dc8faed4917b9870ebfbbe32aa3') succeeded ===
学習は数分以内に完了します。