データをキャッシュし、推論速度を改善します。
- Python 3.8 以上
- Docker
- Docker compose
- カレントディレクトリ
$ pwd
~/ml-system-in-actions/chapter4_serving_patterns/data_cache_pattern
- Docker イメージをビルド
$ make build_all
# 実行されるコマンド
# docker build \
# -t shibui/ml-system-in-actions:data_cache_pattern_proxy_0.0.1 \
# -f ./Dockerfile.proxy .
# docker build \
# -t shibui/ml-system-in-actions:data_cache_pattern_pred_0.0.1 \
# -f ./Dockerfile.pred .
- Docker compose で各サービスを起動
$ make c_up
# 実行されるコマンド
# docker-compose \
# -f ./docker-compose.yml \
# up -d
- 起動した API にリクエスト
# ヘルスチェック
$ curl localhost:8000/health
# 出力
# {
# "health": "ok"
# }
# メタデータ
$ curl localhost:8000/metadata
# 出力
# {
# "data_type": "str",
# "data_structure": "(1,1)",
# "data_sample": "0000",
# "prediction_type": "float32",
# "prediction_structure": "(1,1000)",
# "prediction_sample": "[0.07093159, 0.01558308, 0.01348537, ...]"
# }
# ラベル一覧
$ curl localhost:8000/label
# 出力
# [
# "background",
# "tench",
# "goldfish",
# ...
# "bolete",
# "ear",
# "toilet tissue"
# ]
# テストデータで推論リクエスト
$ curl localhost:8000/predict/test/label
# 出力
# {
# "prediction": "Persian cat"
# }
# 画像をリクエスト
$ curl \
-X POST \
-H "Content-Type: application/json" \
-d '{"data": "0000"}' \
localhost:8000/predict/label
# 出力
# {
# "prediction": "Persian cat"
# }
- Docker compose を停止
$ make c_down
# 実行されるコマンド
# docker-compose \
# -f ./docker-compose.yml \
# down