Swinging up a pendulm by Deep Q Network
詳細はQiitaを参照のこと。
- chainer
- Jupyter,matplotlib,numpy
- svgwrite(Jupyterでの確認用なので関連コードを除去すれば不要)
- imageio(アニメ生成用)
python dqn_pendulum.py
model/以下に1000回おきのモデルとハイスコアを出したモデルが生成されます。 収束状況のログはlog.csvに書き込まれます。
python make_gif.py model/000000.model
などで、アニメーションgifとプロファイルのpngが生成されます。