- 詳しくはこちらの記事へ
- Google Colab で学習済みエージェントと対戦できます
- 三目並べを強化学習(Q 学習)で攻略するプログラム
- 盤面の大きさが 4x4 のときにも対応
git clone https://github.com/yousukeayada/TicTacToe-RL.git
cd TicTacToe-RL
python demo.py --size=3
# 学習させる場合(エピソード数に注意)
python train.py --size=3 --alpha=0.1 --gamma=0.9