Skip to content

NTT東日本主催のプロコン ALGORIに投稿した深層強化学習でのUNOプログラム

License

Notifications You must be signed in to change notification settings

husky21st/BellSHAAARK

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Deep Monte-CarloによるUNO AI feat. RLCard

概要

NTT東日本主催のプログラミングコンテスト第一回に参加した時のUNO対戦プログラム

対戦ロジック

相手の手札が見えない不確定性の高いUNOという対戦ゲームにおいてDeep Monte-Carloによる強化学習を行い、手札と相手の枚数、出されたカードの状況から行動を決定する

参考にした論文はこちら DouZero: Mastering DouDizhu with Self-Play Deep Reinforcement Learning (arXiv, 2021)

開発

強化学習フレームワークとゲーム環境はRLCard (UNOの特殊ルールなどは自前で実装する必要がある)

モデルトレーニング

環境構築(>=3.8.6)

pip install -r requirements.txt

学習

python src/run_dmc.py

About

NTT東日本主催のプロコン ALGORIに投稿した深層強化学習でのUNOプログラム

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published