- Tensorflow implementations of Reinforcement Learning methods for Atari 2600.
- 강화학습의 유명한 알고리즘들을 구현했습니다.
- Atari 2600 를 대상으로 실험할 수 있습니다.
- Python v3.6
- tensorflow v1.4
- OpenAI Gym v0.9
python3 main.py --game [game name] --model [model name]
- [game name] : BreakoutDeterministic, Seaquest, etc. default : BreakoutDeterministic
- [model name] : dqn, a3c etc. default : dqn
- 자세한 설정은 main.py, Config.py 에서 조정할 수 있습니다.
- dqn.py, drqn.py는 네트워크 클래스와 아타리에서의 학습을 할 수 있는 메소드로 이루어져 있습니다.
- a3c.py는 네트워크 클래스와 아타리에서 학습을 진행하는 Worker 클래스, global 네트워크와 worker를 설정하고 학습을 시작하는 메소드로 이루어져 있습니다.
- Value Based Reinforcement Learning
- Policy Based Reinforcement Learning
- To be added
- DARQN
- Asynchronous n-step Q-learning
- PG, DPG, DDPG
- NPG, TRPO, GAE, PPO
- NOTE.md 에 비고사항을 기록했습니다.
- Studies
- Human-level control through deep reinforcement learning
- Deep Reinforcement Learning with Double Q-Learning
- Dueling Network Architectures for Deep Reinforcement Learning
- Deep recurrent q-learning for partially observable mdps
- Deep attention recurrent Q-network
- Asynchronous Methods for Deep Reinforcement Learning
- Github repositories