- CartPole 任务
- random_agent.py 实现了在 CartPole 任务上的随机 Agent,作为基于策略网络的强化学习模型的对比基准。
- policy_network_mlp_CartPole.py 实现了在 CartPole 任务上的基于多层感知机的策略网络的强化模型。
- GridWorld 任务
- grid_world.py 实现了 GridWorld 类,作为基于卷积神经网络的 DQN 的仿真测试环境。
- value_network_GridWorld.py 实现了在 GridWorld 任务上的 DQN,使用到了 Experience Replay,Double,Dueling 等Tricks。