Skip to content

Latest commit

 

History

History
7 lines (7 loc) · 584 Bytes

README.md

File metadata and controls

7 lines (7 loc) · 584 Bytes

强化学习的策略网络和估值网络

  1. CartPole 任务
  • random_agent.py 实现了在 CartPole 任务上的随机 Agent,作为基于策略网络的强化学习模型的对比基准。
  • policy_network_mlp_CartPole.py 实现了在 CartPole 任务上的基于多层感知机的策略网络的强化模型。
  1. GridWorld 任务
  • grid_world.py 实现了 GridWorld 类,作为基于卷积神经网络的 DQN 的仿真测试环境。
  • value_network_GridWorld.py 实现了在 GridWorld 任务上的 DQN,使用到了 Experience Replay,Double,Dueling 等Tricks。