Skip to content

FC-Li/RL_Policy_and_Value_Networks

Repository files navigation

强化学习的策略网络和估值网络

  1. CartPole 任务
  • random_agent.py 实现了在 CartPole 任务上的随机 Agent,作为基于策略网络的强化学习模型的对比基准。
  • policy_network_mlp_CartPole.py 实现了在 CartPole 任务上的基于多层感知机的策略网络的强化模型。
  1. GridWorld 任务
  • grid_world.py 实现了 GridWorld 类,作为基于卷积神经网络的 DQN 的仿真测试环境。
  • value_network_GridWorld.py 实现了在 GridWorld 任务上的 DQN,使用到了 Experience Replay,Double,Dueling 等Tricks。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages