用DDPG/MADDPG/DQN/MADDPG+advantage实验 OpenAI开源的MPE环境
OpenAI MPE: https://github.com/openai/multiagent-particle-envs
OpenAI MADDPG:https://github.com/openai/maddpg
自己加入了DQN,与Maddpg+advantage算法。但效果不如Maddpg。另,在游戏中设置了“吃掉消失”的现象。但训练策略与游戏得分有较大的关系,增加“吃掉消失”与“输赢”评判之后,训练效果不佳。