[Bug]: KeyError: 'reward' #24

hlwang98 · 2023-05-04T08:10:12Z

🐛 Bug

base_reward.py中 rewards = data["reward"].copy()，没有reward，reward_wrapper.py是rewards，修改之后还有其他问题。。。

To Reproduce

# train_ppo.py
from openrl.envs.common import make
from openrl.modules.common import PPONet as Net
from openrl.runners.common import PPOAgent as Agent

env = make("CartPole-v1", env_num=9) # 创建环境，并设置环境并行数为9
net = Net(env) # 创建神经网络
agent = Agent(net) # 初始化训练器
agent.train(total_time_steps=20000) # 开始训练，并设置环境运行总步数为20000

Relevant log output / Error message

Traceback (most recent call last):
  File "/home/user/code/python/train_ppo.py", line 9, in <module>
    agent.train(total_time_steps=20000) # 开始训练，并设置环境运行总步数为20000
  File "/home/user/anaconda3/envs/OpenRL/lib/python3.9/site-packages/openrl/runners/common/ppo_agent.py", line 134, in train
    driver.run()
  File "/home/user/anaconda3/envs/OpenRL/lib/python3.9/site-packages/openrl/drivers/onpolicy_driver.py", line 227, in run
    self._inner_loop()
  File "/home/user/anaconda3/envs/OpenRL/lib/python3.9/site-packages/openrl/drivers/onpolicy_driver.py", line 112, in _inner_loop
    rollout_infos = self.actor_rollout()
  File "/home/user/anaconda3/envs/OpenRL/lib/python3.9/site-packages/openrl/drivers/onpolicy_driver.py", line 189, in actor_rollout
    obs, rewards, dones, infos = self.envs.step(actions, extra_data)
  File "/home/user/anaconda3/envs/OpenRL/lib/python3.9/site-packages/openrl/envs/vec_env/wrappers/vec_monitor_wrapper.py", line 37, in step
    returns = self.env.step(action, extra_data)
  File "/home/user/anaconda3/envs/OpenRL/lib/python3.9/site-packages/openrl/envs/vec_env/wrappers/reward_wrapper.py", line 46, in step
    rewards, new_infos = self.reward_class.step_reward(data=extra_data)
  File "/home/user/anaconda3/envs/OpenRL/lib/python3.9/site-packages/openrl/rewards/base_reward.py", line 18, in step_reward
    rewards = data["reward"].copy()
KeyError: 'reward'

System Info

No response

Checklist

I have checked that there is no similar issues in the repo
I have read the documentation
I have provided a minimal working example to reproduce the bug
I have version numbers, operating system and environment, where applicable

hlwang98 added the bug Something isn't working label May 4, 2023

WentseChen mentioned this issue May 4, 2023

fix "rewards not found" bug #27

Merged

4 tasks

WentseChen closed this as completed in #27 May 4, 2023

WentseChen mentioned this issue May 4, 2023

fix: rewards class info bug for multi agents scenario #29

Merged

4 tasks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Bug]: KeyError: 'reward' #24

[Bug]: KeyError: 'reward' #24

hlwang98 commented May 4, 2023

[Bug]: KeyError: 'reward' #24

[Bug]: KeyError: 'reward' #24

Comments

hlwang98 commented May 4, 2023

🐛 Bug

To Reproduce

Relevant log output / Error message

System Info

Checklist