ryanjulian · ghost · May 30, 2018 · May 30, 2018 · May 31, 2018 · May 31, 2018
diff --git a/rllab/envs/mujoco/dynamics_randomization/__init__.py b/rllab/envs/mujoco/dynamics_randomization/__init__.py
@@ -0,0 +1,4 @@
+from rllab.envs.mujoco.dynamics_randomization.randomized_env import randomize
+from rllab.envs.mujoco.dynamics_randomization.variation import Distribution
+from rllab.envs.mujoco.dynamics_randomization.variation import Method
+from rllab.envs.mujoco.dynamics_randomization.variation import Variations
diff --git a/rllab/envs/mujoco/dynamics_randomization/randomized_env.py b/rllab/envs/mujoco/dynamics_randomization/randomized_env.py
@@ -0,0 +1,87 @@
+import os.path as osp
+
+from mujoco_py import MjSim
+from mujoco_py import load_model_from_xml
+
+from rllab.core import Serializable
+from rllab.envs import Env
+from rllab.envs.mujoco.mujoco_env import MODEL_DIR
+
+
+class RandomizedEnv(Env, Serializable):
+    """
+    This class is just a wrapper class for the MujocoEnv to perform
+    the training using Dynamics Randomization.
+    Only code in the methods reset and terminate has been added.
+    """
+
+    def __init__(self, mujoco_env, variations):
+        """
+        An instance of the class MujocoModelGenerator is created to
+        generate the Mujoco models with the randomization of the
+        requested dynamic parameters.
+        """
+        Serializable.quick_init(self, locals())
+        self._wrapped_env = mujoco_env
+        self._variations = variations
+        self._file_path = osp.join(MODEL_DIR, mujoco_env.FILE)
+        self._variations.initialize_variations(self._file_path)
+
+    def reset(self):
+        """
+        The new model with randomized parameters is requested and the
+        corresponding parameters in the MuJoCo environment class are
+        set.
+        """
+        self._wrapped_env.model = load_model_from_xml(
+            self._variations.get_randomized_xml_model())
+        if hasattr(self._wrapped_env, 'action_space'):
+            del self._wrapped_env.__dict__['action_space']
+        self._wrapped_env.sim = MjSim(self._wrapped_env.model)
+        self._wrapped_env.data = self._wrapped_env.sim.data
+        self._wrapped_env.init_qpos = self._wrapped_env.sim.data.qpos
+        self._wrapped_env.init_qvel = self._wrapped_env.sim.data.qvel
+        self._wrapped_env.init_qacc = self._wrapped_env.sim.data.qacc
+        self._wrapped_env.init_ctrl = self._wrapped_env.sim.data.ctrl
+        return self._wrapped_env.reset()
+
+    def step(self, action):
+        return self._wrapped_env.step(action)
+
+    def render(self, *args, **kwargs):
+        return self._wrapped_env.render(*args, **kwargs)
+
+    def log_diagnostics(self, paths, *args, **kwargs):
+        self._wrapped_env.log_diagnostics(paths, *args, **kwargs)
+
+    def get_param_values(self):
+        return self._wrapped_env.get_param_values()
+
+    def set_param_values(self, params):
+        self._wrapped_env.set_param_values(params)
+
+    def terminate(self):
+        """
+        Besides regular termination, the MuJoCo model generator is
+        stopped.
+        """
+        self._wrapped_env.terminate()
+
+    @property
+    def wrapped_env(self):
+        return self._wrapped_env
+
+    @property
+    def action_space(self):
+        return self._wrapped_env.action_space
+
+    @property
+    def observation_space(self):
+        return self._wrapped_env.observation_space
+
+    @property
+    def horizon(self):
+        return self._wrapped_env.horizon
+
+
+randomize = RandomizedEnv
diff --git a/rllab/envs/mujoco/dynamics_randomization/test_dynamics_rand.py b/rllab/envs/mujoco/dynamics_randomization/test_dynamics_rand.py
@@ -0,0 +1,21 @@
+from rllab.envs.mujoco import SwimmerEnv
+from rllab.envs.mujoco.dynamics_randomization import Distribution
+from rllab.envs.mujoco.dynamics_randomization import Method
+from rllab.envs.mujoco.dynamics_randomization import randomize
+from rllab.envs.mujoco.dynamics_randomization import Variations
+
+variations = Variations()
+variations.randomize() \
+        .at_xpath(".//geom[@name='torso']") \
+        .attribute("density") \
+        .with_method(Method.COEFFICIENT) \
+        .sampled_from(Distribution.UNIFORM) \
+        .with_range(0.5, 1.5) \
+        .add()
+
+env = randomize(SwimmerEnv(), variations)
+
+for i in range(1000):
+    env.reset()
+    for j in range(1000):
+        env.step(env.action_space.sample())