Fixing the analytics side-channel for curriculum learning. (#5586)

* Fixing the analytics side-channel for curriculum learning. * Made a more robust test. * Update the changelog. * Update com.unity.ml-agents/CHANGELOG.md Co-authored-by: Maryam Honari <honari.m94@gmail.com> Co-authored-by: Maryam Honari <honari.m94@gmail.com>
Unity-Technologies · Nov 4, 2021 · 92f1d1f · 92f1d1f
1 parent 3fe4e03
commit 92f1d1f
Show file tree

Hide file tree

Showing 4 changed files with 57 additions and 3 deletions.
diff --git a/com.unity.ml-agents/CHANGELOG.md b/com.unity.ml-agents/CHANGELOG.md
@@ -11,6 +11,7 @@ and this project adheres to
 - Upgrade to 2.0.1
 #### ml-agents / ml-agents-envs / gym-unity (Python)
 - Set gym version in gym-unity to gym release 0.20.0
+- Fixed the bug where curriculum learning would crash because of the incorrect run_options parsing. (#5586)
 - Added minimal analytics collection to LL-API (#5511)
 
 ## [2.0.0] - 2021-09-01

diff --git a/ml-agents/mlagents/trainers/subprocess_env_manager.py b/ml-agents/mlagents/trainers/subprocess_env_manager.py
@@ -37,7 +37,9 @@
     EnvironmentStats,
     StatsSideChannel,
 )
-from mlagents.training_analytics_side_channel import TrainingAnalyticsSideChannel
+from mlagents.trainers.training_analytics_side_channel import (
+    TrainingAnalyticsSideChannel,
+)
 from mlagents_envs.side_channel.side_channel import SideChannel
 
 

diff --git a/ml-agents/mlagents/trainers/tests/test_training_analytics_side_channel.py b/ml-agents/mlagents/trainers/tests/test_training_analytics_side_channel.py
@@ -0,0 +1,48 @@
+import yaml
+from mlagents.trainers.settings import RunOptions
+from mlagents.trainers.training_analytics_side_channel import (
+    TrainingAnalyticsSideChannel,
+)
+
+test_curriculum_config_yaml = """
+environment_parameters:
+    param_1:
+      curriculum:
+          - name: Lesson1
+            completion_criteria:
+                measure: reward
+                behavior: fake_behavior
+                threshold: 30
+                min_lesson_length: 100
+                require_reset: true
+            value: 1
+          - name: Lesson2
+            completion_criteria:
+                measure: reward
+                behavior: fake_behavior
+                threshold: 60
+                min_lesson_length: 100
+                require_reset: false
+            value: 2
+          - name: Lesson3
+            value:
+                sampler_type: uniform
+                sampler_parameters:
+                    min_value: 1
+                    max_value: 3
+"""
+
+
+def test_sanitize_run_options():
+    run_options = RunOptions.from_dict(yaml.safe_load(test_curriculum_config_yaml))
+    sanitized = TrainingAnalyticsSideChannel._sanitize_run_options(run_options)
+    assert "param_1" not in sanitized["environment_parameters"]
+    assert "fake_behavior" not in sanitized["environment_parameters"]
+    assert (
+        TrainingAnalyticsSideChannel._hash("param_1")
+        in sanitized["environment_parameters"]
+    )
+    level1 = TrainingAnalyticsSideChannel._hash("param_1")
+    assert sanitized["environment_parameters"][level1]["curriculum"][0][
+        "completion_criteria"
+    ]["behavior"] == TrainingAnalyticsSideChannel._hash("fake_behavior")
diff --git a/...agents/training_analytics_side_channel.py → ...ainers/training_analytics_side_channel.py b/...agents/training_analytics_side_channel.py → ...ainers/training_analytics_side_channel.py
@@ -74,9 +74,12 @@ def _sanitize_run_options(cls, config: RunOptions) -> Dict[str, Any]:
                 updated_lessons = []
                 for lesson in curriculum["curriculum"]:
                     new_lesson = copy.deepcopy(lesson)
-                    if lesson.has_keys("name"):
+                    if "name" in lesson:
                         new_lesson["name"] = cls._hash(lesson["name"])
-                    if lesson.has_keys("completion_criteria"):
+                    if (
+                        "completion_criteria" in lesson
+                        and lesson["completion_criteria"] is not None
+                    ):
                         new_lesson["completion_criteria"]["behavior"] = cls._hash(
                             new_lesson["completion_criteria"]["behavior"]
                         )