[RLlib] Cleanup examples folder (new API stack) vol 31: Add hierarchical training example script. #49127

sven1977 · 2024-12-06T11:24:13Z

Cleanup examples folder (new API stack) vol 31:

Add new example env (six room env) with two versions: flat and hierarchical.
Add hierarchical training example script.

Why are these changes needed?

Related issue number

Checks

I've signed off every commit(by using the -s flag, i.e., git commit -s) in this PR.
I've run scripts/format.sh to lint the changes in this PR.
I've included any doc changes needed for https://docs.ray.io/en/master/.
- I've added any new APIs to the API Reference. For example, if I added a
  method in Tune, I've added it in doc/source/tune/api/ under the
  corresponding .rst file.
I've made sure the tests are passing. Note that there might be a few flaky tests, see the recent failures at https://flakey-tests.ray.io/
Testing Strategy
- Unit tests
- Release tests
- This PR is not tested :(

Signed-off-by: sven1977 <svenmika1977@gmail.com>

…nup_examples_folder_31_hierarchical_training

Signed-off-by: sven1977 <svenmika1977@gmail.com>

…nup_examples_folder_31_hierarchical_training

Signed-off-by: sven1977 <svenmika1977@gmail.com>

…nup_examples_folder_31_hierarchical_training

Signed-off-by: sven1977 <svenmika1977@gmail.com>

…nup_examples_folder_31_hierarchical_training

Signed-off-by: sven1977 <svenmika1977@gmail.com>

sven1977 · 2024-12-06T12:35:52Z

doc/source/rllib/rllib-examples.rst

+Hierarchical Training
+++++++++++++++++++++
+
+- `Policy Inference after Training <https://github.com/ray-project/ray/blob/master/rllib/examples/inference/policy_inference_after_training.py>`__:


sorry, still WIP ... please ignore this change here for now

sven1977 · 2024-12-06T12:36:05Z

rllib/env/utils/infinite_lookback_buffer.py

@@ -533,9 +533,18 @@ def _get_int_index(
    ):
        data_to_use = self.data
        if _ignore_last_ts:
-            data_to_use = self.data[:-1]
+            if self.finalized:


these were all bugs

Signed-off-by: sven1977 <svenmika1977@gmail.com>

sven1977 · 2024-12-06T13:20:59Z

rllib/env/multi_agent_episode.py

                    return {
                        key: sub_buffer.get(
                            indices=index_incl_lookback - sub_buffer.lookback,
                            neg_index_as_lookback=True,
                            fill=fill,
-                            _add_last_ts_value=hanging_val,
+                            _add_last_ts_value=(


another bug fix

Signed-off-by: sven1977 <svenmika1977@gmail.com>

…nup_examples_folder_31_hierarchical_training

Signed-off-by: sven1977 <svenmika1977@gmail.com>

…xamples_folder_31_hierarchical_training # Conflicts: # rllib/env/multi_agent_episode.py # rllib/env/single_agent_episode.py # rllib/env/tests/test_multi_agent_episode.py # rllib/env/utils/infinite_lookback_buffer.py

Signed-off-by: sven1977 <svenmika1977@gmail.com>

…nup_examples_folder_31_hierarchical_training Signed-off-by: sven1977 <svenmika1977@gmail.com> # Conflicts: # rllib/env/multi_agent_episode.py

Signed-off-by: sven1977 <svenmika1977@gmail.com>

…cal training example script. (ray-project#49127)

…cal training example script. (ray-project#49127) Signed-off-by: ujjawal-khare <ujjawal.khare@dream11.com>

sven1977 added 15 commits November 4, 2024 18:14

wip

10718e7

Signed-off-by: sven1977 <svenmika1977@gmail.com>

Merge branch 'master' of https://github.com/ray-project/ray into clea…

f6caa54

…nup_examples_folder_31_hierarchical_training

wip

45d16fa

Signed-off-by: sven1977 <svenmika1977@gmail.com>

wip

e02f5ad

Signed-off-by: sven1977 <svenmika1977@gmail.com>

Merge branch 'master' of https://github.com/ray-project/ray into clea…

2e507ec

…nup_examples_folder_31_hierarchical_training

Merge branch 'master' of https://github.com/ray-project/ray into clea…

4c04b04

…nup_examples_folder_31_hierarchical_training

Merge branch 'master' of https://github.com/ray-project/ray into clea…

36fb8d4

…nup_examples_folder_31_hierarchical_training

wip

d3da672

Signed-off-by: sven1977 <svenmika1977@gmail.com>

wip

b8d502f

Signed-off-by: sven1977 <svenmika1977@gmail.com>

Merge branch 'master' of https://github.com/ray-project/ray into clea…

542d22a

…nup_examples_folder_31_hierarchical_training

wip

724d350

Signed-off-by: sven1977 <svenmika1977@gmail.com>

wip

408f633

Signed-off-by: sven1977 <svenmika1977@gmail.com>

wip

a632872

Signed-off-by: sven1977 <svenmika1977@gmail.com>

Merge branch 'master' of https://github.com/ray-project/ray into clea…

6185746

…nup_examples_folder_31_hierarchical_training

wip

1a99237

Signed-off-by: sven1977 <svenmika1977@gmail.com>

sven1977 requested a review from simonsays1980 as a code owner December 6, 2024 11:24

sven1977 assigned simonsays1980 Dec 6, 2024

sven1977 added rllib RLlib related issues rllib-env rllib env related issues rllib-docs-or-examples Issues related to RLlib documentation or rllib/examples rllib-newstack rllib-oldstack-cleanup Issues related to cleaning up classes, utilities on the old API stack labels Dec 6, 2024

wip

c42b435

Signed-off-by: sven1977 <svenmika1977@gmail.com>

sven1977 requested review from maxpumperla and a team as code owners December 6, 2024 12:20

sven1977 commented Dec 6, 2024

View reviewed changes

wip

36bea65

Signed-off-by: sven1977 <svenmika1977@gmail.com>

sven1977 commented Dec 6, 2024

View reviewed changes

wip

466f53d

Signed-off-by: sven1977 <svenmika1977@gmail.com>

sven1977 added 4 commits December 10, 2024 14:01

Merge branch 'master' of https://github.com/ray-project/ray into clea…

9f3e607

…nup_examples_folder_31_hierarchical_training

wip

1aa4ab0

Signed-off-by: sven1977 <svenmika1977@gmail.com>

wip

9f8c33a

Signed-off-by: sven1977 <svenmika1977@gmail.com>

sven1977 requested a review from a team as a code owner December 10, 2024 18:45

sven1977 added 10 commits December 10, 2024 23:05

wip

240720a

Signed-off-by: sven1977 <svenmika1977@gmail.com>

LINT

6715808

Signed-off-by: sven1977 <svenmika1977@gmail.com>

running fine w/o crashes

d289127

Signed-off-by: sven1977 <svenmika1977@gmail.com>

Merge branch 'master' of https://github.com/ray-project/ray into clea…

281c30a

…nup_examples_folder_31_hierarchical_training Signed-off-by: sven1977 <svenmika1977@gmail.com> # Conflicts: # rllib/env/multi_agent_episode.py

wip

98c5e4f

Signed-off-by: sven1977 <svenmika1977@gmail.com>

wip

5e71845

Signed-off-by: sven1977 <svenmika1977@gmail.com>

wip

8d46aec

Signed-off-by: sven1977 <svenmika1977@gmail.com>

wip

72bec12

Signed-off-by: sven1977 <svenmika1977@gmail.com>

wip

a1369a7

Signed-off-by: sven1977 <svenmika1977@gmail.com>

wip

78b36fc

Signed-off-by: sven1977 <svenmika1977@gmail.com>

sven1977 enabled auto-merge (squash) December 11, 2024 12:29

github-actions bot disabled auto-merge December 11, 2024 12:29

github-actions bot added the go add ONLY when ready to merge, run all tests label Dec 11, 2024

wip

81f7a57

Signed-off-by: sven1977 <svenmika1977@gmail.com>

sven1977 enabled auto-merge (squash) December 11, 2024 12:36

wip

cd61bb3

Signed-off-by: sven1977 <svenmika1977@gmail.com>

github-actions bot disabled auto-merge December 11, 2024 13:31

sven1977 enabled auto-merge (squash) December 11, 2024 13:45

wip

5209af7

Signed-off-by: sven1977 <svenmika1977@gmail.com>

github-actions bot disabled auto-merge December 11, 2024 14:44

sven1977 enabled auto-merge (squash) December 11, 2024 16:27

sven1977 merged commit f98ce02 into ray-project:master Dec 11, 2024
6 checks passed

sven1977 deleted the cleanup_examples_folder_31_hierarchical_training branch December 11, 2024 18:27

simonsays1980 pushed a commit to simonsays1980/ray that referenced this pull request Dec 12, 2024

[RLlib] Cleanup examples folder (new API stack) vol 31: Add hierarchi…

4783f33

…cal training example script. (ray-project#49127)

ujjawal-khare pushed a commit to ujjawal-khare-27/ray that referenced this pull request Dec 17, 2024

[RLlib] Cleanup examples folder (new API stack) vol 31: Add hierarchi…

a401270

…cal training example script. (ray-project#49127) Signed-off-by: ujjawal-khare <ujjawal.khare@dream11.com>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[RLlib] Cleanup examples folder (new API stack) vol 31: Add hierarchical training example script. #49127

[RLlib] Cleanup examples folder (new API stack) vol 31: Add hierarchical training example script. #49127

sven1977 commented Dec 6, 2024 •

edited

Loading

sven1977 Dec 6, 2024

sven1977 Dec 6, 2024

sven1977 Dec 6, 2024

[RLlib] Cleanup examples folder (new API stack) vol 31: Add hierarchical training example script. #49127

[RLlib] Cleanup examples folder (new API stack) vol 31: Add hierarchical training example script. #49127

Conversation

sven1977 commented Dec 6, 2024 • edited Loading

Why are these changes needed?

Related issue number

Checks

sven1977 Dec 6, 2024

Choose a reason for hiding this comment

sven1977 Dec 6, 2024

Choose a reason for hiding this comment

sven1977 Dec 6, 2024

Choose a reason for hiding this comment

sven1977 commented Dec 6, 2024 •

edited

Loading