youliangtan · kylestach · Jan 26, 2024 · Feb 20, 2024
diff --git a/agentlace/data/rlds_writer.py b/agentlace/data/rlds_writer.py
@@ -0,0 +1,64 @@
+import tensorflow as tf
+import tensorflow_datasets as tfds
+from tensorflow_datasets.rlds.rlds_base import DatasetConfig, build_info
+from tensorflow_datasets.core import SequentialWriter, Version, dataset_info
+
+
+class RLDSWriter:
+ def __init__(
+ self,
+ dataset_name: str,
+ data_spec: tf.TypeSpec,
+ data_directory: str,
+ version: str,
+ *,
+ max_episodes_per_file: int = 1000,
+ ):
+ data_features = tf.nest.map_structure(
+ lambda x: tfds.features.Tensor(shape=x.shape, dtype=x.dtype), data_spec
+ )
+ ds_config = DatasetConfig(
+ name=dataset_name,
+ observation_info=tfds.features.FeaturesDict(data_features["observation"]),
+ action_info=data_features["action"],
+ )
+ ds_identity = dataset_info.DatasetIdentity(
+ name=ds_config.name,
+ version=Version(version),
+ data_dir=data_directory,
+ module_name="",
+ )
+ self._ds_info = build_info(ds_config, ds_identity)
+
+ self._sequential_writer = SequentialWriter(
+ self._ds_info, max_episodes_per_file, overwrite=False
+ )
+ self._sequential_writer.initialize_splits(["train"], fail_if_exists=False)
+ self._episode = []
+
+ def __call__(self, data):
+ self._episode.append(data)
+ if (
+ data.get("is_last", False)
+ or data.get("is_terminal", False)
+ or data.get("end_of_trajectory", False)
+ ):
+ self._write_episode()
+
+ def _write_episode(self):
+ episode = tf.nest.map_structure(lambda x: x._numpy(), self._episode)
+ self._sequential_writer.add_examples({"train": [{"steps": episode}]})
+ self._episode = []
+
+ def flush(self):
+ if len(self._episode) > 0:
+ self._episode[-1]["is_last"] = tf.constant(True, dtype=tf.bool)
+ self._write_episode()
+
+ for split in self._sequential_writer._splits.values():
+ if split.current_shard is not None:
+ split.current_shard.writer.flush()
+
+ def close(self):
+ self.flush()
+ self._sequential_writer.close_all()
diff --git a/agentlace/data/tf_agents_episode_buffer.py b/agentlace/data/tf_agents_episode_buffer.py
@@ -0,0 +1,119 @@
+from functools import partial
+from typing import Any, Optional
+from agentlace.data.rlds_writer import RLDSWriter
+import tensorflow as tf
+from tf_agents.replay_buffers.episodic_replay_buffer import (
+ EpisodicReplayBuffer,
+ StatefulEpisodicReplayBuffer,
+)
+from agentlace.data.data_store import DataStoreBase
+from dlimp.dataset import DLataset, _wrap as dlimp_wrap
+
+
+class EpisodicTFDataStore(DataStoreBase):
+ def __init__(
+ self,
+ capacity: int,
+ data_spec: tf.TypeSpec,
+ rlds_logger: Optional[RLDSWriter] = None,
+ ):
+ super().__init__(capacity)
+
+ def _begin_episode(trajectory):
+ return trajectory["is_first"][..., 0]
+
+ def _end_episode(trajectory):
+ return trajectory["is_last"][..., -1]
+
+ self._num_data_seen = 0
+ data_spec = {
+ **data_spec,
+ "_traj_index": tf.TensorSpec(shape=(), dtype=tf.int64),
+ }
+ self._replay_buffer = StatefulEpisodicReplayBuffer(
+ EpisodicReplayBuffer(
+ data_spec=data_spec,
+ capacity=capacity,
+ buffer_size=1,
+ begin_episode_fn=_begin_episode,
+ end_episode_fn=_end_episode,
+ )
+ )
+
+ self._logger = rlds_logger
+
+ def insert(self, data: Any):
+ self._replay_buffer.add_sequence(
+ tf.nest.map_structure(
+ partial(tf.expand_dims, axis=0),
+ data | {"_traj_index": self._replay_buffer.episode_ids},
+ )
+ )
+ self._num_data_seen += 1
+
+ if self._logger:
+ self._logger(data)
+
+ @property
+ def size(self):
+ return min(self._num_data_seen, self.capacity)
+
+ @partial(dlimp_wrap, is_flattened=False)
+ def as_dataset(self) -> DLataset:
+ dataset: tf.data.Dataset = self._replay_buffer.as_dataset()
+
+ def convert_trajectory_to_dlimp(trajectory, aux):
+ ep_len = tf.shape(tf.nest.flatten(trajectory)[0])[0]
+ return {
+ **trajectory,
+ "_len": tf.repeat(ep_len, ep_len),
+ "_frame_index": tf.range(ep_len),
+ }
+
+ return dataset.map(convert_trajectory_to_dlimp)
+
+
+if __name__ == "__main__":
+ data_spec = {
+ "action": tf.TensorSpec(shape=(2,), dtype=tf.float32),
+ "observation": {
+ "image": tf.TensorSpec(shape=(), dtype=tf.string),
+ "position": tf.TensorSpec(shape=(2,), dtype=tf.float32),
+ },
+ "is_first": tf.TensorSpec(shape=(), dtype=tf.bool),
+ "is_last": tf.TensorSpec(shape=(), dtype=tf.bool),
+ "is_terminal": tf.TensorSpec(shape=(), dtype=tf.bool),
+ }
+
+ logger = RLDSWriter(
+ "test_rlds_agentlace",
+ data_spec,
+ data_directory="/tmp/test_rlds_agentlace",
+ version="0.0.1",
+ )
+ buffer = EpisodicTFDataStore(1000, data_spec, rlds_logger=logger)
+ dataset = buffer.as_dataset()
+ dataset_iter = dataset.flatten().batch(256).as_numpy_iterator()
+
+ for episode in range(100):
+ ep_len = tf.random.uniform(shape=(), minval=1, maxval=10, dtype=tf.int32)
+ for i in range(ep_len):
+ buffer.insert(
+ {
+ "action": tf.constant([0, 0], dtype=tf.float32),
+ "observation": {
+ "image": tf.constant("image", dtype=tf.string),
+ "position": tf.constant([i, 0], dtype=tf.float32),
+ },
+ "is_first": tf.constant(i == 0, dtype=tf.bool),
+ "is_last": tf.constant(i == ep_len - 1, dtype=tf.bool),
+ "is_terminal": tf.constant(False, dtype=tf.bool),
+ }
+ )
+
+ from tqdm import trange
+
+ for _ in range(100):
+ next(dataset_iter)
+ for _ in trange(1000, desc="Benchmarking sampling speed..."):
+ next(dataset_iter)