adding a llama3 70b sweep

dtch1997 · Aug 5, 2024 · 810fd8a · 810fd8a
1 parent 085f509
commit 810fd8a
Showing 1 changed file with 84 additions and 0 deletions.
diff --git a/repepo/experiments/sweep_llama3_70b_layers.py b/repepo/experiments/sweep_llama3_70b_layers.py
@@ -0,0 +1,84 @@
+from dataclasses import dataclass, field
+import json
+import os
+from pathlib import Path
+
+import torch
+from repepo.core.format import LlamaChatFormatter
+from repepo.steering.sweep_layers import SWEEP_DATASETS, sweep_layers
+from transformers import AutoModelForCausalLM, AutoTokenizer
+from repepo.data.multiple_choice.make_mwe_xrisk import make_mwe as make_mwe_xrisk_caa
+from repepo.data.multiple_choice.make_mwe_persona import make_mwe_personas_caa
+from repepo.data.multiple_choice.make_caa_sycophancy import make_sycophancy_caa
+from repepo.data.multiple_choice.make_caa_truthfulqa import make_truthfulqa_caa
+from simple_parsing import ArgumentParser
+
+CONFIG_SAVE_PATH = "config.json"
+
+
+@dataclass
+class LlamaSweepLayersConfig:
+    output_dir: str
+    train_split: str = "0%:10%"
+    test_split: str = "20%:30%"
+    multipliers: list[float] = field(
+        default_factory=lambda: [-1.5, -1.0, -0.5, 0.5, 1.0, 1.5]
+    )
+    datasets: list[str] = field(default_factory=lambda: SWEEP_DATASETS)
+    force: bool = False
+
+
+def make_all_datasets():
+    make_sycophancy_caa()
+    make_truthfulqa_caa()
+    make_mwe_xrisk_caa()
+    make_mwe_personas_caa()
+
+
+def sweep_llama3_70b_layers(config: LlamaSweepLayersConfig):
+    print(f"Running sweep with config: {config}")
+    make_all_datasets()
+    model = AutoModelForCausalLM.from_pretrained(
+        "meta-llama/Meta-Llama-3.1-70B-Instruct", torch_dtype="auto", device_map="auto"
+    )
+    tokenizer = AutoTokenizer.from_pretrained("meta-llama/Meta-Llama-3.1-70B-Instruct")
+
+    output_dir = Path(config.output_dir)
+    if output_dir.exists():
+        if not os.path.exists(output_dir / CONFIG_SAVE_PATH):
+            raise ValueError(
+                f"Output directory {output_dir} exists but does not contain a config file."
+            )
+        with open(output_dir / CONFIG_SAVE_PATH, "r") as f:
+            old_config_dict = json.load(f)
+        old_config = LlamaSweepLayersConfig(**old_config_dict)
+        if old_config != config:
+            raise ValueError(
+                f"Output directory {output_dir} exists but contains a different config."
+            )
+    else:
+        output_dir.mkdir(parents=True, exist_ok=True)
+        with open(output_dir / CONFIG_SAVE_PATH, "w") as f:
+            json.dump(config.__dict__, f, indent=4, ensure_ascii=False)
+    sweep_results = sweep_layers(
+        model=model,
+        tokenizer=tokenizer,
+        layers=range(32),
+        train_split=config.train_split,
+        test_split=config.test_split,
+        datasets=config.datasets,
+        multipliers=config.multipliers,
+        formatter=LlamaChatFormatter(),
+        save_progress_dir=output_dir,
+    )
+    if output_dir is not None:
+        torch.save(sweep_results, output_dir / "sweep_results.pt")
+    return sweep_results
+
+
+if __name__ == "__main__":
+    parser = ArgumentParser()
+    parser.add_arguments(LlamaSweepLayersConfig, dest="config")
+    args = parser.parse_args()
+    config = args.config
+    sweep_llama3_70b_layers(config)