huggingface · younesbelkada · May 15, 2023 · May 12, 2023
diff --git a/tests/test_peft_models.py b/tests/test_peft_models.py
@@ -191,3 +191,18 @@ def test_load_pretrained_peft(self):
             for p1, p2 in zip(model.named_parameters(), model_from_pretrained.named_parameters()):
                 if p1[0] not in ["v_head.summary.weight", "v_head.summary.bias"]:
                     self.assertTrue(torch.allclose(p1[1], p2[1]), msg=f"{p1[0]} != {p2[0]}")
+
+    def test_continue_training_peft_model(self):
+        r"""
+        Load peft and checks that it can continue training.
+        """
+        causal_lm_model = AutoModelForCausalLM.from_pretrained(self.causal_lm_model_id)
+        pretrained_model = get_peft_model(causal_lm_model, self.lora_config)
+
+        with tempfile.TemporaryDirectory() as tmp_dir:
+            pretrained_model.save_pretrained(tmp_dir)
+            # set is_trainable to True
+            model = AutoModelForCausalLMWithValueHead.from_pretrained(tmp_dir, is_trainable=True)
+            # Check that the number of trainable parameters is correct
+            nb_trainable_params = sum(p.numel() for p in model.parameters() if p.requires_grad)
+            self.assertEqual(nb_trainable_params, 10273)
diff --git a/trl/models/modeling_base.py b/trl/models/modeling_base.py
@@ -107,9 +107,11 @@ class and the arguments that are specific to trl models. The kwargs
         """
         if kwargs is not None:
             peft_config = kwargs.pop("peft_config", None)
+            is_trainable = kwargs.pop("is_trainable", False)
             trl_model_args, pretrained_kwargs, peft_int8_kwargs = cls._split_kwargs(kwargs)
         else:
             peft_config = None
+            is_trainable = False
             trl_model_args = {}
             pretrained_kwargs = {}
             peft_int8_kwargs = {}
@@ -163,7 +165,9 @@ class and the arguments that are specific to trl models. The kwargs
                     peft_config.base_model_name_or_path, *model_args, **pretrained_kwargs
                 )
 
-                pretrained_model = PeftModel.from_pretrained(pretrained_model, pretrained_model_name_or_path)
+                pretrained_model = PeftModel.from_pretrained(
+                    pretrained_model, pretrained_model_name_or_path, is_trainable=is_trainable
+                )
             else:
                 pretrained_model = cls.transformers_parent_class.from_pretrained(
                     pretrained_model_name_or_path, *model_args, **pretrained_kwargs