Add back checks for model named parameters.

jennifurhe · jennifurhe · commit 216f147ea3c7 · 2025-07-13T16:29:23.000-04:00
Also, switch position_ids to be initialized as a buffer and clean up
unused code.

Signed-off-by: Jen H &lt;islandhe@gmail.com&gt;

Signed-off-by:  &lt;islandhe@gmail.com&gt;
diff --git a/vllm/model_executor/models/bert.py b/vllm/model_executor/models/bert.py
@@ -44,13 +44,10 @@ def __init__(self, config: BertConfig):
         self.LayerNorm = nn.LayerNorm(config.hidden_size,
                                       eps=config.layer_norm_eps)
 
-        # Use nn.Parameter with requires_grad=False to maintain compatibility
-        # with existing HF checkpoints while ensuring position_ids are
-        # non-trainable.
-        self.position_ids = nn.Parameter(torch.empty(
-            (1, config.max_position_embeddings)),
-                                         requires_grad=False)
-
+        self.register_buffer(
+            "position_ids",
+            torch.arange(config.max_position_embeddings).unsqueeze(0),
+        )
         self.position_embedding_type = config.position_embedding_type
         if self.position_embedding_type != "absolute":
             raise ValueError("Only 'absolute' position_embedding_type" +
@@ -379,7 +376,8 @@ def load_weights(self, weights: Iterable[tuple[str,
                 loaded_stacked_params.append(name)
                 break
             else:
-                other_weights.append((name, loaded_weight))
+                if name in params_dict:
+                    other_weights.append((name, loaded_weight))
 
         loader = AutoWeightsLoader(
             self,
diff --git a/vllm/model_executor/models/roberta.py b/vllm/model_executor/models/roberta.py
@@ -1,7 +1,6 @@
 # SPDX-License-Identifier: Apache-2.0
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project
 
-import itertools
 from collections.abc import Iterable
 from typing import Optional, Union
 
@@ -39,8 +38,10 @@ def __init__(self, config: RobertaConfig):
                                                   config.hidden_size)
         self.LayerNorm = nn.LayerNorm(config.hidden_size,
                                       eps=config.layer_norm_eps)
-        self.position_ids = nn.Parameter(
-            torch.empty((1, config.max_position_embeddings)), )
+        self.register_buffer(
+            "position_ids",
+            torch.arange(config.max_position_embeddings).unsqueeze(0),
+        )
 
         self.position_embedding_type = config.position_embedding_type
         if self.position_embedding_type != "absolute":
@@ -238,27 +239,3 @@ def create_position_ids_from_input_ids(input_ids,
                            past_key_values_length) * mask
 
     return incremental_indices.long() + padding_idx
-
-
-def roberta_task_weights_filter(
-    all_weights: Iterable[tuple[str, torch.Tensor]]
-) -> tuple[Iterable[tuple[str, torch.Tensor]], Iterable[tuple[str,
-                                                              torch.Tensor]]]:
-    """
-    Separate task-specific weights that are applied on top
-    of the encoder-decoder bert base.
-    To do so, return two generators over the original iterator.
-    Also, remove the "roberta." prefix to make it loadable
-    from vanilla BertModel.
-    """
-    # Copy of a lazy iterator without in-memory overhead so both
-    # iterators can be iterated upon independently.
-    all_weights1, all_weights2 = itertools.tee(all_weights)
-
-    def encoder_decoder_weights():
-        for name, weight in all_weights1:
-            if name.startswith("roberta."):
-                yield (name[len("roberta."):], weight)
-
-    return encoder_decoder_weights(), ((n, w) for n, w in all_weights2
-                                       if not n.startswith("roberta."))