improve the robustness of parsing vlms config in AutoRound (vllm-project#18894)

wenhuach21 · amitm02 · commit 6e1e1ca77cac · 2025-06-01T17:55:49.000+03:00
Signed-off-by: wenhuach21 &lt;wenhua.cheng@intel.com&gt;
Signed-off-by: amit &lt;amit.man@gmail.com&gt;
diff --git a/vllm/model_executor/layers/quantization/auto_round.py b/vllm/model_executor/layers/quantization/auto_round.py
@@ -116,8 +116,9 @@ def get_layer_config(self, layer, layer_name: str):
 
         quantized = True
         if self.block_name_to_quantize:
-            quantized = any(name in layer_name
-                            for name in self.block_name_to_quantize)
+            quantized = any(
+                layer_name.startswith(name)
+                for name in self.block_name_to_quantize)
         elif isinstance(layer, ParallelLMHead):
             quantized = False