vllm-project · frank-wei · Aug 29, 2025 · gemini-code-assist · Aug 29, 2025
@@ -240,9 +240,7 @@ def forward(
         `vllm.forward_context.get_forward_context().attn_metadata`.
         """
         if self.calculate_kv_scales:
-            attn_metadata = get_forward_context().attn_metadata
-            if attn_metadata.enable_kv_scales_calculation:
-                self.calc_kv_scales(query, key, value)
+            self.calc_kv_scales(query, key, value)
-            self.calc_kv_scales(query, key, value)
+            if key is not None and value is not None:
+                self.calc_kv_scales(query, key, value)
-            self.calc_kv_scales(query, key, value)
+            if key is not None and value is not None:
+                self.calc_kv_scales(query, key, value)
         if self.use_output:
             output_shape = (output_shape
                             if output_shape is not None else query.shape)