format

Qubitium · Qubitium · commit 1f731aecaf31 · 2025-03-22T03:29:03.000Z
Signed-off-by: Qubitium &lt;qubitium@modelcloud.ai&gt;
diff --git a/vllm/model_executor/layers/quantization/kernels/mixed_precision/marlin.py b/vllm/model_executor/layers/quantization/kernels/mixed_precision/marlin.py
@@ -117,7 +117,7 @@ def apply_weights(self,
                       bias: Optional[torch.Tensor] = None) -> torch.Tensor:
         # marlin requires contiguous memory layout
         # kv/prefill caching may cause x to be non-contiguous
-        x = x.contiguous() # no-op if already contiguous
+        x = x.contiguous()  # no-op if already contiguous
 
         c = self.config
         w_q, w_s, w_zp, w_gidx = self._get_weight_params(layer)