fix MHA backend selection on rocm platform

tjtanaa · tjtanaa · commit f4de63119069 · 2025-06-20T10:10:37.000Z
Signed-off-by: tjtanaa &lt;tunjian.tan@embeddedllm.com&gt;
diff --git a/vllm/attention/layer.py b/vllm/attention/layer.py
@@ -308,7 +308,7 @@ def __init__(
         backend = backend_name_to_enum(attn_backend.get_name())
         if current_platform.is_rocm():
             # currently, only torch_sdpa is supported on rocm
-            backend = _Backend.TORCH_SDPA
+            self.attn_backend = _Backend.TORCH_SDPA
         else:
             if backend in {_Backend.FLASH_ATTN, _Backend.FLASH_ATTN_VLLM_V1}:
                 backend = _Backend.XFORMERS