[rocm] Fix wrong attention log (vllm-project#18764)

fxmarty-amd · amitm02 · commit 7d23397b02fc · 2025-06-01T17:55:49.000+03:00
Signed-off-by: Felix Marty &lt;felmarty@amd.com&gt;
Signed-off-by: amit &lt;amit.man@gmail.com&gt;
diff --git a/vllm/platforms/rocm.py b/vllm/platforms/rocm.py
@@ -194,8 +194,9 @@ def get_attn_backend_cls(cls, selected_backend, head_size, dtype,
                     f" The selected backend, {selected_backend.name},"
                     f"is not MLA type while requested for MLA backend.")
 
-        selected_backend = (_Backend.ROCM_FLASH if selected_backend
-                            == _Backend.FLASH_ATTN else selected_backend)
+        if selected_backend is None or selected_backend == _Backend.FLASH_ATTN:
+            selected_backend = _Backend.ROCM_FLASH
+
         if envs.VLLM_USE_V1:
             logger.info("Using Triton Attention backend on V1 engine.")
             return ("vllm.v1.attention.backends."