[Bugfix] Fix mc2 operator error in aclgraph + ep<16 scenario

MengqingCao · MengqingCao · commit 7662691876a9 · 2025-08-28T09:09:47.000Z
Signed-off-by: MengqingCao &lt;cmq0113@163.com&gt;
diff --git a/tests/e2e/multicard/test_qwen3_moe.py b/tests/e2e/multicard/test_qwen3_moe.py
@@ -55,6 +55,7 @@ def test_models_distributed_Qwen3_MOE_TP2_WITH_EP():
             tensor_parallel_size=2,
             enable_expert_parallel=True,
             distributed_executor_backend="mp",
+            enforce_eager=False,
     ) as vllm_model:
         vllm_model.generate_greedy(example_prompts, max_tokens)
 
@@ -71,7 +72,7 @@ def test_models_distributed_Qwen3_MOE_W8A8():
             dtype=dtype,
             tensor_parallel_size=2,
             quantization="ascend",
-            enforce_eager=False,
+            enforce_eager=True,
     ) as vllm_model:
         vllm_model.generate_greedy(example_prompts, max_tokens)
 
diff --git a/vllm_ascend/ops/common_fused_moe.py b/vllm_ascend/ops/common_fused_moe.py
@@ -241,7 +241,8 @@ def forward_impl(self, hidden_states: torch.Tensor,
 
         forward_context = get_forward_context()
         moe_comm_method_name = forward_context.moe_comm_method_name
-        if not self.moe_config.use_ep and moe_comm_method_name != "dummycommimpl":
+        # TODO: Adjusted logic to differentiate between A2 and A3, we check ep_size here since mc2 only support ep_size >= 16 on A3 now
+        if self.moe_config.ep_size < 16 and moe_comm_method_name != "dummycommimpl":
             moe_comm_method_name = "allgathercommimpl"
         forward_context.moe_comm_method = getattr(self, moe_comm_method_name)