Add a test for boolean attention mask within SDPA (#2480)

titaiwangms · web-flow · commit e2fe5e7c6d70 · 2025-08-07T20:21:31.000-07:00
Follow up #2479
diff --git a/tests/function_libs/torch_lib/e2e_ops_tests.py b/tests/function_libs/torch_lib/e2e_ops_tests.py
@@ -76,6 +76,28 @@ def forward(self, x: torch.Tensor) -> torch.Tensor:
         )
         _testing.assert_onnx_program(onnx_program)
 
+    def test_sdpa_with_bool_attn_mask(self):
+        class ScaledDotProductAttention(torch.nn.Module):
+            def forward(self, query, key, value, attn_mask):
+                return torch.nn.functional.scaled_dot_product_attention(  # pylint: disable=not-callable
+                    query, key, value, attn_mask=attn_mask
+                )
+
+        model = ScaledDotProductAttention()
+        attn_mask = torch.ones(2, 4, 8, 8).bool()  # boolean mask for attention
+        attn_mask[0, 0, 0, :] = False  # masking an entire row (padding token)
+        query = key = value = torch.randn(2, 4, 8, 16)
+
+        onnx_program = torch.onnx.export(
+            model,
+            (query, key, value, attn_mask),
+            input_names=["query", "key", "value", "attn_mask"],
+            output_names=["output"],
+            opset_version=18,
+            dynamo=True,
+        )
+        _testing.assert_onnx_program(onnx_program)
+
 
 if __name__ == "__main__":
     unittest.main()