reduce transpose operations to speedup #589

hjchen2 · 2024-01-30T06:22:30Z

No description provided.

hjchen2 · 2024-01-30T06:38:33Z

src/infer_compiler_registry/register_diffusers/spatio_temporal_oflow.py

@@ -450,7 +450,9 @@ def forward(
        # hidden_states = hidden_states.reshape(batch_frames, height, width, inner_dim).permute(0, 3, 1, 2).contiguous()
        # Rewrite for onediff SVD dynamic shape
        hidden_states = (
-            hidden_states.permute(0, 2, 1).reshape_as(hidden_states_in).contiguous()
+            hidden_states.reshape_as(residual.permute(0, 2, 3, 1))
+            .permute(0, 3, 1, 2)


reshape后面的permute得保留，避免破坏NCHW->NHWC转换后permute消除的优化。

hjchen2 · 2024-01-30T06:39:55Z

src/infer_compiler_registry/register_diffusers/spatio_temporal_oflow.py

@@ -382,9 +382,9 @@ def forward(
        #     height * width, batch_size, 1, time_context.shape[-1]
        # )
        # Rewrite for onediff SVD dynamic shape
-        broadcast_tensor = hidden_states.flatten(2, 3).permute(2, 0, 1)
+        broadcast_tensor = hidden_states.flatten(2, 3)


这里减少一个permute，尽管还是多了一次flatten，但flatten支持view，不会产生实际的kernel计算开销

reduce transpose operations to speedup

ce3c111

hjchen2 requested a review from lixiang007666 January 30, 2024 06:26

Merge branch 'main' into dev_speedup_svd_dynamic_shape

2126178

hjchen2 commented Jan 30, 2024

View reviewed changes

refine

8586b6b

lixiang007666 approved these changes Feb 1, 2024

View reviewed changes

Merge branch 'main' into dev_speedup_svd_dynamic_shape

22d45a3

hjchen2 merged commit 814053b into main Feb 3, 2024
4 of 5 checks passed

hjchen2 deleted the dev_speedup_svd_dynamic_shape branch February 3, 2024 17:00

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

reduce transpose operations to speedup #589

reduce transpose operations to speedup #589

hjchen2 commented Jan 30, 2024

hjchen2 Jan 30, 2024

hjchen2 Jan 30, 2024

reduce transpose operations to speedup #589

reduce transpose operations to speedup #589

Conversation

hjchen2 commented Jan 30, 2024

hjchen2 Jan 30, 2024

Choose a reason for hiding this comment

hjchen2 Jan 30, 2024

Choose a reason for hiding this comment