Refactor softmax_cudnn kernel impl for code reuse. #35350

limin2021 · 2021-09-01T06:47:23Z

PR types

Performance optimization

PR changes

OPs

Describe

Refactor softmax_cudnn kernel impl for code reuse.
(1) move the cuda kernel impl in softmax_cudnn_op.cu to softmax_cudnn_op.cu.h for code reuse in future fused attention op.

Unittest results of softmax op:

paddle-bot-old · 2021-09-01T06:47:37Z

Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

xingfeng01 · 2021-09-02T02:57:07Z

LGTM. CI 恢复后 rerun 一下.

zhangting2020 · 2021-09-03T06:28:16Z

paddle/fluid/operators/softmax_cudnn_op.cu

-
-    constexpr int max_dim = 320;
-    constexpr int warps_per_block = 4;
+    // auto* dx_data = dx->data<T>();


这行注释删掉

zhangting2020

LGTM

Xreki

LGTM

Refactor softmax_cudnn kernel impl for code reuse.

f48ac05

Modify parameters of softmax api for ease of use.

8de8c70

zhangting2020 reviewed Sep 3, 2021

View reviewed changes

Remove useless comments.

ae92847

zhangting2020 previously approved these changes Sep 3, 2021

View reviewed changes

Integrate softmax_impl.cu.h into softmax_cunn.cu.h

46b48eb

limin2021 dismissed zhangting2020’s stale review via 46b48eb September 7, 2021 11:20

Xreki approved these changes Sep 8, 2021

View reviewed changes

Xreki merged commit ef61da8 into PaddlePaddle:develop Sep 8, 2021

limin2021 mentioned this pull request Sep 14, 2021

Add fused_attention_op #35727

Closed

This was referenced Sep 23, 2021

Fused attention op forward #35905

Merged

Fused attention op backward #35935

Closed

AnnaTrainingG pushed a commit to AnnaTrainingG/Paddle that referenced this pull request Sep 29, 2021

Refactor softmax_cudnn kernel impl for code reuse. (PaddlePaddle#35350)

b07547b

This was referenced Oct 18, 2021

Add fused attention op backward and python layer. #36498

Merged

[cherry-pick] Cherry pick fused attn fw #36636

Closed

[cherry-pick] Cherry pick fused attn fw #36677

Closed

This was referenced Oct 25, 2021

[cherry-pick-2.2] Fused attention op forward #36708

Merged

[cherry-pick-2.2]Add fused attention op backward and python layer. #36752

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Refactor softmax_cudnn kernel impl for code reuse. #35350

Refactor softmax_cudnn kernel impl for code reuse. #35350

limin2021 commented Sep 1, 2021

paddle-bot-old bot commented Sep 1, 2021

xingfeng01 commented Sep 2, 2021

zhangting2020 Sep 3, 2021

limin2021 Sep 3, 2021

zhangting2020 left a comment

Xreki left a comment

Refactor softmax_cudnn kernel impl for code reuse. #35350

Refactor softmax_cudnn kernel impl for code reuse. #35350

Conversation

limin2021 commented Sep 1, 2021

PR types

PR changes

Describe

paddle-bot-old bot commented Sep 1, 2021

xingfeng01 commented Sep 2, 2021

zhangting2020 Sep 3, 2021

Choose a reason for hiding this comment

limin2021 Sep 3, 2021

Choose a reason for hiding this comment

zhangting2020 left a comment

Choose a reason for hiding this comment

Xreki left a comment

Choose a reason for hiding this comment