Optimizing GPT performance in inference #906

carryyu · 2022-11-09T14:24:38Z

Optimizing GPT performance in inference

Remaining problem:

Attention_mask's shape
Unfinished_flag in the while op when eos_token_id is None, which will cause synchronize.

ppfleetx/configs/nlp/gpt/auto/generation_gpt_345M_mp1.yaml

carryyu · 2022-11-10T06:16:54Z

谢谢，已收到！

ppfleetx/models/language_model/gpt/dygraph/single_model.py

GuoxiaWang

LGTM

ppfleetx/models/language_model/gpt/auto/auto_model.py

…ors.

MARD1NO reviewed Nov 10, 2022

View reviewed changes

ppfleetx/configs/nlp/gpt/auto/generation_gpt_345M_mp1.yaml Outdated Show resolved Hide resolved

qingqing01 requested review from GuoxiaWang, zhaoyinglia, ForFishes and qingqing01 November 10, 2022 06:54

optimize GPT performance in inference.

4b06fbf

carryyu force-pushed the develop branch from 90b5d3e to 4b06fbf Compare November 10, 2022 09:29

carryyu added 3 commits November 10, 2022 09:32

Merge remote-tracking branch 'upstream/develop' into develop

5a8005f

fix topp_sampling.

dcb35af

optimize GPT.

3b8a709

ZHUI reviewed Nov 11, 2022

View reviewed changes

ppfleetx/models/language_model/gpt/dygraph/single_model.py Show resolved Hide resolved

ZHUI reviewed Nov 11, 2022

View reviewed changes

ppfleetx/models/language_model/gpt/dygraph/single_model.py Outdated Show resolved Hide resolved

ZHUI reviewed Nov 11, 2022

View reviewed changes

ppfleetx/models/language_model/gpt/dygraph/single_model.py Outdated Show resolved Hide resolved

carryyu added 2 commits November 11, 2022 03:56

optimize GPT.

756eb33

optimize GPT.

f6075f8

heavengate approved these changes Nov 17, 2022

View reviewed changes

carryyu added 3 commits November 17, 2022 10:13

add comment

27bd2fe

add comment

38e4ea1

add comment

89851fb

GuoxiaWang approved these changes Nov 18, 2022

View reviewed changes

ppfleetx/models/language_model/gpt/auto/auto_model.py Outdated Show resolved Hide resolved

carryyu and others added 7 commits November 18, 2022 18:09

Merge branch 'PaddlePaddle:develop' into develop

4887c9b

Merge branch 'PaddlePaddle:develop' into develop

89d399e

Modify ppfleetx.ops to ppfleetx_ops, because the former may cause err…

7d9878f

…ors.

Merge branch 'PaddlePaddle:develop' into develop

e25a906

Merge branch 'develop' into develop

dfb4bbd

Merge branch 'PaddlePaddle:develop' into develop

aa1f723

Merge branch 'PaddlePaddle:develop' into develop

5a08530

Liujie0926 merged commit ca87d1d into PaddlePaddle:develop Nov 24, 2022

carryyu mentioned this pull request Nov 28, 2022

[cherry-pick] optimize GPT performance in inference. #946

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Optimizing GPT performance in inference #906

Optimizing GPT performance in inference #906

carryyu commented Nov 9, 2022

carryyu commented Nov 10, 2022 via email

GuoxiaWang left a comment

Optimizing GPT performance in inference #906

Optimizing GPT performance in inference #906

Conversation

carryyu commented Nov 9, 2022

carryyu commented Nov 10, 2022 via email

GuoxiaWang left a comment

Choose a reason for hiding this comment