PaddleNLP 快乐开源活动 (2025 H1) 🎉 #9763

DrownFish19 · 2025-01-09T12:14:00Z

问题描述

📣PaddleNLP 快乐开源活动

旨在鼓励更多的开发者参与到飞桨大模型套件的开源建设中，帮助社区修复 bug 或贡献 feature，共建飞桨。

🔥热身任务

跑通 Qwen2 的训练流程，通过完成本任务，可以收获如何进行大语言模型预训练和微调，也可以快速上手PaddleNLP。

【PaddleNLP 3.0】大模型训练精调对齐一站式开发 - 飞桨AI Studio星河社区

🌈命题任务

命题任务是我们总结整理大模型套件的需求得出，每个任务上标注了任务难度，大家可以选择参与。欢迎对这些需求感兴趣的开发者参与到这些任务的开发✌️✌️。在开发过程中，你能进行包括任务分解、代码撰写等工作，还会有飞桨的研发全程和你一起解决可能遇到的问题。还等什么，快来参与吧。🎉🎉

认领方式

请大家以 comment 的形式认领任务，如：
【报名】：1、3、12-13

多个任务之间需要使用中文顿号分隔，报名多个连续任务可用横线表示，如 2-5
PR 提交格式：在 PR 的标题中以【PaddleNLP No.xxx】开头，注明任务编号

任务列表

mentor：@DrownFish19 @ZHUI

大语言模型训练

序号	任务名称	任务类型	任务描述	难度	优先级
1	预训练文档	文档	扩充预训练文档，补充完善实例教程至星河社区	🌟	P1
2	精调文档	文档	扩充精调训练文档，补充完善实例教程至星河社区	🌟	P0
3	对齐文档	文档	扩充对齐训练文档，补充完善实例教程至星河社区	🌟	P0
4	量化文档	文档	扩充量化文档，补充完善实例教程至星河社区	🌟	P1

小模型Paddle 高扩展中间表示PIR适配

飞桨框架3.0 Beta 版本延续了2.x版本动静统一、训推一体的设计理念，其开发接口全面兼容2.x版本。这意味着，使用2.x版本开发的代码，在绝大多数情况下无需修改，即可直接在3.x版本上运行。其中高扩展中间表示PIR（Paddle Intermediate Representation）作为升级功能点之一，支撑着动转静、自动微分、自动并行、组合算子、图优化等多项技术，并广泛应用于分布式训练、模型压缩、推理部署等场景。通过PIR提供的DRR（Declarative Rewrite Rule）机制，Pass的开发成本可以降低60%。我们对超过900个模型配置进行了测试，结果显示，在使用PIR后，推理的整体性能提升了超过10%。但是当前小模型适配PIR的并没有全部验证修改，亟需开发者参与适配。

任务要求：修复特定模型或特定任务，完成PIR模型动转静验证，并在CI运行脚本（scripts/regression/ci_case.sh）增加对应的测试用例。
修改示范：

from paddlenlp.utils.env import PADDLE_INFERENCE_MODEL_SUFFIX, PADDLE_INFERENCE_WEIGHTS_SUFFIX

# static_model_name = "xxx.pdmodel"
static_model_name = f"xxx{PADDLE_INFERENCE_MODEL_SUFFIX}"
# static_model_path = "xxx.pdiparams"
static_model_path = f"xxx{PADDLE_INFERENCE_WEIGHTS_SUFFIX}"

NO	任务名称	任务类型	任务描述	难度	优先级
5	slm/applications/neural_search	代码和文档	PIR适配	🌟	P2
6	slm/applications/text_classification	代码和文档	PIR适配	🌟	P2
7	slm/examples/information_extraction	代码和文档	PIR适配	🌟	P2
8	slm/examples/lexical_analysis	代码和文档	PIR适配	🌟	P2
9	slm/examples/machine_reading_comprehension	代码和文档	PIR适配	🌟	P2
10	slm/examples/machine_translation	代码和文档	PIR适配	🌟	P2
11	slm/examples/model_compression/pp-minilm	代码和文档	PIR适配	🌟	P2
12	slm/examples/question_generation/unimo-text	代码和文档	PIR适配	🌟	P2
13	slm/examples/sentiment_analysis	代码和文档	PIR适配	🌟	P2
14	slm/examples/text_correction/ernie-csc	代码和文档	PIR适配	🌟	P2
15	slm/examples/text_matching/ernie_matching	代码和文档	PIR适配	🌟	P2
16	slm/examples/text_summarization/unimo-text	代码和文档	PIR适配	🌟	P2
17	slm/examples/text_to_knowledge/nptag	代码和文档	PIR适配	🌟	P2
18	slm/model_zoo/bert	代码和文档	PIR适配	🌟	P2
19	slm/model_zoo/ernie-1.0	代码和文档	PIR适配	🌟	P2
20	slm/model_zoo/ernie-3.0	代码和文档	PIR适配	🌟	P2
21	slm/model_zoo/ernie-3.0-tiny	代码和文档	PIR适配	🌟	P2
22	slm/model_zoo/ernie-layout	代码和文档	PIR适配	🌟	P2
23	slm/model_zoo/ernie-vil2.0	代码和文档	PIR适配	🌟	P2
24	slm/model_zoo/gpt-3/ppfleetx/core/engine	代码和文档	PIR适配	🌟	P2
25	slm/model_zoo/uie	代码和文档	PIR适配	🌟	P2
26	slm/pipelines/pipelines/nodes/document	代码和文档	PIR适配	🌟	P2
27	llm/server/server/server/engine/infer.py	代码和文档	PIR适配	🌟	P2
28	tests/experimental/autonlp	代码和文档	PIR适配	🌟	P2
29	tests/test_tipc/bert_base_text_cls	代码和文档	PIR适配	🌟	P2
30	tests/test_tipc/bigru_crf	代码和文档	PIR适配	🌟	P2
31	tests/test_tipc/ernie_information_extraction	代码和文档	PIR适配	🌟	P2
32	tests/test_tipc/ernie_text_cls	代码和文档	PIR适配	🌟	P2
33	tests/test_tipc/ernie_text_matching	代码和文档	PIR适配	🌟	P2
34	tests/transformers/chatglm	代码和文档	PIR适配	🌟	P2
35	tests/transformers/test_generation_utils.py	代码和文档	PIR适配	🌟	P2

看板信息

任务方向	任务数量	提交作品 / 任务认领	提交率	完成	完成率
飞桨大语言模型快乐开源活动	35	0 / 0	0.0%	0	0.0%

统计信息

排名不分先后

DrownFish19 added the others unknown issue type label Jan 9, 2025

paddle-bot bot assigned DesmonDay Jan 9, 2025

DrownFish19 pinned this issue Jan 10, 2025

luotao1 assigned luotao1 and DrownFish19 and unassigned DesmonDay Feb 8, 2025

luotao1 added this to Call for Contributions Feb 8, 2025

luotao1 moved this to In Progress in Call for Contributions Feb 20, 2025

luotao1 changed the title ~~PaddleNLP 快乐开源活动 (2025 Q1) （预览版）🎉~~ PaddleNLP 快乐开源活动 (2025 H1) 🎉 Feb 27, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

PaddleNLP 快乐开源活动 (2025 H1) 🎉 #9763

PaddleNLP 快乐开源活动 (2025 H1) 🎉 #9763

DrownFish19 commented Jan 9, 2025 •

edited by luotao1

Loading

PaddleNLP 快乐开源活动 (2025 H1) 🎉 #9763

PaddleNLP 快乐开源活动 (2025 H1) 🎉 #9763

Comments

DrownFish19 commented Jan 9, 2025 • edited by luotao1 Loading

问题描述

📣PaddleNLP 快乐开源活动

🔥热身任务

🌈命题任务

认领方式

任务列表

大语言模型训练

小模型Paddle 高扩展中间表示PIR适配

看板信息

统计信息

DrownFish19 commented Jan 9, 2025 •

edited by luotao1

Loading