Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
dpo_argument.json		dpo_argument.json
dpo_lora_argument.json		dpo_lora_argument.json
lora_argument.json		lora_argument.json
pretrain_argument.json		pretrain_argument.json
sft_argument.json		sft_argument.json

README.md

源2.0

1. 模型介绍

源2.0是浪潮信息发布的新一代基础语言大模型。源2.0是在源1.0的基础上，利用更多样的高质量预训练数据和指令微调数据集，令模型在语义、数学、推理、代码、知识等不同方面具备更强的理解能力。

目前源2.0对 PaddlePaddle 的适配仅支持数据并行和张量并行，后续功能正在开发中。

支持模型权重:

Model
IEITYuan/Yuan2-2B
IEITYuan/Yuan2-51B
IEITYuan/Yuan2-102B

2. 推理介绍

· 2B

推理脚本如下 :

from paddlenlp.transformers import  AutoModelForCausalLM, AutoTokenizer
model_path = "IEITYuan/Yuan2-2B"
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForCausalLM.from_pretrained(model_path,  dtype="bfloat16")
model.eval()
input_features = tokenizer("青岛推荐去哪玩？", return_tensors="pd")
print("问题：", tokenizer.batch_decode(input_features["input_ids"]))
outputs = model.generate(**input_features, do_sample=False, max_length=1024)
print("回答：", tokenizer.batch_decode(outputs[0]))
# <sep>青岛是中国著名的旅游城市，有许多著名的景点和活动。以下是一些值得推荐的地方：\n1. 栈桥：栈桥是青岛的象征之一，是八大关风景区的一部分。在这里可以欣赏到美丽的海岸线和壮观的城市风光。\n2. 青岛啤酒博物馆：这座博物馆位于崂山山顶上，可以欣赏到美丽的海景和壮观的城市景象。\n3. 八大关风景区：这里有许多知名的景点，如栈桥、音乐广场、青岛啤酒博物馆等。\n4. 青岛奥帆中心：这个帆船比赛已经在青岛成功举办了两届，是青岛市民的一项重要活动。\n5. 青岛老街：这里有丰富的历史和独特的建筑风格，还有许多小摊贩可以帮助游客找到纪念品。\n6. 海底世界：崂山是中国最大的海底岩洞，这里可以看到美丽的珊瑚和各种鱼类。\n7. 崂山风景名胜区：这个区域被联合国教科文组织列为世界遗产地，有丰富的自然和文化资源。\n无论您选择哪个地方，都可以欣赏到美丽的景色和体验到丰富的文化活动。希望您有机会去青岛旅游！<eod>

· 51B

推理脚本如下 :

export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
python -m paddle.distributed.launch \
    --devices "0,1,2,3,4,5,6,7" \
    test_tp.py

test_tp.py :

from paddle.distributed import fleet
from paddlenlp.transformers import AutoTokenizer, AutoModelForCausalLM
strategy = fleet.DistributedStrategy()
strategy.hybrid_configs = {
                "dp_degree": 1,
                "mp_degree": 8,
                "pp_degree": 1,
                "sharding_degree": 1,
            }
fleet.init(is_collective=True, strategy=strategy)
hcg = fleet.get_hybrid_communicate_group()
tensor_parallel_rank = hcg.get_model_parallel_rank()
model_path = "IEITYuan/Yuan2-51B"
tokenizer = AutoTokenizer.from_pretrained(model_path, add_eos_token=False, add_bos_token=False, eos_token='<eod>')
tokenizer.add_tokens(['<sep>', '<pad>', '<mask>', '<predict>', '<FIM_SUFFIX>', '<FIM_PREFIX>', '<FIM_MIDDLE>','<commit_before>','<commit_msg>','<commit_after>','<jupyter_start>','<jupyter_text>','<jupyter_code>','<jupyter_output>','<empty_output>'], special_tokens=True)
model = AutoModelForCausalLM.from_pretrained(model_path, tensor_parallel_degree= 8, tensor_parallel_rank=tensor_parallel_rank, dtype="bfloat16")
model.eval()
input_features = tokenizer("厦门推荐去哪玩？", return_tensors="pd")
print("问题：", tokenizer.batch_decode(input_features["input_ids"]))
outputs = model.generate(**input_features, do_sample=False, max_length=1024)
print("回答：", tokenizer.batch_decode(outputs[0]))

· 102B

与51B 模型的推理脚本一致

3. 预训练介绍

请参考LLM 全流程工具介绍

4. 微调介绍

请参考LLM 全流程工具介绍

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

yuan

yuan

README.md

源2.0

1. 模型介绍

2. 推理介绍

· 2B

· 51B

· 102B

3. 预训练介绍

4. 微调介绍

Files

yuan

Directory actions

More options

Directory actions

More options

Latest commit

History

yuan

Folders and files

parent directory

README.md

源2.0

1. 模型介绍

2. 推理介绍

· 2B

· 51B

· 102B

3. 预训练介绍

4. 微调介绍