ai-lab

深度学习研习，包括训练，部署等

llm 训练

Megatron

NVIDIA Megatron 是一个基于PyTorch 的框架，用于训练基于Transformer 架构的巨型语言模型 Megatron设计就是为了支持超大的Transformer模型的训练的，因此它不仅支持传统分布式训练的数据并行，也支持模型并行，包括Tensor并行和Pipeline并行两种模型并行方式。

ZeRO 优化技术

部署

llm微调

Understanding Parameter-Efficient Finetuning of Large Language Models: From Prefix Tuning to LLaMA-Adapters
论文《 LoRA: Low-Rank Adaptation of Large Language Models》
huggingface/peft, https://github.com/huggingface/peft

Parameter-Efficient Fine-Tuning (PEFT) methods enable efficient adaptation of pre-trained language models (PLMs) to various downstream applications without fine-tuning all the model's parameters.

Supported methods:
- 1, LoRA
- 2, Prefix Tuning
- 3, P-Tuning
- 4, Prompt Tuning
- 5, AdaLoRA
下面的评测方式推荐：

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
basics		basics
deploy		deploy
llm		llm
pic		pic
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ai-lab

llm 训练

Megatron

ZeRO 优化技术

部署

llm微调

About

Releases

Packages

Languages

sunnysky29/ai-labs

Folders and files

Latest commit

History

Repository files navigation

ai-lab

llm 训练

Megatron

ZeRO 优化技术

部署

llm微调

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages