Skip to content

sunnysky29/ai-labs

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ai-lab

深度学习研习,包括训练,部署等

llm 训练

Megatron

NVIDIA Megatron 是一个基于PyTorch 的框架,用于训练基于Transformer 架构的巨型语言模型 Megatron设计就是为了支持超大的Transformer模型的训练的,因此它不仅支持传统分布式训练的数据并行,也支持模型并行,包括Tensor并行和Pipeline并行两种模型并行方式。

ZeRO 优化技术

部署

llm微调

About

AI训练,部署等

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published