从零手搓中文大模型计划

项目简介

心血来潮想要走一遍大模型训练的流程，于是有了这个项目。

由于我自己只有一张3090，也不好用单位的显卡，所以训练只能选很小的模型。

其实我自己对SLM是很感兴趣的，感觉现在也有越来越多地研究开始关注小尺寸大模型的性能以及如何把大模型做小。

如果是希望学习大规模并行训练相关的内容（例如DeepSpeed，Megatron），这个项目可能不太适合你。

另外个人经历和精力有限，所以可能很多地方做的不是很好，请大家多多包涵。也欢迎大家提出意见和建议。

最后给自己的自媒体号打个广告，欢迎大家关注一波~（公众号/B站/小红书/抖音：喵懂AI）

计划执行

在一个垂直领域的小数据集上完成：

一个小尺寸模型的预训练（能在单卡上跑）
在上面的基础上完成指令微调
在上面的基础上完成DPO
其他待定

Journey文件夹下有每次任务的详细记录。下载相应的文件（chatglm的tokenizer，TinyStoriesChinese的数据集）之后，可以跟着Journey中的步骤一步步来。理论上可以复现已经放出的结果（GPU如果比我还小的，需要自己调整下batch_size）。

训练信息

机器配置：

OS: Ubuntu 22.04.3 LTS x86_64
Kernel: 6.5.0-35-generic
Uptime: 60 days, 4 hours, 55 mins
Packages: 2719 (dpkg), 17 (snap)
Shell: fish 3.6.1
Terminal: WezTerm
CPU: AMD Ryzen 9 5950X (32) @ 3.400G
GPU: NVIDIA 09:00.0 NVIDIA Corporati
Memory: 9347MiB / 64195MiB

预训练

详细参数请参考 pretrain.yaml。

指令微调

详细参数请参考 sft.yaml。

DPO

训练脚本参考dpo_train.py

目录结构

Chinese_LLM_From_Scratch
├── Data
│   └── TinyStoriesChinese
│       ├── processed_data
│       └── raw_data
├── Experiments
│   ├── configs
│   │   ├── debug.yaml
│   │   ├── microstories.yaml
│   │   └── ...
│   └── Output
│       └── pretrain
│           ├── debug
│           └── microstories
├── References
│   ├── chatglm3-6b
│   └── ...
├── Journey
│   ├── Day01
│   ├── Day02
│   ├── Day03
│   ├── Day04
│   └── ...

Name	Name	Last commit message	Last commit date
Latest commit wuzijun add day final Sep 29, 2024 52c817b · Sep 29, 2024 History 25 Commits
Data	Data	update	Aug 16, 2024
Experiments/configs/microstories	Experiments/configs/microstories	udpate day 12	Sep 23, 2024
Journey	Journey	add day final	Sep 29, 2024
References	References	update	Aug 16, 2024
.gitignore	.gitignore	update	Sep 5, 2024
.gitmodules	.gitmodules	first commit	Aug 13, 2024
README.md	README.md	update picture	Sep 25, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

从零手搓中文大模型计划

项目简介

最近更新

计划执行

训练信息

预训练

指令微调

DPO

目录结构

About

Releases

Packages

Languages

puppyapple/Chinese_LLM_From_Scratch

Folders and files

Latest commit

History

Repository files navigation

从零手搓中文大模型计划

项目简介

最近更新

计划执行

训练信息

预训练

指令微调

DPO

目录结构

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages