对新手更友好的中文nanoGPT教程
该仓库在持续更新中.
作为karpathy大神开源的目前已经获得三万多⭐的项目,nanoGPT是每个NLP爱好者入门必修项目。我必须承认karpathy在其Youtube视频课程中已经讲述的十分清楚,但是国内目前公开的视频网站或者博客,大多是将原版教学视频进行机翻,亦或者将直接对成型项目的代码进行逐行解读;鲜有对于下游任务的扩展以及整体项目的讲解。
我会对目前已有的资料进行整理,同时发布一个相对全面的教学视频
我对nanoGPT项目进行了精细的中文翻译,也许会对初学者有所帮助 中文版
这里会搜集一些小型的,适合于nanoGPT进行训练的中文数据集的仓库 其大多是常用的NLP训练语料,但我给出整理数据以适应nanoGPT的要求
目前已有:
- 讲解文档
Lecture1 : 教程初衷
Lecture2 : 基础GPT框架构造与初步效果 ,BiliBili [Youtube][https://www.youtube.com/watch?v=sBqyBSb7K6U]
Lecture3 : 均值自注意力的几种方式数学推导 ,[视频在制作中 ]
Lecture4 : 搭建自注意力的准备工作 ,[视频在制作中 ]
Lecture5 : Q,K,V的引入以及多头自注意力的实现 ,[视频在制作中 ]
Lecture6 : 对话能力实现 ,[视频在制作中 ]
Lecture+ : 对于编码解码方式的讨论
主要参考VatsaDev/nanoChatGPT: nanogpt turned into a chat model (github.com)
(30) Let's build GPT: from scratch, in code, spelled out. - YouTube
NanoGPT Tutorial - WHY42 (riguz.com)
Andrej Karpathy 的 nanoGPT lecture demo 详解 - 知乎 (zhihu.com)
Andrej Karpathy 的 nanoGPT lecture demo 详解 - 知乎 (zhihu.com)
VatsaDev/nanoChatGPT: nanogpt turned into a chat model (github.com)
暂无
如有问题,请在GitHub Issue中提交,在提交问题之前,请先查阅以往的issue是否能解决你的问题,目前项目还处于更新阶段,请耐心等待。