by @karminski-牙医
这是一个简单的技术科普教程项目, 主要聚焦于解释一些有趣的, 前沿的技术概念和原理. 每篇文章都力求在 5 分钟内阅读完成.
目前更新速度👆, 力求每周不低于3篇
- 什么是 GGUF - 介绍 GGUF 文件格式及其在大语言模型部署中的应用
- 什么是推测性解码 - 解释推测性解码技术如何提升大语言模型的推理性能
- 什么是 Pythonic 函数调用 - 为什么 Pythonic 函数调用 比 function call 效果好?
- 如何本地运行 GGUF 格式的 LLM 模型 - 如何本地运行 GGUF 格式的 LLM 模型?
- 什么是 LLM 蒸馏技术 - 什么是 LLM 蒸馏技术?
- 什么是 Transformer - 什么是 Transformer?
- 如何优化 Transformer - Transformer 的优化方案都有哪些?
- 什么是大语言模型量化 - 什么是大语言模型量化? 每个量化精度都代表什么?
- Windows 任务管理器内存标签说明 - 详解 Windows 任务管理器中各个内存指标的含义
- RAMMap 使用解析 - 详解 RAMMap 的使用方法
- 什么是 PCIe Retimer - 详解 PCIe Retimer 的原理和应用
- 为什么有的 NVMe SSD 有 DRAM, 有的没有? - 为什么有的 NVMe SSD 有 DRAM, 有的没有?
- CLX 会是大语言模型的内存解决方案吗? - 什么? PCIe 上能插内存了?
- 什么是 1DPC - 什么是 1DPC? 为什么内存条要插在远端插槽?
由于个人能力有限, 难免会有错误, 欢迎大家指正, 任何形式的贡献或者讨论都十分欢迎, 可以提交 issue 或者直接 PR.
本项目采用 MIT 许可证. 详见 LICENSE 文件.