Build LLM from Scratch

Creation Time: 2025-04-25 19:37


tech notes

Build LLM from Scratch

这部分内容旨在借助开源项目MiniMind,从理论和代码入手,分析大模型的预训练和后训练的步骤,解释各核心部分的工作原理。

所写内容不一定正确,如有错误还望指正。


Table of contents