Sebastian Raschka(前 Lightning AI 首席科学家)撰写的 Manning 出版社官方书籍,配套 GitHub 开源代码仓库 (rasbt/LLMs-from-scratch)。从零开始,用 PyTorch 一步步
Brendan Bycroft 开发的交互式 3D 网页应用,以逐层动画的方式展示 GPT 类大语言模型的完整 Transformer 推理流程。从输入 token 的嵌入向量开始,逐步展示注意力机制(包括 Query/Key/Value
Andrej Karpathy(前 OpenAI 研究员、特斯拉 AI 总监)出品的系列视频教程,从零开始构建神经网络。从微积分和反向传播的数学原理讲起,逐步实现 micrograd(自动微分引擎)、makemore(字符级语言模型),再到
斯坦福大学王牌 NLP 课程,从词向量到 Transformer、BERT、GPT,涵盖 NLP 最前沿技术。视频和资料免费开放。