Brendan Bycroft 开发的交互式 3D 网页应用,以逐层动画的方式展示 GPT 类大语言模型的完整 Transformer 推理流程。从输入 token 的嵌入向量开始,逐步展示注意力机制(包括 Query/Key/Value
斯坦福大学王牌 NLP 课程,从词向量到 Transformer、BERT、GPT,涵盖 NLP 最前沿技术。视频和资料免费开放。
官方出品,系统学习 Transformers、Tokenizers、微调 LLM、RLHF,内容持续更新。
Hugging Face Transformers 是目前最广泛使用的开源预训练模型库,使用 Python 开发,提供数千个预训练的 NLP、视觉、多模态模型(