Brendan Bycroft 开发的交互式 3D 网页应用,以逐层动画的方式展示 GPT 类大语言模型的完整 Transformer 推理流程。从输入 token 的嵌入向量开始,逐步展示注意力机制(包括 Query/Key/Value