1. Transformer 的意义? 2. Transformer 的直观理解和代码实现? 3. 什么是 Decoder-only? 4. Lab 如何学习上手最快,结合什么视频?数形结合 5. [CS336](CS336.md)是干嘛的?其中的[A1 Basics](A1%20Basics.md)在干嘛?[CS@]([email protected])与应用的最佳实践? ___ 1. LLM 中 [[Transformer]] 的地位 2. 历史故事,[[《英伟达之芯》]],数据+GPU+模型[AlexNet](AlexNet.md) 3. 机制介绍,从抽象概念到代码实现 1. 复习[MLP](MLP.md)、[PyTorch](PyTorch.md) 2. [注意力机制](注意力机制.md)、[Positional Encoding 位置编码](Positional%20Encoding%20位置编码.md)的形象理解 3. [[CS336]]、[A1 Basics](A1%20Basics.md) 中的 1. `tests.test_model.test_transformer_block` 2. `cs336_basics.transformer.TransformerBlock.forward` 4. [Transformer](Transformer.md)的真正历史 5. 学习方法 1. claude code 跑代码 2. [[cursor]] 提问 3. [[Obsidian]] 做笔记 6. [CS@]([email protected]) 0-1-10-100的思路分享