1. Transformer 的意义?
2. Transformer 的直观理解和代码实现?
3. 什么是 Decoder-only?
4. Lab 如何学习上手最快,结合什么视频?数形结合
5. [CS336](CS336.md)是干嘛的?其中的[A1 Basics](A1%20Basics.md)在干嘛?[CS@](
[email protected])与应用的最佳实践?
___
1. LLM 中 [[Transformer]] 的地位
2. 历史故事,[[《英伟达之芯》]],数据+GPU+模型[AlexNet](AlexNet.md)
3. 机制介绍,从抽象概念到代码实现
1. 复习[MLP](MLP.md)、[PyTorch](PyTorch.md)
2. [注意力机制](注意力机制.md)、[Positional Encoding 位置编码](Positional%20Encoding%20位置编码.md)的形象理解
3. [[CS336]]、[A1 Basics](A1%20Basics.md) 中的
1. `tests.test_model.test_transformer_block`
2. `cs336_basics.transformer.TransformerBlock.forward`
4. [Transformer](Transformer.md)的真正历史
5. 学习方法
1. claude code 跑代码
2. [[cursor]] 提问
3. [[Obsidian]] 做笔记
6. [CS@](
[email protected]) 0-1-10-100的思路分享