Andrej Karpathy - 𓀚 转了码的刘公子

# 🧩 Summary 1. 斯坦福博士，研究方向为视觉与深度学习，导师是[[李飞飞]]。 2. 曾任[[特斯拉]]自动驾驶负责人，主导 Autopilot 和 Dojo 训练系统。 |分类|关键词|说明| |---|---|---| |🎓 学术背景|Stanford PhD, Fei-Fei Li 门下, Computer Vision|斯坦福博士，研究方向为视觉与深度学习，导师是李飞飞。| |🧩 技术标签|Deep Learning, Neural Networks, Computer Vision, Language Models, Transformers|贯穿视觉到语言的端到端神经网络研究者。| |🧠 开源项目|minGPT, micrograd, makemore, karpathy/nanoGPT|一系列“从零实现”教学型项目，展示 GPT、反向传播、生成模型等核心机制。| |🚗 实践领域|Tesla AI Director, Autopilot, Dojo Supercomputer|曾任特斯拉自动驾驶负责人，主导 Autopilot 和 Dojo 训练系统。| |🧱 思想关键词|End-to-End Learning, Backpropagation is All You Need, Software 2.0|提出“软件 2.0”理念：未来程序由神经网络权重而非手写规则组成。| |💬 教学传播|CS231n, Stanford Lecture Style, YouTube Talks|主讲斯坦福经典课程 CS231n《深度学习与计算机视觉》，风格通俗、体系化。| |🧑‍💻 职业履历|OpenAI Early Member, Tesla → OpenAI → 独立开发者|在 OpenAI 早期参与 GPT 与强化学习研究；后转向教学与开源。| |🔬 近期关注|LLMs 简化实现, AI 教育, 小模型自研|专注于让 AI 学习变得“人人可懂、可跑、可改”。| # 💡 Cues # Notes 观点： 1. 我认为 10 年实现 AGI 已经是一个非常激进的时间表了，只是在当今的炒作氛围下，大家才不这么觉得。 2. 我对 AI 时间线的看法，比你在旧金山 AI 派对上或推上听到的普遍预测要悲观 5 到 10 倍，但比起那些日益增长的 AI 否定者和怀疑论者，我又要乐观得多。这其中的矛盾其实并不存在 3. 【我挺确定 RL 会继续带来不少阶段性的成果，但我也并不觉得，这就是故事的全部了。RL 的基本逻辑其实就是：嘿，这事儿干得不错（/很糟），那我就给未来所有导致这个结果的动作，都稍微增加（/减少）一点概率。 4. 最后一点思考——从我个人和长远的角度来看，我非常看好环境和智能体互动，但我_尤其_不看好强化学习本身。我觉得奖励函数这个东西超级不靠谱。而且，我认为人类自己也不是靠强化学习来学习的（也许学一些运动技能时会用上，但在解决需要智力的问题时肯定不是）。 5. Claude 的系统提示词现在似乎有大约 17000 个词，它不仅规定了基本的行为风格/偏好（例如，拒绝各种与歌词相关的请求），还规定了大量的通用问题解决策略 6. 孩子们应该在早期教育中学习物理，不是因为他们以后都要搞物理，而是因为这门学科最能启动一个人的大脑。物理学家是智力上的胚胎干细胞 7. AI 辅助编程的思路，这里的重点是，你必须牢牢牵住缰绳。你要把 AI 想象成一个新来的实习生：他过度热情，是个少年天才，脑子里装着百科全书一样的软件知识……但他同时也整天对你一本正经地胡说八道，胆子大得没边，而且对什么是好代码几乎毫无品味。：慢下来、保持防御姿态、小心、甚至要有点偏执。并且，永远要抓住机会在过程中顺便学习，而不是把工作完全委托给它。 1. 把所有相关的上下文（context）都喂给 AI。（在大型项目里，这可能很花时间。如果项目够小，那就干脆把所有东西都扔进去，比如用 `files-to-prompt. -e ts -e tsx -e css -e md --cxml --ignore node_modules -o prompt.xml` 这样的命令。） 2. 向 AI 描述我们想实现的下一个、单一的、具体的小步改动。关键是：先别急着要代码。先让它给出几种高层级的实现思路，分析一下各自的优缺点。毕竟，做一件事总有好几种方法，而大语言模型（LLM）的判断力并不总是那么靠谱。也可以选择性地让它把思路具体化。 3. 选定一种方法，然后让它生成第一版代码草稿。 4. 审查与学习阶段：（必须手动...）在旁边打开浏览器，查阅所有我以前没调用过、或者不太熟悉的函数的 API 文档。同时，要求 AI 给出解释、澄清细节、进行修改。如果这条路走不通，就果断退回去，试试别的思路。 5. 测试。 6. 提交代码（Git commit）。问问它我们下一步可以实现什么？。然后，重复这个循环。