# 推文总结 2026-05-02 ## 总览 - 账号范围:18 个 - 活跃账号:11 个 - 总推文数:113 条 - 主要主题:中文 AI 圈 / AI 编码 / Agent / 模型与研究 ## 今日洞察 ### 1. Codex 正在从 CLI 工具变成持续运行的工作台 - 判断:这不是一次小功能发布,而是在把 Codex 往“可持续追目标的 agent 工作台”推进。 - 为什么重要:如果目标循环、长期上下文和应用内交互稳定下来,用户会开始把更多非一次性的任务交给 Codex,而不只是让它改一段代码。 - 建议动作:优先试跑 /goal 类长任务,并记录失败点:上下文丢失、权限、工具调用、重复执行和结果验收。 - 证据: - @lidangzzz: 千万别拿我和张雪峰这个大傻逼作对比。 网友:我想学AI相关的专业,我对AI很感兴趣,请问我应该选计算机还是数学? 我:你一定要选计算机,先把python和数据结构基础打好, 然后从deep learning这门课开始学,可以在家配置一个nvidia GPU的笔记本或者台式机,或… (赞 206 / 转 30 / 回 36 / 看 29148) [链接](https://x.com/lidangzzz/status/2050559251592953933) - @lidangzzz: 一大堆人试用了codex的/goal,让它持续工作了六七个小时,纷纷感慨goal是个伟大的设计, 谢谢你们对/goal的老祖宗——我的goal driven的认可。 (赞 210 / 转 11 / 回 25 / 看 53691) [链接](https://x.com/lidangzzz/status/2050436815274807706) ### 2. Agent 叙事从炫技转向公司级 workflow - 判断:当天的 agent 信息流不只在讲模型能力,而是在讲“如何用 agents 组装业务流程”。 - 为什么重要:这意味着下一阶段的差异点会落在流程编排、数据源、验收、权限和成本控制,而不是单点 prompt 技巧。 - 建议动作:把自己的自动化任务按“输入源、执行器、验收标准、失败恢复”四列盘点,找最适合 agent 化的重复流程。 - 证据: - @lidangzzz: 千万别拿我和张雪峰这个大傻逼作对比。 网友:我想学AI相关的专业,我对AI很感兴趣,请问我应该选计算机还是数学? 我:你一定要选计算机,先把python和数据结构基础打好, 然后从deep learning这门课开始学,可以在家配置一个nvidia GPU的笔记本或者台式机,或… (赞 206 / 转 30 / 回 36 / 看 29148) [链接](https://x.com/lidangzzz/status/2050559251592953933) - @lifesinger: agents 产品开始进入一种很诡异的阶段,大家都在寻找有钱人或有钱企业买单。 因为大量 agents 产品,真正好用的,依赖的模型都很贵。说得好听一点,各家可能都处于 PC 的早期。说得难听一点,大家都在造长期没啥用的奢侈品。 To C 产品里,豆包最牛。彻底贯彻移动互联网的… (赞 128 / 转 5 / 回 29 / 看 16988) [链接](https://x.com/lifesinger/status/2050405884862538055) - @lidangzzz: 我跟你的体验完全相反, 有了llm后,我在chatgpt、perplexity搜索的时候,有typo也懒得修改了,有格式错误也懒得修改了,标点符号也懒得加了,全都错着敲进去, 因为这些agent不仅可以智力代偿,而且他们agentically生成搜索关键词都是更准确的,导致我自… (赞 53 / 转 1 / 回 9 / 看 27734) [链接](https://x.com/lidangzzz/status/2050536590523457806) ### 3. 模型能力讨论开始回到可解释与硬基准 - 判断:模型圈的讨论一边追新基准,一边补可解释性工具,说明单纯刷榜已经不够。 - 为什么重要:对产品和工作流来说,能否解释、调节和验证模型行为,会直接影响能不能进入更高风险的生产场景。 - 建议动作:关注“可解释调参 + 任务级评测”的组合,不要只记录模型名和分数。 - 证据: - @gregisenberg: I actually think the whole "permanent underclass" narrative is wrong. I think we're about to see the largest EXPLOSION of entrepreneurship… (赞 236 / 转 19 / 回 92 / 看 16119) [链接](https://x.com/gregisenberg/status/2050582257971163530) - @lidangzzz: 千万别拿我和张雪峰这个大傻逼作对比。 网友:我想学AI相关的专业,我对AI很感兴趣,请问我应该选计算机还是数学? 我:你一定要选计算机,先把python和数据结构基础打好, 然后从deep learning这门课开始学,可以在家配置一个nvidia GPU的笔记本或者台式机,或… (赞 206 / 转 30 / 回 36 / 看 29148) [链接](https://x.com/lidangzzz/status/2050559251592953933) ### 4. 高互动内容明显偏向组织、城市和政治表达 - 判断:热门榜里非 AI 内容占了不少位置,说明关注列表不只是技术雷达,也在反映社会情绪和组织治理话题。 - 为什么重要:这些内容互动高,但和日常工作流的直接相关性较弱;适合当背景信号,不适合挤占技术跟进时间。 - 建议动作:阅读时把它们标成“背景/观点”,只保留能迁移到组织、产品或个人决策的部分。 - 证据: - @garrytan: How to drive the billionaires out and ruin the California tax base in one fell swoop: propose asset seizure measures Make it make sense! Mi… (赞 578 / 转 39 / 回 51 / 看 47208) [链接](https://x.com/garrytan/status/2050365216421241152) - @gregisenberg: I actually think the whole "permanent underclass" narrative is wrong. I think we're about to see the largest EXPLOSION of entrepreneurship… (赞 236 / 转 19 / 回 92 / 看 16119) [链接](https://x.com/gregisenberg/status/2050582257971163530) - @lidangzzz: 中国大部分一二线城市,在任何时候都能找到三四个楼盘,一堆人在排队抢房。 原因很简单,就是两个县城家庭的孩子,在一二线城市读大学、毕业工作、计划结婚定居了, 两家人一起规划,集中所有财力和现金,托举一个完美甜蜜的新家庭,一起凑出来500万~1000万现金,在当地最新的楼盘里买一套… (赞 164 / 转 12 / 回 32 / 看 57921) [链接](https://x.com/lidangzzz/status/2050402278117351872) ## 信号矩阵 | 信号 | 强度 | 代表账号 | 处理建议 | |---|---:|---|---| | Codex 正在从 CLI 工具变成持续运行的工作台 | 2 条 | @lidangzzz、@lidangzzz | 优先试跑 /goal 类长任务,并记录失败点:上下文丢失、权限、工具调用、重复执行和结果验收。 | | Agent 叙事从炫技转向公司级 workflow | 9 条 | @lidangzzz、@lifesinger、@lidangzzz | 把自己的自动化任务按“输入源、执行器、验收标准、失败恢复”四列盘点,找最适合 agent 化的重复流程。 | | 模型能力讨论开始回到可解释与硬基准 | 2 条 | @gregisenberg、@lidangzzz | 关注“可解释调参 + 任务级评测”的组合,不要只记录模型名和分数。 | | 高互动内容明显偏向组织、城市和政治表达 | 5 条 | @garrytan、@gregisenberg、@lidangzzz | 阅读时把它们标成“背景/观点”,只保留能迁移到组织、产品或个人决策的部分。 | ## 今天该做什么 - 优先试跑 /goal 类长任务,并记录失败点:上下文丢失、权限、工具调用、重复执行和结果验收。 - 把自己的自动化任务按“输入源、执行器、验收标准、失败恢复”四列盘点,找最适合 agent 化的重复流程。 - 关注“可解释调参 + 任务级评测”的组合,不要只记录模型名和分数。 ## 重点账号动态 - @bcherny: 当日未抓到新推文 - @karpathy: 当日未抓到新推文 - @trq212: 6 条;重点:@DanielleFong @badlogicgames yeah you can set CLAUDE_CODE_SIMPLE=1 claude to true if you want our take on the simplest harness dont think this is bett [链接](https://x.com/trq212/status/2050391489612747186) - @gdb: 当日未抓到新推文 - @dotey: 2 条;重点:我觉得判断谁写的代码更快更好,应该是 1. 擅长定义清楚问题,或者说把需求拆解成AI能执行的任务 2. 判断结果的好坏,能识别AI生成结果的质量,对于质量差的能指导AI完善 [链接](https://x.com/dotey/status/2050367418648727764) - @oran_ge: 14 条;重点:“现代化大公司创造出来的奴隶制形式令人非常惊奇。最好的奴隶就是你支付给他超额工资,让他意识到自己不值这个钱,同时又很害怕失去眼前的一切。” ——塔勒布 [链接](https://x.com/oran_ge/status/2050403543488794730) - @AnthropicAI: 当日未抓到新推文 - @dongxi_nlp: 3 条;重点:刚订假期出行机票,订完票血槽空了一半。 一堆蹦出来的选项。 出行保险?延迟险?行李险?航班更新sms?添加行李?选座位?check in help?Lounge pass?Fast Track?Premium support?... 要是 Agent 能猜准我心中选项并完成订票,我觉得就 AGI 了 [链接](https://x.com/dongxi_nlp/status/2050500905733157130) - @jiangydev: 当日未抓到新推文 - @lifesinger: 2 条;重点:agents 产品开始进入一种很诡异的阶段,大家都在寻找有钱人或有钱企业买单。 因为大量 agents 产品,真正好用的,依赖的模型都很贵。说得好听一点,各家可能都处于 PC 的早期。说得难听一点,大家都在造长期没啥用的奢侈品。 To C 产品里,豆包最牛。彻底贯彻移动互联网的增长逻辑。有钱就是好, [链接](https://x.com/lifesinger/status/2050405884862538055) - @gregisenberg: 1 条;重点:I actually think the whole "permanent underclass" narrative is wrong. I think we're about to see the largest EXPLOSION of entrepreneurship in human hi [链接](https://x.com/gregisenberg/status/2050582257971163530) - @garrytan: 19 条;重点:How to drive the billionaires out and ruin the California tax base in one fell swoop: propose asset seizure measures Make it make sense! Middle class [链接](https://x.com/garrytan/status/2050365216421241152) - @signulll: 1 条;重点:@sama damn i forgot to apply! [链接](https://x.com/signulll/status/2050431600593375265) - @thedankoe: 当日未抓到新推文 - @lidangzzz: 18 条;重点:🥰🥰🥰 https://t.co/pLNMRdB8IY [链接](https://x.com/lidangzzz/status/2050419482674274707) - @HiTw93: 32 条;重点:我很多开源产品使用的中文字体是仓耳今楷,我非常喜欢,后面有不少小伙伴也跟着用这个字体。它个人使用免费,商业使用需要授权,但在一些场景里确实会有授权和分发上的不便,突然有点儿想自己造一套开源的、精美舒服、方便阅读的中文字体。 读书时代就特别喜欢好看的中文字体,去年过年去绍兴玩,特地去了一趟当地西南的兰 [链接](https://x.com/HiTw93/status/2050469914931245081) - @Khazix0918: 当日未抓到新推文 - @nash_su: 15 条;重点:快10倍!卷完 Decoding 开始卷 Prefill 了 之前的 DFlash 已经很惊艳了,竟然又搞了 PFlash...... DFlash 是在 Decoding 阶段用小模型进行 Speculative 来提速,但是对于超长 Context, Prefill 阶段的时间也会很久。PFla [链接](https://x.com/nash_su/status/2050373766048620588) ## 重点推文 - @lidangzzz: 🥰🥰🥰 https://t.co/pLNMRdB8IY (赞 1215 / 转 28 / 回 100 / 看 204893) [链接](https://x.com/lidangzzz/status/2050419482674274707) - @garrytan: How to drive the billionaires out and ruin the California tax base in one fell swoop: propose asset seizure measures Make it make sense! Middle class taxpayers will take on all the (赞 578 / 转 39 / 回 51 / 看 47208) [链接](https://x.com/garrytan/status/2050365216421241152) - @oran_ge: “现代化大公司创造出来的奴隶制形式令人非常惊奇。最好的奴隶就是你支付给他超额工资,让他意识到自己不值这个钱,同时又很害怕失去眼前的一切。” ——塔勒布 (赞 403 / 转 43 / 回 22 / 看 76810) [链接](https://x.com/oran_ge/status/2050403543488794730) - @lidangzzz: 民办三本文科全职宝妈,常年控制自己女儿,不给她吃任何零食, 女儿骑自行车在外面玩,看到地上有一个空的牛奶盒,直接捡起来嘬两口扔了, 宝妈直接崩溃:“为什么现在养女儿这么难呜呜呜呜呜” 我有预感,这个女儿长大后不仅会疯狂补偿童年缺失的所有东西,而且会尽可能远离这个傻逼原生家庭。 https://t.co/lRiA0HmuJ2 (赞 281 / 转 9 / 回 64 / 看 90139) [链接](https://x.com/lidangzzz/status/2050430565929672907) - @lidangzzz: 我一直说,中国绝大多数的985、双一流,现在想要进一步抢顶级生源,就应该全学waterloo,搞co-op制度, 具体来说,就是给学校制作个平台,让小米、智谱、阿里、字节、kimi、minimax、deepseek这一批公司进去,在里面挑本科生, 直接在公司里干6个月(一学期)、12个月(两学期)、18个月(三学期), 把学校的课程直接抵了,学校不用你来上课 (赞 285 / 转 14 / 回 39 / 看 50699) [链接](https://x.com/lidangzzz/status/2050534709327720526) - @gregisenberg: I actually think the whole "permanent underclass" narrative is wrong. I think we're about to see the largest EXPLOSION of entrepreneurship in human history. I get why the fear exis (赞 236 / 转 19 / 回 92 / 看 16119) [链接](https://x.com/gregisenberg/status/2050582257971163530) - @nash_su: 快10倍!卷完 Decoding 开始卷 Prefill 了 之前的 DFlash 已经很惊艳了,竟然又搞了 PFlash...... DFlash 是在 Decoding 阶段用小模型进行 Speculative 来提速,但是对于超长 Context, Prefill 阶段的时间也会很久。PFlash (Speculative Prefill) 推测预填充 (赞 264 / 转 27 / 回 14 / 看 39382) [链接](https://x.com/nash_su/status/2050373766048620588) - @lidangzzz: 千万别拿我和张雪峰这个大傻逼作对比。 网友:我想学AI相关的专业,我对AI很感兴趣,请问我应该选计算机还是数学? 我:你一定要选计算机,先把python和数据结构基础打好, 然后从deep learning这门课开始学,可以在家配置一个nvidia GPU的笔记本或者台式机,或者用google colab,先从最简单的 CNN 开始训练,找一个dataset (赞 206 / 转 30 / 回 36 / 看 29148) [链接](https://x.com/lidangzzz/status/2050559251592953933) - @lidangzzz: 一大堆人试用了codex的/goal,让它持续工作了六七个小时,纷纷感慨goal是个伟大的设计, 谢谢你们对/goal的老祖宗——我的goal driven的认可。 (赞 210 / 转 11 / 回 25 / 看 53691) [链接](https://x.com/lidangzzz/status/2050436815274807706) - @lidangzzz: 中国大部分一二线城市,在任何时候都能找到三四个楼盘,一堆人在排队抢房。 原因很简单,就是两个县城家庭的孩子,在一二线城市读大学、毕业工作、计划结婚定居了, 两家人一起规划,集中所有财力和现金,托举一个完美甜蜜的新家庭,一起凑出来500万~1000万现金,在当地最新的楼盘里买一套婚房。 于是你总能看到,哪怕房地产不景气,这个城市的高端开盘楼盘,依然有一堆年轻的 (赞 164 / 转 12 / 回 32 / 看 57921) [链接](https://x.com/lidangzzz/status/2050402278117351872) - @trq212: @DanielleFong @badlogicgames yeah you can set CLAUDE_CODE_SIMPLE=1 claude to true if you want our take on the simplest harness dont think this is better but play around with it! (赞 178 / 转 13 / 回 8 / 看 22214) [链接](https://x.com/trq212/status/2050391489612747186) - @HiTw93: 我很多开源产品使用的中文字体是仓耳今楷,我非常喜欢,后面有不少小伙伴也跟着用这个字体。它个人使用免费,商业使用需要授权,但在一些场景里确实会有授权和分发上的不便,突然有点儿想自己造一套开源的、精美舒服、方便阅读的中文字体。 读书时代就特别喜欢好看的中文字体,去年过年去绍兴玩,特地去了一趟当地西南的兰渚山下,《兰亭集序》诞生地。当时我记得还发了那块碑的照片推特 (赞 167 / 转 6 / 回 29 / 看 31966) [链接](https://x.com/HiTw93/status/2050469914931245081) ## 标签分布 - china: 86 条 - ai: 53 条 - tools: 48 条 - product: 46 条 - ai-coding: 38 条 - agent: 38 条 - engineering: 34 条 - startup: 20 条 - yc: 19 条 - nlp: 3 条 - model: 0 条 - education: 0 条 ## 一句话判断 - 2026-05-02 的主线不是“有哪些热推”,而是:这不是一次小功能发布,而是在把 Codex 往“可持续追目标的 agent 工作台”推进。 ## 文件 - 原始抓取:`/Users/bytedance/Downloads/twitter_output/每日推文总结_raw_2026-05-02.json` - 信息源:`/Users/bytedance/myCronTask/run/daily_tweet_summary/resources/info_source.md`