# 推文总结 2026-05-03 ## 总览 - 账号范围:18 个 - 活跃账号:10 个 - 总推文数:102 条 - 主要主题:AI 编码 / Agent / 中文 AI 圈 / 模型与研究 ## 今日洞察 ### 1. Codex 正在从 CLI 工具变成持续运行的工作台 - 判断:这不是一次小功能发布,而是在把 Codex 往“可持续追目标的 agent 工作台”推进。 - 为什么重要:如果目标循环、长期上下文和应用内交互稳定下来,用户会开始把更多非一次性的任务交给 Codex,而不只是让它改一段代码。 - 建议动作:优先试跑 /goal 类长任务,并记录失败点:上下文丢失、权限、工具调用、重复执行和结果验收。 - 证据: - @gdb: codex for startup ideas (赞 335 / 转 17 / 回 36 / 看 31401) [链接](https://x.com/gdb/status/2050972114077843772) - @lidangzzz: 所以我反复反复反复讲,为什么claude code、codex的唯一正确用法,就是goal-driven goal-driven goal-driven goal-driven https://t.co/mJld9XcBjp 只有人类设置 一个目标(goal) 一个判据(cri… (赞 238 / 转 35 / 回 20 / 看 29179) [链接](https://x.com/lidangzzz/status/2050761745291997474) - @lidangzzz: 如果你有一堆非常零碎繁杂的任务,你自己的个人精力大概率会被一个claude code窗口彻底吸走, 你会觉得打开三四个claude code,来回来去切换,监测状态,绝对会让你疯掉, 而如果你有几个非常巨大的idea,你用goal driven设置好了goal,设置好的crit… (赞 152 / 转 30 / 回 34 / 看 27878) [链接](https://x.com/lidangzzz/status/2050761825482916102) ### 2. Agent 叙事从炫技转向公司级 workflow - 判断:当天的 agent 信息流不只在讲模型能力,而是在讲“如何用 agents 组装业务流程”。 - 为什么重要:这意味着下一阶段的差异点会落在流程编排、数据源、验收、权限和成本控制,而不是单点 prompt 技巧。 - 建议动作:把自己的自动化任务按“输入源、执行器、验收标准、失败恢复”四列盘点,找最适合 agent 化的重复流程。 - 证据: - @lidangzzz: 所以我反复反复反复讲,为什么claude code、codex的唯一正确用法,就是goal-driven goal-driven goal-driven goal-driven https://t.co/mJld9XcBjp 只有人类设置 一个目标(goal) 一个判据(cri… (赞 238 / 转 35 / 回 20 / 看 29179) [链接](https://x.com/lidangzzz/status/2050761745291997474) - @lidangzzz: 如果你有一堆非常零碎繁杂的任务,你自己的个人精力大概率会被一个claude code窗口彻底吸走, 你会觉得打开三四个claude code,来回来去切换,监测状态,绝对会让你疯掉, 而如果你有几个非常巨大的idea,你用goal driven设置好了goal,设置好的crit… (赞 152 / 转 30 / 回 34 / 看 27878) [链接](https://x.com/lidangzzz/status/2050761825482916102) - @lidangzzz: 简中推特宁可吹嘘codex的/goal,也不肯认我这个goal driven的老祖宗。 何况codex的/goal从概念到实现,全方位被goal driven吊打。 一方面criteria能更加细颗粒限制整个loop的过程,另一方面goal driven可以让10个master… (赞 91 / 转 3 / 回 23 / 看 28615) [链接](https://x.com/lidangzzz/status/2050778118894346621) ### 3. 高互动内容明显偏向组织、城市和政治表达 - 判断:热门榜里非 AI 内容占了不少位置,说明关注列表不只是技术雷达,也在反映社会情绪和组织治理话题。 - 为什么重要:这些内容互动高,但和日常工作流的直接相关性较弱;适合当背景信号,不适合挤占技术跟进时间。 - 建议动作:阅读时把它们标成“背景/观点”,只保留能迁移到组织、产品或个人决策的部分。 - 证据: - @garrytan: Oakland has highest taxes per capita among similar cities while services are among the worst. 44% of Measure E revenue goes to pre-approved… (赞 360 / 转 48 / 回 28 / 看 14100) [链接](https://x.com/garrytan/status/2050775806574751816) - @lidangzzz: If you have a bunch of extremely fragmented and messy tasks, your own personal energy will most likely be completely drained by a single Cl… (赞 19 / 转 1 / 回 13 / 看 15675) [链接](https://x.com/lidangzzz/status/2050935856655966567) ## 信号矩阵 | 信号 | 强度 | 代表账号 | 处理建议 | |---|---:|---|---| | Codex 正在从 CLI 工具变成持续运行的工作台 | 9 条 | @gdb、@lidangzzz、@lidangzzz | 优先试跑 /goal 类长任务,并记录失败点:上下文丢失、权限、工具调用、重复执行和结果验收。 | | Agent 叙事从炫技转向公司级 workflow | 7 条 | @lidangzzz、@lidangzzz、@lidangzzz | 把自己的自动化任务按“输入源、执行器、验收标准、失败恢复”四列盘点,找最适合 agent 化的重复流程。 | | 高互动内容明显偏向组织、城市和政治表达 | 2 条 | @garrytan、@lidangzzz | 阅读时把它们标成“背景/观点”,只保留能迁移到组织、产品或个人决策的部分。 | ## 今天该做什么 - 优先试跑 /goal 类长任务,并记录失败点:上下文丢失、权限、工具调用、重复执行和结果验收。 - 把自己的自动化任务按“输入源、执行器、验收标准、失败恢复”四列盘点,找最适合 agent 化的重复流程。 - 阅读时把它们标成“背景/观点”,只保留能迁移到组织、产品或个人决策的部分。 ## 重点账号动态 - @bcherny: 当日未抓到新推文 - @karpathy: 当日未抓到新推文 - @trq212: 1 条;重点:@codetaur 3.5-new [链接](https://x.com/trq212/status/2050966553257283977) - @gdb: 2 条;重点:ChatGPT Images really taking off [链接](https://x.com/gdb/status/2050731568742723899) - @dotey: 当日未抓到新推文 - @oran_ge: 7 条;重点:https://t.co/V4qCPLARUz [链接](https://x.com/oran_ge/status/2050791647156592722) - @AnthropicAI: 当日未抓到新推文 - @dongxi_nlp: 11 条;重点:前几周在 x 上,有篇文章已经完全证实了, token 中转就是背后换模型,以次充好,挂着羊牛卖狗肉,骗用户,大几十万阅读,似乎人人皆知了。 现在简中推,到处都在吹嘘中转站是个好生意。 能 low 到这个程度,非常不能理解。 [链接](https://x.com/dongxi_nlp/status/2050885715970400510) - @jiangydev: 当日未抓到新推文 - @lifesinger: 2 条;重点:红果漫剧太好看了 无法抵抗 字节 太邪恶了 [链接](https://x.com/lifesinger/status/2050815380730630328) - @gregisenberg: 当日未抓到新推文 - @garrytan: 6 条;重点:Oakland has highest taxes per capita among similar cities while services are among the worst. 44% of Measure E revenue goes to pre-approved union rais [链接](https://x.com/garrytan/status/2050775806574751816) - @signulll: 7 条;重点:one of the interesting weak points of regulation is that it evaluates deals as if every company exists in a steady viable state instead of recognizing [链接](https://x.com/signulll/status/2050773605693403258) - @thedankoe: 当日未抓到新推文 - @lidangzzz: 13 条;重点:我操,太地狱了 https://t.co/JjFT1fTStw [链接](https://x.com/lidangzzz/status/2050880224271704423) - @HiTw93: 48 条;重点:M5 Pro 黑色终于到了 非常漂亮 非常激动 👏 https://t.co/4EhjllB0Ly [链接](https://x.com/HiTw93/status/2050778739731234936) - @Khazix0918: 当日未抓到新推文 - @nash_su: 5 条;重点:@supezen 本地模型我现在基本都是用 Qwen3.6-27B,4Bit GGUF。运行在单卡 RTX4090 上,45~token/s 。基本可以接受,现在很多人在用 双卡 RTX3090,好处是可以用NVLink,且有24G版本。 不差钱强烈建议 RTX Pro 6000, 96G显存,没有 [链接](https://x.com/nash_su/status/2050810353567813792) ## 重点推文 - @gdb: ChatGPT Images really taking off (赞 781 / 转 25 / 回 100 / 看 82556) [链接](https://x.com/gdb/status/2050731568742723899) - @lidangzzz: 我操,太地狱了 https://t.co/JjFT1fTStw (赞 433 / 转 4 / 回 291 / 看 159586) [链接](https://x.com/lidangzzz/status/2050880224271704423) - @HiTw93: M5 Pro 黑色终于到了 非常漂亮 非常激动 👏 https://t.co/4EhjllB0Ly (赞 400 / 转 2 / 回 94 / 看 83097) [链接](https://x.com/HiTw93/status/2050778739731234936) - @garrytan: Oakland has highest taxes per capita among similar cities while services are among the worst. 44% of Measure E revenue goes to pre-approved union raises. The pattern: wrap dysfunct (赞 360 / 转 48 / 回 28 / 看 14100) [链接](https://x.com/garrytan/status/2050775806574751816) - @gdb: codex for startup ideas (赞 335 / 转 17 / 回 36 / 看 31401) [链接](https://x.com/gdb/status/2050972114077843772) - @dongxi_nlp: 前几周在 x 上,有篇文章已经完全证实了, token 中转就是背后换模型,以次充好,挂着羊牛卖狗肉,骗用户,大几十万阅读,似乎人人皆知了。 现在简中推,到处都在吹嘘中转站是个好生意。 能 low 到这个程度,非常不能理解。 (赞 241 / 转 18 / 回 64 / 看 80967) [链接](https://x.com/dongxi_nlp/status/2050885715970400510) - @lidangzzz: 所以我反复反复反复讲,为什么claude code、codex的唯一正确用法,就是goal-driven goal-driven goal-driven goal-driven https://t.co/mJld9XcBjp 只有人类设置 一个目标(goal) 一个判据(criteria,比如几百个unit test) 一个master agent执行判据, (赞 238 / 转 35 / 回 20 / 看 29179) [链接](https://x.com/lidangzzz/status/2050761745291997474) - @lidangzzz: 如果你有一堆非常零碎繁杂的任务,你自己的个人精力大概率会被一个claude code窗口彻底吸走, 你会觉得打开三四个claude code,来回来去切换,监测状态,绝对会让你疯掉, 而如果你有几个非常巨大的idea,你用goal driven设置好了goal,设置好的criteria,每一个任务都是一个相对较长的任务, https://t.co/mJld9 (赞 152 / 转 30 / 回 34 / 看 27878) [链接](https://x.com/lidangzzz/status/2050761825482916102) - @oran_ge: https://t.co/V4qCPLARUz (赞 114 / 转 26 / 回 6 / 看 24685) [链接](https://x.com/oran_ge/status/2050791647156592722) - @lidangzzz: 我以为这是个2024年就人尽皆知的秘密,没想到2026年还有人上这个恶当。 中转站就是个鸡零狗碎的生意,除了openrouter这种全球国际大品牌以外,毫无信誉可言,买的人和卖的人都是一路。 (赞 122 / 转 8 / 回 24 / 看 45225) [链接](https://x.com/lidangzzz/status/2050888587353149689) - @lidangzzz: 算了,不跟OpenAI置气了,抄我就抄我了,抄错了也就算了, 先刷会儿抖音 https://t.co/N1pe2km3wt (赞 110 / 转 0 / 回 45 / 看 48028) [链接](https://x.com/lidangzzz/status/2050825323361525903) - @garrytan: It's true GBrain on OpenClaw with book-mirror skill pack is like infinite personal Blinkist (赞 115 / 转 7 / 回 13 / 看 22256) [链接](https://x.com/garrytan/status/2050763012894834952) ## 标签分布 - china: 86 条 - tools: 60 条 - engineering: 50 条 - ai: 38 条 - agent: 22 条 - product: 22 条 - ai-coding: 20 条 - nlp: 11 条 - startup: 6 条 - yc: 6 条 - openai: 2 条 - gpt: 2 条 ## 一句话判断 - 2026-05-03 的主线不是“有哪些热推”,而是:这不是一次小功能发布,而是在把 Codex 往“可持续追目标的 agent 工作台”推进。 ## 文件 - 原始抓取:`/Users/bytedance/Downloads/twitter_output/每日推文总结_raw_2026-05-03.json` - 信息源:`/Users/bytedance/myCronTask/run/daily_tweet_summary/resources/info_source.md`