# 2026-05-26 Agent健身房复盘 一句话概括:**这次发现的不是已经自动修复的问题,而是 4 类以后会反复浪费时间的操作摩擦 / 工具缺口。** | 优先级 | 发现的问题 | 真实含义 | 计划怎么解决 | | --- | --- | --- | --- | | 1 | v31 意图 PE 仍靠人工拼枚举和规则 | 线上 session 分类一旦标签枚举、客服 Skill 辅助证据或单主意图规则漂移,就会把错误口径带进 PE。 | 做 PE 模板生成器:从枚举/边界规则源注入 `{V31_LABELS}`,并用样例校验 JSON 输出契约。 | | 2 | 推文日报脚本产物已落盘但进程不退出 | agent 会在无日志的网络等待里盲等,甚至让残留进程影响下一轮自动化。 | 加 watchdog:检查 raw/markdown、mtime、文件稳定性、PID 和日志,区分完成、仍抓取、已卡死。 | | 3 | Meegle 复制缺字段协议 dry-run | 失败点不是业务判断,而是模板 ID、多选字段、自动默认值这类 API 编码细节。 | 加 `meegle_clone_preflight --dry-run`,真实创建前输出字段编码报告、必填覆盖率和创建后 diff。 | | 4 | 商品域最新 HTML/表格靠人工翻目录 | 文件名最像的不一定最新,错拿旧版会直接污染后续 PE、分析和结论。 | 做只读 artifact indexer:按项目、类型、关键词、文件名日期和 mtime 返回候选及冲突说明。 | ## 下一步 | 顺序 | 先做什么 | 为什么 | | --- | --- | --- | | 1 | 先固化 v31 标签枚举、边界规则和 10-20 条样例 | 这是生产分类口径的源头,风险高于单次文件查找。 | | 2 | 先实现只读 `twitter_daily_watchdog.py` 状态判定 | 它能直接减少自动化运行时的等待和人工清理。 | | 3 | 沉淀字段 encoder 表,先覆盖模板、单选、多选、人员和角色字段 | 这是外部写操作,预检能避免反复试错和创建脏项。 | | 4 | 先索引 `data-analysis-workspace` 的 HTML/CSV/MD/DB,并支持 latest query | 它是商品域后续分析的入口层,能减少版本误判。 | 一、证据概况 本日扫描 5 个 session;`agent_reflections` 为 0 条,所以候选完全来自用户请求、assistant 过程记录和最终结果里的真实摩擦。 1.1 v31意图PE缺枚举注入与样例校验 这个主题有明确价值:现有 PE 草稿可以复用,但当前落地依赖人工拼接 v31 标签枚举和边界规则,容易在 v32/v33 或标签分布更新时漂移。更合适的升级是做成模板生成器:从枚举源读取标签,注入 PE 模板,并用线上样例校验单主意图 JSON 输出和客服 Skill 辅助证据边界。 | 证据 | session | 片段 | | --- | --- | --- | | 1 | `019e63a1-00b0-7ca2-852f-81d6010702a4` | 项目里其实已经有一份 人工侧对齐到智能 AI v31 的 PE 草稿,核心原则可以复用,但线上 session 分类建议改成 线上输入结构 + 商品域判断 + v31 标签枚举 + 单主意图 JSON 输出。 | | 2 | `019e63a1-00b0-7ca2-852f-81d6010702a4` | 我再把 60 个标签枚举和当前分布核出来,方便给你一版可直接贴到 Fornax/PE 的完整模板。 | | 3 | `019e63a1-00b0-7ca2-852f-81d6010702a4` | 你发的 HTML 是 2026-05-25 v31 + 客服Skill命中,主标签体系仍然看 v31,客服 Skill 命中只能当辅助证据,不能覆盖用户原文。 | 1.2 推文日报卡住后缺少完成态探针 该主题有效:片段显示推文日报脚本存在长时间无中间日志、同步接口等待、进程不退出的问题,但 raw/markdown 产物其实可能已经落盘。需要一个完成态 watchdog,把“产物已生成但主进程未退出”和“仍在真实抓取/重试”区分开,避免盲等和后续自动化重叠。 | 证据 | session | 片段 | | --- | --- | --- | | 1 | `019e61cc-15a0-7b42-843d-8427f7c004e4` | 当前配置里没有 skills.twitter-fetcher.users,脚本会回退到最近一次抓取产物里的账号列表;我先确认回退源,再执行今天这轮。 | | 2 | `019e61cc-15a0-7b42-843d-8427f7c004e4` | 这轮没有中间日志输出,像是一直在同步请求接口。再给它一点时间;如果超长,我会改成先检查新 raw 文件是否已落盘并判断是否卡在单账号重试。 | | 3 | `019e61cc-15a0-7b42-843d-8427f7c004e4` | 脚本仍然在等待接口返回,我改从进程侧看它卡在什么系统调用上,避免盲等。 | 1.3 Meegle复制缺字段协议预检 这个主题有明确价值:复制 Meego 工作项时,失败不在业务字段本身,而在不同字段类型的服务端传参协议。片段连续出现模板 ID 类型、多选字段 supported_apps 编码、创建规则自动补字段等问题,说明需要在真正创建前做协议级 dry-run 和差异检查。 | 证据 | session | 片段 | | --- | --- | --- | | 1 | `019e63bc-2bc6-7c20-b15d-1038d70ee232` | 创建字段很多,CLI 没有看到现成的 copy/clone 命令。我会把原项的创建必填字段和角色抽出来,先做一次受控创建。 | | 2 | `019e63bc-2bc6-7c20-b15d-1038d70ee232` | 第一次创建没有落成,服务端在参数校验阶段拒绝了:模板 ID 必须按字符串协议传,不能传数字。 | | 3 | `019e63bc-2bc6-7c20-b15d-1038d70ee232` | 字段 supported_apps 的值格式被服务端判为非法;它的选项 ID 是对的,问题是多选字段的传参协议。 | 1.4 商品域最新产物定位依赖人工翻目录 该主题有效,不是噪音。片段显示用户要“最新的智能侧用户 session 打标 HTML”时,候选文件存在日期、命名和项目目录三种线索冲突,agent 需要人工判断 5 月 25 日复核 HTML 才是真正基准;后续用户又基于这个 HTML 继续设计线上 session 分类 PE,说明产物定位错误会影响下游方案。 | 证据 | session | 片段 | | --- | --- | --- | | 1 | `019e6313-8585-7b02-a8d3-7ee5924b4867` | 用户问:最新的智能侧的用户session打标的html给我一下。 | | 2 | `019e6313-8585-7b02-a8d3-7ee5924b4867` | 我看到最近的候选有两个:一个是 5 月 25 日生成的 用户版层级_session复核,另一个文件名里直接写了 智能侧,但它是 5 月 13 日的意图体系详情页。 | | 3 | `019e6313-8585-7b02-a8d3-7ee5924b4867` | 目录确认下来,5 月 25 日这个文件是 2026-05-09-商品领域意图体系迭代 项目下最新的 session 复核 HTML;5 月 13 日那个只是同一份页面的旧命名/旧拷贝。 | 二、候选清单 | id | 类型 | 风险 | 审批 | | --- | --- | --- | --- | | `v31-pe-template-generator` | `tool-upgrade` | `medium` | pending | | `tweet-automation-watchdog` | `diagnostic-tool` | `low` | pending | | `meegle-clone-field-encoder` | `diagnostic-tool` | `low` | pending | | `product-artifact-indexer` | `tool-upgrade` | `low` | pending | 三、审批方式 在 `out/` 目录运行: ```bash ./approve.sh <candidate-id> ```