# 2026-05-25 Agent健身房复盘 一句话概括:**这次发现的不是已经自动修复的问题,而是 3 类以后会反复浪费时间的操作摩擦 / 工具缺口。** | 优先级 | 发现的问题 | 真实含义 | 计划怎么解决 | | --- | --- | --- | --- | | 1 | 商品客服 Skill 覆盖和命中边界每次都要重新串库、表、HTML | 44 篇、核心 19 篇、531 命中 session、543 命中关系和 309 单 Skill 命中很容易混成一个口径,导致后续判断要反复回源。 | 做一个覆盖与边界诊断器,一次性输出 0 值原因、核心缺口、命中分母和 Top Skill 边界说明。 | | 2 | 风神学习停留在逐图解释,缺少用户熟悉的数据练习场 | 用户连续追问维度、指标、透视、主次轴,说明卡点是 BI 心智模型,不只是某张图怎么拖。 | 从 session 打标 v3 导出小宽表,配套 4-5 个风神拖拽练习任务,让概念在熟悉数据上反复验证。 | | 3 | 外部检索前置工具 crawl-hub 多次因 Apify token/schema 失配掉链 | Pi Agent、ReAct 项目、社区 skill 检索都发生了中途切换来源,agent 在研究流程里才发现工具不可用。 | 做 crawl-hub source preflight,先检查 token、actor schema 和 fallback 路线,再进入正式检索。 | ## 下一步 | 顺序 | 先做什么 | 为什么 | | --- | --- | --- | | 1 | 先做商品客服 Skill 覆盖诊断器 | 这是昨天最重的实际工作流,已经有 SQLite、v31 HTML、命中明细和明确误读案例,落地收益最高。 | | 2 | 再做风神练习数据集沙盒 | 用户已经明确要用自己的 v3 session 数据学习风神,可直接转成可导入 CSV 和练习手册。 | | 3 | 最后补 crawl-hub 预检 | 实现风险低,但影响面主要在外部研究类任务,可以作为 info-bu 的轻量工具补丁。 | ## 一、证据详情 ### 1.1 商品客服 Skill 覆盖与边界诊断器 这个主题有效:片段里出现了连续三类真实痛点,分别是文档是否抽完、线上 session 是否命中、命中量异常时如何解释边界。当前链路已经有 SQLite、HTML 和 v31 session 产物,但缺少一个把覆盖率、0 值、核心文档、命名泛化风险放在一起检查的诊断入口。 | 证据 session | 片段 | | --- | --- | | `019e5e04-69a2-72d2-97d4-990401211917` | 用户连续追问:商品领域客服文档有哪些、44 篇给 Excel、Skill 场景数为 0 是没跑还是结果为 0、排除审核/治理后还有多少篇、核心 19 篇是否都提取 Skill。 | | `019e5e04-69a2-72d2-97d4-990401211917` | 最终 agent 补齐 8 篇原本 Skill场景数=0 的文档,新增 37 个 SKILL.md,SQLite skill_md 从 258 增到 295,并校验核心 19 篇无 0。 | | `019e5e47-a051-7cc1-8f2b-d6cc14c833f5` | agent 派生 HTML:仍是 9,335 条 session,标注出 531 个命中 Skill 的 session、543 条 Skill 命中关系、17 个 Skill、16 个线上原文场景。 | | `019e5e47-a051-7cc1-8f2b-d6cc14c833f5` | 309 是唯一 session,不是重复计数;高是因为该 Skill 实际承接“团购商品创建入口”,如果看代金券/次卡专门问题会偏高。 | 计划动作: - 在 `/Users/bytedance/Documents/job-bu/data-analysis-workspace/projects/2026-05-15-客服知识skill化/scripts/diagnose_kefu_skill_coverage.py` 增加可复跑诊断入口,统一读取 `analysis/商品wiki文档场景关系_2026-05-18_v2.db`、44 篇文档清单、核心 19 篇清单、v31 session 与 Skill 命中明细。 - 报告同时输出文档覆盖、`skill_md=0` 原因、排除审核/治理后的核心分母、线上唯一 session 命中数、命中关系数和 Top Skill 边界解释,避免把 531 session、543 关系、309 单 Skill 命中混用。 - 在 HTML/XLSX 中为高命中 Skill 增加 `boundary_note` 和建议命名,例如把窄标题解释为 `团购商品创建入口(团购套餐/代金券/次卡)`,降低后续误读。 - 成功判据:核心 19 篇无未解释的 0 值;SQLite skill_md 不回退;命中分母固定;Top Skill 都能给出代表 case 与边界说明。 ### 2.1 风神可视化练习数据集沙盒 该主题有明确价值:用户不是一次性问图表配置,而是在风神数据集 4090273 上暴露了维度、指标、透视、主次轴等核心概念的系统性困惑。片段末尾用户明确提出要从自己的 session 打标 v3 数据拉一批到风神,用熟悉业务数据陪练平台,因此适合沉淀成一个可重复学习实验。 | 证据 session | 片段 | | --- | --- | | `019e5e0f-87da-7d50-8e6f-1783c420b002` | 用户从风神数据集 4090273 开始,要求通过拖拽做过去 8 周每周商品标签下 session 邀评解决率柱状图,并一步步教学。 | | `019e5e0f-87da-7d50-8e6f-1783c420b002` | 用户连续追问图表生成逻辑、指标是不是纵轴/维度是不是横轴、为什么有三个图、透视是不是拆横轴。 | | `019e5e0f-87da-7d50-8e6f-1783c420b002` | agent 解释:配置本质是筛选、维度、指标、图表映射;透视不是横轴下钻,而是用某个维度拆小图。 | | `019e5e0f-87da-7d50-8e6f-1783c420b002` | 用户明确下一步:帮我从我的 session 打标 v3 几版本里拉一批数据,弄到风神里陪我熟悉和研究这个平台。 | 计划动作: - 在 `/Users/bytedance/Documents/job-bu/data-analysis-workspace/scripts/aeolus_sandbox/export_session_tagging_v3_for_aeolus.py` 新增导出脚本:从 session 打标 v3 相关 CSV/SQLite 产物读取样本,生成可导入风神的宽表 CSV,至少包含 `week_start`、`session_id`、`商品标签`、`是否邀评`、`是否解决`、`邀评解决率_分子`、`邀评解决率_分母`、`邀评解决率`。 - 在 `/Users/bytedance/Documents/job-bu/data-analysis-workspace/aeolus_sandbox/README.md` 新增练习手册:用同一份 CSV 设计 5 个任务,分别覆盖筛选、维度、指标、柱状图映射、透视拆图、比例指标放次轴。 - 新增一个本地技能 `aeolus-learning-sandbox`:触发语为“教我风神 / 做风神练习 / 用我的数据学风神”,流程固定为定位数据源、生成小样本宽表、给出风神字段映射、设计拖拽练习题、记录用户卡点。 - 学习概念清单落到练习手册中:明确区分 `维度=分组/横轴候选`、`指标=聚合值/纵轴候选`、`透视=按额外维度拆小图或拆系列`、`筛选=进入图表前的数据子集`、`主次轴=数量和比例混画时的尺度隔离`。 ### 3.1 外部检索 crawl-hub 预检修复 这个主题有效,三个片段都显示 crawl-hub 在外部研究前置阶段反复因为 Apify 凭证或 Google Actor input schema 失配而失败。问题不是单次源不可用,而是缺少一个轻量预检层来提前判断 source 是否可用、失败时该切到哪条备援检索路线。 | 证据 session | 片段 | | --- | --- | | `019e5d3a-4454-7333-8c2f-8ec001a6b869` | 用户问 Pi Agent 是什么。agent 先走 info-bu 来源选择,本地 crawl-hub runner 需要 Apify token,后续因为 Apify 搜索 runner 报 input schema 错,改用公开网页和官方仓库交叉确认。 | | `019e5d4f-9224-7232-b2ac-dd8d4a776d3a` | 用户问三百行代码写 ReAct agent 的 GitHub 项目。agent 说 crawl-hub 会路由到通用搜索/GitHub 线索,但 Google actor 输入格式和当前 API 有点不匹配,于是用普通网页搜索补上小范围检索。 | | `019e5e07-dc9e-7a60-888b-c7f082aed71a` | 用户要找社区里探讨深入问题、启发性、深度思考的高星 skill。agent 明确记录 crawl-hub 的 Google Actor schema 变更:Apify 返回 input.queries must be string,说明当前封装给了旧格式。 | 计划动作: - 新增工具入口 `/Users/bytedance/Documents/info-bu/tools/crawl_hub_source_preflight.py`,CLI 形态为 `python tools/crawl_hub_source_preflight.py --query "..." --source google-search --fallback github,web --dry-run`;输出 JSON,供 agent 在调用 crawl-hub 前先读。 - 输入来源明确为:用户原始问题、计划使用的 crawl-hub source/actor、`/Users/bytedance/.codex/secret.env` 中的 `APIFY_TOKEN` 或 `APIFY_API_TOKEN`、crawl-hub runner 配置、可选的 GitHub repo/org 线索;不要让工具直接承担完整研究,只做可用性和路由判断。 - 核心检查步骤:1) 检查 token 是否存在且非空;2) 对 Apify actor 做只读 schema 探测或本地 schema cache 校验;3) 校验当前封装生成的 input 是否符合 actor schema,比如 `input.queries` 是否必须是 string;4) 小样本 dry-run 或跳过运行并给出 fallback;5) 按官方文档/GitHub Search API/普通网页搜索生成备援路线。 - 成功/失败信号和落地路径:成功时返回 `status=pass`、可用 source、规范化 input 示例和下一步命令;失败时返回 `status=fail`、`missing_token` 或 `schema_mismatch`、原始错误摘要、推荐 fallback。把该工具写进 `/Users/bytedance/Documents/info-bu/AGENTS.md` 的外部研究路由,并新增一个 Codex skill `crawl-hub-source-preflight`,要求外部检索前先跑预检。