## Before 用户问:商品域到底有多少客服文档、多少 skill?哪些 skill 承接的 case 多? agent 的实际路径是:先在整个 `data-analysis-workspace` 搜 CSV 和 README,再回到 memory 查历史口径,然后打开项目级 SQLite/README 复核,最后为了排行临时导出两份新 CSV。回答能做出来,但每次都要重新判断 44/22/261/258/130 分别是什么意思,容易把 SOP 参考文档、窄口径主类目文档、skill 清单和线上 case 口径混在一起。 ## After 用户问同样问题时,agent 先运行: ```bash cd /Users/bytedance/Documents/job-bu/data-analysis-workspace/projects/2026-05-15-客服知识skill化 python3 scripts/build_product_skill_inventory_index.py ``` 脚本输出 `analysis/product_skill_inventory_index_YYYY_MM_DD.json`,其中每个核心数字都带来源: | metric | value | denominator_scope | source | |---|---:|---|---| | 商品 SOP 参考文档 | 44 | wiki 第三部分参考文档清单 | `raw/商品领域SOP参考文档44篇_2026-05-15.csv` | | 窄口径商品主类目文档 | 22 | `商品管理/商家商品` 主类目 | `analysis/窄口径商品主类目22篇_skill抽取清单_2026-05-15_v1.csv` | | 商品创建 skill | 130 | `商品管理-商品创建` 文档下的 skill 场景 | `output/商品管理-商品创建_130个skill场景清单_2026-05-18_v1.csv` | | 承接 case Top skill | Top N | 线上原文场景命中数聚合 | `output/商品领域skill承接case排行_2026-05-22_v1.csv` | 最终回答默认带口径:`商品创建子集是 130 个 skill;如果问商品主类目窄口径全集,则使用 22 篇文档抽取出的 skill 清单;承接 case 排行来自 2026-05-22 两份排行 CSV,可复跑索引器刷新。`