商品skill口径和承接排行需要索引器

## Before 用户问：商品域到底有多少客服文档、多少 skill？哪些 skill 承接的 case 多？ agent 的实际路径是：先在整个 `data-analysis-workspace` 搜 CSV 和 README，再回到 memory 查历史口径，然后打开项目级 SQLite/README 复核，最后为了排行临时导出两份新 CSV。回答能做出来，但每次都要重新判断 44/22/261/258/130 分别是什么意思，容易把 SOP 参考文档、窄口径主类目文档、skill 清单和线上 case 口径混在一起。 ## After 用户问同样问题时，agent 先运行： ```bash cd /Users/bytedance/Documents/job-bu/data-analysis-workspace/projects/2026-05-15-客服知识skill化 python3 scripts/build_product_skill_inventory_index.py ``` 脚本输出 `analysis/product_skill_inventory_index_YYYY_MM_DD.json`，其中每个核心数字都带来源： | metric | value | denominator_scope | source | |---|---:|---|---| | 商品 SOP 参考文档 | 44 | wiki 第三部分参考文档清单 | `raw/商品领域SOP参考文档44篇_2026-05-15.csv` | | 窄口径商品主类目文档 | 22 | `商品管理/商家商品` 主类目 | `analysis/窄口径商品主类目22篇_skill抽取清单_2026-05-15_v1.csv` | | 商品创建 skill | 130 | `商品管理-商品创建` 文档下的 skill 场景 | `output/商品管理-商品创建_130个skill场景清单_2026-05-18_v1.csv` | | 承接 case Top skill | Top N | 线上原文场景命中数聚合 | `output/商品领域skill承接case排行_2026-05-22_v1.csv` | 最终回答默认带口径：`商品创建子集是 130 个 skill；如果问商品主类目窄口径全集，则使用 22 篇文档抽取出的 skill 清单；承接 case 排行来自 2026-05-22 两份排行 CSV，可复跑索引器刷新。`