## 诊断流程样例
| 阶段 | 输入 | 检查 | 期望信号 |
|---|---|---|---|
| 1. 读取样本 | 近 N 个 session JSONL 与 reflections | 提取 session_id、cwd、prompt 首段、写入路径 | 得到完整扫描清单 |
| 2. 强规则过滤 | cwd/prompt/output path | 命中 `~/.codex/night-gym/runs`、`Night Gym 子主题分析`、`SUBAGENT_DONE` 等标记 | 标为 self_run |
| 3. 污染率统计 | 全部样本 + self_run 标签 | 计算 self_run_count / total_count | 超过 20% 输出 warning/hard fail |
| 4. 候选前校验 | 候选 evidence | 若 evidence 主要来自 Night Gym prompt 或子分析 reflection,则阻断该候选 | 候选只来自真实用户工作流 |
示例结果:扫描 10 个 session,其中 6 个命中 self_run。工具输出 `contamination_rate=0.60`,阻断候选生成,并写入 `out/diagnostics/self_run_filter.json`,要求下一步只使用过滤后的 4 个业务 session。