Agent健身房自生成记录过滤器 - 𓀚 转了码的刘公子

## 诊断流程样例 | 阶段 | 输入 | 检查 | 期望信号 | |---|---|---|---| | 1. 读取样本 | 近 N 个 session JSONL 与 reflections | 提取 session_id、cwd、prompt 首段、写入路径 | 得到完整扫描清单 | | 2. 强规则过滤 | cwd/prompt/output path | 命中 `~/.codex/night-gym/runs`、`Night Gym 子主题分析`、`SUBAGENT_DONE` 等标记 | 标为 self_run | | 3. 污染率统计 | 全部样本 + self_run 标签 | 计算 self_run_count / total_count | 超过 20% 输出 warning/hard fail | | 4. 候选前校验 | 候选 evidence | 若 evidence 主要来自 Night Gym prompt 或子分析 reflection，则阻断该候选 | 候选只来自真实用户工作流 | 示例结果：扫描 10 个 session，其中 6 个命中 self_run。工具输出 `contamination_rate=0.60`，阻断候选生成，并写入 `out/diagnostics/self_run_filter.json`，要求下一步只使用过滤后的 4 个业务 session。