# Summary - **症状**:日志、指标、追踪“三件套”齐了,但**高基数**指标爆卡、日志无法关联、追踪采样盲区大。 - **自检**:是否有**围绕 SLO 的报警**(避免告警雪崩),能从一次 500 错误追到具体依赖链路与 commit? - **补救**:设计**低基数高价值**指标,SLO 驱动告警门槛与回溯窗口。[Google SRE](https://sre.google/workbook/alerting-on-slos/?utm_source=chatgpt.com) 1. [[路线维度水印码溯源]] 2. [[四渡赤水-历史会话]] # Cues # Notes