# 💡 Summary # 🧩 Cues # 🪞Notes ## **Data Drift(数据漂移)是什么?** **数据漂移**指的是模型在生产环境中接收到的**输入数据分布**与**训练时的数据分布**发生了变化。 简单类比:你训练模型时用的是"夏天的数据",但上线后遇到的是"冬天的数据",数据的统计特性变了。 ## **数据漂移的类型** ### **1. Covariate Drift (协变量漂移)** - **定义**: 输入特征 X 的分布改变了,但 Y|X 的关系没变 - **例子**: - 电商推荐系统:疫情期间用户购物习惯突然改变 - 贷款审批模型:经济衰退导致申请人收入分布下降 ### **2. Concept Drift (概念漂移)** - **定义**: X 和 Y 之间的关系改变了 - **例子**: - 垃圾邮件检测:垃圾邮件制造者改变了策略 - 信用评分:某个特征(如职业)与违约的关系随时代改变 ### **3. Label Drift (标签漂移)** - **定义**: 输出 Y 的分布改变了 - **例子**: - 医疗诊断:某种疾病的患病率季节性变化 - 欺诈检测:欺诈交易占比突然上升