# 💡 Summary
# 🧩 Cues
# 🪞Notes
## **Data Drift(数据漂移)是什么?**
**数据漂移**指的是模型在生产环境中接收到的**输入数据分布**与**训练时的数据分布**发生了变化。
简单类比:你训练模型时用的是"夏天的数据",但上线后遇到的是"冬天的数据",数据的统计特性变了。
## **数据漂移的类型**
### **1. Covariate Drift (协变量漂移)**
- **定义**: 输入特征 X 的分布改变了,但 Y|X 的关系没变
- **例子**:
- 电商推荐系统:疫情期间用户购物习惯突然改变
- 贷款审批模型:经济衰退导致申请人收入分布下降
### **2. Concept Drift (概念漂移)**
- **定义**: X 和 Y 之间的关系改变了
- **例子**:
- 垃圾邮件检测:垃圾邮件制造者改变了策略
- 信用评分:某个特征(如职业)与违约的关系随时代改变
### **3. Label Drift (标签漂移)**
- **定义**: 输出 Y 的分布改变了
- **例子**:
- 医疗诊断:某种疾病的患病率季节性变化
- 欺诈检测:欺诈交易占比突然上升