# 💡 Summary
CRF 的本质:**处理序列标注问题,且标签之间有约束关系**
**CRF = Conditional Random Field (条件随机场)**
Conditional (条件的)
↓ 基于观测序列(输入句子)来预测
Random Field (随机场)
↓ 标签之间有关联,形成一个"场"
合起来:在给定输入句子的条件下,对标签序列建模
## 场景
典型场景:
🏆 NER (命名实体识别) - 最经典
🏆 中文分词 - 必备技术
🏆 槽位填充 - 对话系统核心
⭐ 词性标注
⭐ 图像分割
⭐ 基因序列标注
## LLM 与 CRF
📚 学术界(追求 SOTA):
2018年前: BiLSTM-CRF 称霸 NER
2019-2021年: BERT+CRF 横扫榜单
2022年后: GPT/LLaMA 刷新记录
现在: CRF 论文越来越少 ❌
🏭 工业界(追求性价比):
现在: CRF 依然在大量使用 ✅
原因: 成本、速度、可控性
```Java
案例: 电商评论实体提取
任务量: 每天 1000万 条评论
需求: 提取商品名、品牌、属性
# 用 LLM
成本: 1000万 × 0.001元 = 1万元/天 = 365万元/年 💸
速度: 需要大量 GPU 资源
# 用 BERT+CRF
成本: 几台 CPU 服务器,~5万元/年 ✅
速度: 实时处理无压力
结论: CRF 完胜
```
## [[LAC]] vs BERT+CRF
通用场景: LAC 更好 ✅
特定领域: BERT+CRF 更好 ✅
追求极致准确率: BERT+CRF 更好 ✅
快速上手: LAC 更好 ✅
生产部署: LAC 更好 ✅
```Java
B = Begin (开始)
↓ 实体的第一个字/词
I = Inside (内部)
↓ 实体的中间和最后的字/词
O = Outside (外部)
↓ 非实体
句子: 我 在 北 京 工 作
标注: O O B I O O
| | |____| | |
非 非 北京 非 非
实 实 (地名) 实 实
体 体 体 体
```
# 🧩 Cues
# 🪞Notes