# 💡 Summary CRF 的本质:**处理序列标注问题,且标签之间有约束关系** **CRF = Conditional Random Field (条件随机场)** Conditional (条件的) ↓ 基于观测序列(输入句子)来预测 Random Field (随机场) ↓ 标签之间有关联,形成一个"场" 合起来:在给定输入句子的条件下,对标签序列建模 ## 场景 典型场景: 🏆 NER (命名实体识别) - 最经典 🏆 中文分词 - 必备技术 🏆 槽位填充 - 对话系统核心 ⭐ 词性标注 ⭐ 图像分割 ⭐ 基因序列标注 ## LLM 与 CRF 📚 学术界(追求 SOTA): 2018年前: BiLSTM-CRF 称霸 NER 2019-2021年: BERT+CRF 横扫榜单 2022年后: GPT/LLaMA 刷新记录 现在: CRF 论文越来越少 ❌ 🏭 工业界(追求性价比): 现在: CRF 依然在大量使用 ✅ 原因: 成本、速度、可控性 ```Java 案例: 电商评论实体提取 任务量: 每天 1000万 条评论 需求: 提取商品名、品牌、属性 # 用 LLM 成本: 1000万 × 0.001元 = 1万元/天 = 365万元/年 💸 速度: 需要大量 GPU 资源 # 用 BERT+CRF 成本: 几台 CPU 服务器,~5万元/年 ✅ 速度: 实时处理无压力 结论: CRF 完胜 ``` ## [[LAC]] vs BERT+CRF 通用场景: LAC 更好 ✅ 特定领域: BERT+CRF 更好 ✅ 追求极致准确率: BERT+CRF 更好 ✅ 快速上手: LAC 更好 ✅ 生产部署: LAC 更好 ✅ ```Java B = Begin (开始) ↓ 实体的第一个字/词 I = Inside (内部) ↓ 实体的中间和最后的字/词 O = Outside (外部) ↓ 非实体 句子: 我 在 北 京 工 作 标注: O O B I O O | | |____| | | 非 非 北京 非 非 实 实 (地名) 实 实 体 体 体 体 ``` # 🧩 Cues # 🪞Notes