CRF（序列标注） - 𓀚 转了码的刘公子

# 💡 Summary CRF 的本质：**处理序列标注问题，且标签之间有约束关系** **CRF = Conditional Random Field (条件随机场)** Conditional (条件的) ↓ 基于观测序列（输入句子）来预测 Random Field (随机场) ↓ 标签之间有关联，形成一个"场" 合起来：在给定输入句子的条件下，对标签序列建模 ## 场景典型场景: 🏆 NER (命名实体识别) - 最经典 🏆 中文分词 - 必备技术 🏆 槽位填充 - 对话系统核心 ⭐ 词性标注 ⭐ 图像分割 ⭐ 基因序列标注 ## LLM 与 CRF 📚 学术界（追求 SOTA）: 2018年前: BiLSTM-CRF 称霸 NER 2019-2021年: BERT+CRF 横扫榜单 2022年后: GPT/LLaMA 刷新记录现在: CRF 论文越来越少 ❌ 🏭 工业界（追求性价比）: 现在: CRF 依然在大量使用 ✅ 原因: 成本、速度、可控性 ```Java 案例: 电商评论实体提取任务量: 每天 1000万条评论需求: 提取商品名、品牌、属性 # 用 LLM 成本: 1000万 × 0.001元 = 1万元/天 = 365万元/年 💸 速度: 需要大量 GPU 资源 # 用 BERT+CRF 成本: 几台 CPU 服务器，~5万元/年 ✅ 速度: 实时处理无压力结论: CRF 完胜 ``` ## [[LAC]] vs BERT+CRF 通用场景: LAC 更好 ✅ 特定领域: BERT+CRF 更好 ✅ 追求极致准确率: BERT+CRF 更好 ✅ 快速上手: LAC 更好 ✅ 生产部署: LAC 更好 ✅ ```Java B = Begin (开始) ↓ 实体的第一个字/词 I = Inside (内部) ↓ 实体的中间和最后的字/词 O = Outside (外部) ↓ 非实体句子: 我在北京工作标注: O O B I O O | | |____| | | 非非北京非非实实 (地名) 实实体体体体 ``` # 🧩 Cues # 🪞Notes