# 💡 Summary - BiGRU: 传统 RNN 的改进版(2014年) - BERT: 基于 Transformer 的预训练模型(2018年) - BERT 比 BiGRU 强大得多,但也慢得多 # 🧩 Cues # 🪞Notes