# 💡 Summary
这是个**“两个相近缩写概念的边界区分”**的经典问题变体。
- **OCR(Optical Character Recognition,光学字符识别)**
目标:把图片/扫描件里的**文字**识别成可编辑文本。
典型输入:书页、截图、PDF 扫描。
典型输出:纯文本或带排版的文本(Word/可搜索PDF)。
难点:字体、模糊、倾斜、版面、多语言、手写体。
- **OMR(Optical Music Recognition,光学乐谱识别)**
目标:把图片/扫描件里的**乐谱符号**识别成结构化的音乐数据。
典型输入:五线谱/简谱的扫描图或照片。
典型输出:MusicXML / MIDI / ABC(或软件内部的谱面结构)。
难点:不只是“认符号”,还要理解**音乐结构关系**:
- 音符头与符杆/符尾的连接
- 多声部叠在同一谱表
- 连线、延音线、装饰音、反复记号
- 小节/节拍对齐、跨小节连音
- 版面噪声(印刷瑕疵、拍照变形)
一句话:**OCR 读“字”,OMR 读“谱”。**
(顺带一提:很多 OMR 系统内部也会用 OCR 去识别歌词、速度术语、力度文字等。)
# 🧩 Cues
# 🪞Notes