# Summary
**选****1001****篇帖子作为****benchmark****。** **模型成本不能超过三倍** **就超过人工了**
**name****节点应该是个独立****POI****点**
**input****是帖子原文** **能给我生成那样的表格**
**这次提取任务额外标记是否适合本地人。****c****端标签** **本地人**
# Cues
[四渡赤水-帖子分类](四渡赤水-帖子分类.md)
# Notes
| 模型 | 耗时(s) | Day 1 | Day 2 | Day 3 | Day 4 | Day 5 | Day 6 | Day 7 | Day 8 |
| --------------------- | ------ | ---------------------- | ------------------------- | -------------------------- | ---------------------------------- | ----------- | ---------------------------------------------- | ----- | ----------- |
| GPT-5 | 128.38 | 乌鲁木齐机场-南门地铁站附近酒店-国际大巴扎 | S21 沙漠公路-克拉美丽沙漠公园-布尔津市区酒店 | 禾木景区-桥头站-禾木桥-白桦林-美丽峰-禾木小木屋 | 喀纳斯景区-喀纳斯老村-喀纳斯湖-神仙湾-月亮湾-卧龙湾-布尔津酒店 | 乌尔禾胡杨林-奎屯酒店 | 赛里木湖-亲水滩-克乐涌珠-松树头-S弯公路-金花紫卉-克勒涌珠-点将台-十里长堤-博乐酒店 | | |
| GPT-5 Chat | 48.78 | 国际大巴扎 | 克拉美丽沙漠公园 | 禾木景区 | 喀纳斯景区 | 乌尔禾胡杨林 | 赛里木湖 | 博乐市 | 乌鲁木齐 |
| GPT-4.1 Nano | 20.13 | 乌鲁木齐机场-国际大巴扎 | S21沙漠公路-克拉美丽沙漠公园-布尔津市区酒店 | 禾木景区-禾木小木屋 | 喀纳斯景区 | 乌尔禾胡杨林 | 赛里木湖 | 博乐火车站 | 乌鲁木齐机场 |
| GPT-4o Mini | 28.13 | 错误 | 错误 | 错误 | 错误 | 错误 | 错误 | 错误 | 错误 |
| GPT-4o | 49.78 | 国际大巴扎 | 克拉美丽沙漠公园 | 禾木景区 | 喀纳斯景区 | 乌尔禾胡杨林 | 赛里木湖 | | |
| DeepSeek V3.1 | 182.30 | 乌鲁木齐机场-南门地铁站附近酒店-国际大巴扎 | S21沙漠公路-克拉美丽沙漠公园-布尔津市区酒店 | 禾木景区-禾木小木屋 | 喀纳斯景区-布尔津酒店 | 乌尔禾胡杨林-奎屯酒店 | 赛里木湖-松树头-S弯公路-金花紫卉-克勒涌珠-点将台-十里长堤-博乐酒店 | 乌鲁木齐 | 广州 |
| DeepSeek r1 | 54.30 | 国际大巴扎 | S21沙漠公路-克拉美丽沙漠公园 | 禾木景区 | 喀纳斯景区 | 乌尔禾胡杨林 | 赛里木湖 | | |
| Gemini 2.5 Flash | 11.99 | 国际大巴扎 | S21沙漠公路-克拉美丽沙漠公园-布尔津 | 禾木景区-禾木小木屋 | 喀纳斯景区-布尔津 | 乌尔禾胡杨林-奎屯 | 赛里木湖-博乐 | 乌鲁木齐 | 乌鲁木齐地窝堡国际机场 |
| Gemini 2.5 Flash Lite | 9.47 | 国际大巴扎 | S21沙漠公路-克拉美丽沙漠公园 | 禾木景区 | 喀纳斯景区 | 乌尔禾胡杨林 | 赛里木湖 | 乌鲁木齐 | 乌鲁木齐 |
| | | | | | | | | | |
| | | | | | | | | | |
## 模型性能综合对比表
| 排名 | 模型 | 还原度 | 速度 (tps) | 成本 ($) | 推荐度 |
| --- | ----------------- | ----------- | -------- | ------- | ------- |
| 1 | **GPT-5** | ⭐⭐⭐⭐⭐ (95%) | 29.2 | 0.109 | 质量最佳 |
| 2 | **DeepSeek V3.1** | ⭐⭐⭐⭐ (80%) | 17.3 | 0.00416 | 高性价比 |
| 3 | **GPT-4.1 Nano** | ⭐⭐⭐ (75%) | 167.8 | 0.00124 | �� 速度之王 |
| 4 | **GPT-5 Nano** | ⭐⭐⭐⭐ (85%) | 178.8 | 0.00764 | ⭐ 平衡选择 |
| 5 | **GPT-4o Mini** | ⭐⭐⭐ (70%) | 57.6 | 0.00167 | ⭐ 经济实用 |
| 6 | **GPT-4o** | ⭐⭐⭐ (70%) | 81.6 | 0.0165 | ⭐ 中等选择 |
| 7 | **DeepSeek r1** | ⭐⭐⭐ (65%) | 37.0 | 0.00571 | ⭐ 备选方案 |
## 详细分析
### �� **最佳选择:GPT-5**
- **优势**:还原度最高(95%),信息完整性最好
- **适用场景**:对准确性要求极高的生产环境
- **成本**:相对较高但质量保证
### 🥈 **高性价比:DeepSeek V3.1**
- **优势**:成本极低($0.00416),还原度良好(80%)
- **适用场景**:大规模批量处理,成本敏感场景
- **性价比**:19.2分,成本效益最佳
### �� **速度之王:GPT-4.1 Nano**
- **优势**:速度最快(167.8 tps),成本极低
- **适用场景**:实时处理,对速度要求极高的场景
- **注意**:还原度相对较低(75%)
### ⭐ **平衡选择:GPT-5 Nano**
- **优势**:还原度较高(85%),速度很快(178.8 tps)
- **适用场景**:需要平衡质量和速度的场景
- **性价比**:11.1分,综合表现良好
## 选择建议
### �� **按需求选择:**
1. **追求极致准确性** → GPT-5
2. **成本敏感** → DeepSeek V3.1
3. **速度优先** → GPT-4.1 Nano
4. **平衡性能** → GPT-5 Nano
5. **经济实用** → GPT-4o Mini
### �� **性价比评分说明:**
- 计算公式:`还原度 × 速度 / 成本`
- 分数越高表示性价比越好
- DeepSeek V3.1 在成本控制方面表现突出
- GPT-4.1 Nano 在速度方面表现最佳
### �� **实际应用建议:**
- **生产环境**:推荐 GPT-5(质量优先)
- **开发测试**:推荐 DeepSeek V3.1(成本优先)
- **实时应用**:推荐 GPT-4.1 Nano(速度优先)
- **平衡场景**:推荐 GPT-5 Nano(综合最优)