# Summary **选****1001****篇帖子作为****benchmark****。** **模型成本不能超过三倍** **就超过人工了** **name****节点应该是个独立****POI****点** **input****是帖子原文** **能给我生成那样的表格** **这次提取任务额外标记是否适合本地人。****c****端标签** **本地人** # Cues [四渡赤水-帖子分类](四渡赤水-帖子分类.md) # Notes | 模型 | 耗时(s) | Day 1 | Day 2 | Day 3 | Day 4 | Day 5 | Day 6 | Day 7 | Day 8 | | --------------------- | ------ | ---------------------- | ------------------------- | -------------------------- | ---------------------------------- | ----------- | ---------------------------------------------- | ----- | ----------- | | GPT-5 | 128.38 | 乌鲁木齐机场-南门地铁站附近酒店-国际大巴扎 | S21 沙漠公路-克拉美丽沙漠公园-布尔津市区酒店 | 禾木景区-桥头站-禾木桥-白桦林-美丽峰-禾木小木屋 | 喀纳斯景区-喀纳斯老村-喀纳斯湖-神仙湾-月亮湾-卧龙湾-布尔津酒店 | 乌尔禾胡杨林-奎屯酒店 | 赛里木湖-亲水滩-克乐涌珠-松树头-S弯公路-金花紫卉-克勒涌珠-点将台-十里长堤-博乐酒店 | | | | GPT-5 Chat | 48.78 | 国际大巴扎 | 克拉美丽沙漠公园 | 禾木景区 | 喀纳斯景区 | 乌尔禾胡杨林 | 赛里木湖 | 博乐市 | 乌鲁木齐 | | GPT-4.1 Nano | 20.13 | 乌鲁木齐机场-国际大巴扎 | S21沙漠公路-克拉美丽沙漠公园-布尔津市区酒店 | 禾木景区-禾木小木屋 | 喀纳斯景区 | 乌尔禾胡杨林 | 赛里木湖 | 博乐火车站 | 乌鲁木齐机场 | | GPT-4o Mini | 28.13 | 错误 | 错误 | 错误 | 错误 | 错误 | 错误 | 错误 | 错误 | | GPT-4o | 49.78 | 国际大巴扎 | 克拉美丽沙漠公园 | 禾木景区 | 喀纳斯景区 | 乌尔禾胡杨林 | 赛里木湖 | | | | DeepSeek V3.1 | 182.30 | 乌鲁木齐机场-南门地铁站附近酒店-国际大巴扎 | S21沙漠公路-克拉美丽沙漠公园-布尔津市区酒店 | 禾木景区-禾木小木屋 | 喀纳斯景区-布尔津酒店 | 乌尔禾胡杨林-奎屯酒店 | 赛里木湖-松树头-S弯公路-金花紫卉-克勒涌珠-点将台-十里长堤-博乐酒店 | 乌鲁木齐 | 广州 | | DeepSeek r1 | 54.30 | 国际大巴扎 | S21沙漠公路-克拉美丽沙漠公园 | 禾木景区 | 喀纳斯景区 | 乌尔禾胡杨林 | 赛里木湖 | | | | Gemini 2.5 Flash | 11.99 | 国际大巴扎 | S21沙漠公路-克拉美丽沙漠公园-布尔津 | 禾木景区-禾木小木屋 | 喀纳斯景区-布尔津 | 乌尔禾胡杨林-奎屯 | 赛里木湖-博乐 | 乌鲁木齐 | 乌鲁木齐地窝堡国际机场 | | Gemini 2.5 Flash Lite | 9.47 | 国际大巴扎 | S21沙漠公路-克拉美丽沙漠公园 | 禾木景区 | 喀纳斯景区 | 乌尔禾胡杨林 | 赛里木湖 | 乌鲁木齐 | 乌鲁木齐 | | | | | | | | | | | | | | | | | | | | | | | ## 模型性能综合对比表 | 排名 | 模型 | 还原度 | 速度 (tps) | 成本 ($) | 推荐度 | | --- | ----------------- | ----------- | -------- | ------- | ------- | | 1 | **GPT-5** | ⭐⭐⭐⭐⭐ (95%) | 29.2 | 0.109 | 质量最佳 | | 2 | **DeepSeek V3.1** | ⭐⭐⭐⭐ (80%) | 17.3 | 0.00416 | 高性价比 | | 3 | **GPT-4.1 Nano** | ⭐⭐⭐ (75%) | 167.8 | 0.00124 | �� 速度之王 | | 4 | **GPT-5 Nano** | ⭐⭐⭐⭐ (85%) | 178.8 | 0.00764 | ⭐ 平衡选择 | | 5 | **GPT-4o Mini** | ⭐⭐⭐ (70%) | 57.6 | 0.00167 | ⭐ 经济实用 | | 6 | **GPT-4o** | ⭐⭐⭐ (70%) | 81.6 | 0.0165 | ⭐ 中等选择 | | 7 | **DeepSeek r1** | ⭐⭐⭐ (65%) | 37.0 | 0.00571 | ⭐ 备选方案 | ## 详细分析 ### �� **最佳选择:GPT-5** - **优势**:还原度最高(95%),信息完整性最好 - **适用场景**:对准确性要求极高的生产环境 - **成本**:相对较高但质量保证 ### 🥈 **高性价比:DeepSeek V3.1** - **优势**:成本极低($0.00416),还原度良好(80%) - **适用场景**:大规模批量处理,成本敏感场景 - **性价比**:19.2分,成本效益最佳 ### �� **速度之王:GPT-4.1 Nano** - **优势**:速度最快(167.8 tps),成本极低 - **适用场景**:实时处理,对速度要求极高的场景 - **注意**:还原度相对较低(75%) ### ⭐ **平衡选择:GPT-5 Nano** - **优势**:还原度较高(85%),速度很快(178.8 tps) - **适用场景**:需要平衡质量和速度的场景 - **性价比**:11.1分,综合表现良好 ## 选择建议 ### �� **按需求选择:** 1. **追求极致准确性** → GPT-5 2. **成本敏感** → DeepSeek V3.1 3. **速度优先** → GPT-4.1 Nano 4. **平衡性能** → GPT-5 Nano 5. **经济实用** → GPT-4o Mini ### �� **性价比评分说明:** - 计算公式:`还原度 × 速度 / 成本` - 分数越高表示性价比越好 - DeepSeek V3.1 在成本控制方面表现突出 - GPT-4.1 Nano 在速度方面表现最佳 ### �� **实际应用建议:** - **生产环境**:推荐 GPT-5(质量优先) - **开发测试**:推荐 DeepSeek V3.1(成本优先) - **实时应用**:推荐 GPT-4.1 Nano(速度优先) - **平衡场景**:推荐 GPT-5 Nano(综合最优)