意图识别 - 𓀚 转了码的刘公子

# Notes ## 训练方式 - **数据 < 500条**：用 SetFit（few-shot 学习） - **数据 500-2000条**：标准 BERT 微调 - **数据 > 2000条**：BERT + 对比学习 + 难例挖掘 ## 多意图怎么办 ### 如果数据标注资源充足 → 使用**主次意图分类**（方案2） - 对客服响应策略更友好 - 可以按主意图路由到不同处理流程 ### 如果数据标注资源有限 → 使用**多标签分类**（方案1） - 只需标注"这句话涉及哪些意图" - 不需要区分主次关系 | 意图ID | 意图名称 (中文) | 意图名称 (英文) | 核心场景 | 描述 | |:--- |:-------- |:----------------------------- |:---- |:--------------------- | | 1 | 查询航班 | Flight_Search | 机票预订 | 询问特定日期、地点之间的航班信息。| | 2 | 预订航班 | Flight_Book | 机票预订 | 明确表示要预订已查询的航班。| | 3 | 更改航班 | Flight_Change | 机票预订 | 询问或要求修改已有的航班订单。| | 4 | 取消航班 | Flight_Cancel | 机票预订 | 询问或要求取消已有的航班订单。| | 5 | 查询退改政策 | Flight_Policy_Inquiry | 机票预订 | 询问航班的退票和改签规则。| | 6 | 询问行李额 | Flight_Baggage_Inquiry | 机票预订 | 询问特定航线或舱位的行李携带限制。| | 7 | 办理值机 | Flight_Checkin_Request | 机票预订 | 询问如何进行在线值机。| | 8 | 查询酒店 | Hotel_Search | 酒店预订 | 询问特定城市、日期、人数的酒店信息。| | 9 | 预订酒店 | Hotel_Book | 酒店预订 | 明确表示要预订已查询的酒店。| | 10 | 更改酒店 | Hotel_Change | 酒店预订 | 询问或要求修改已有的酒店订单。| | 11 | 取消酒店 | Hotel_Cancel | 酒店预订 | 询问或要求取消已有的酒店订单。| | 12 | 询问设施 | Hotel_Amenity_Inquiry | 酒店预订 | 询问酒店是否提供特定设施（如泳池、健身房）。| | 13 | 询问入住/退房时间 | Hotel_Checkin_Time_Inquiry | 酒店预订 | 询问酒店的入住和退房时间。| | 14 | 查询景点 | Activity_Search | 旅游/景点 | 询问特定地点或类型的旅游活动或景点。| | 15 | 预订景点门票 | Activity_Book | 旅游/景点 | 明确表示要预订景点门票或活动。| | 16 | 更改活动订单 | Activity_Change | 旅游/景点 | 询问或要求修改已有的活动订单。| | 17 | 取消活动订单 | Activity_Cancel | 旅游/景点 | 询问或要求取消已有的活动订单。| | 18 | 询问旅游攻略 | Activity_Guide_Inquiry | 旅游/景点 | 询问目的地的旅游建议或行程规划。| | 19 | 查询订单状态 | Order_Status_Inquiry | 订单管理 | 询问特定订单的当前状态（如已确认、待支付）。| | 20 | 询问支付方式 | Order_Payment_Inquiry | 订单管理 | 询问支持的支付方式。| | 21 | 申请发票/报销凭证 | Order_Invoice_Request | 订单管理 | 要求开具发票或提供报销凭证。| | 22 | 投诉/反馈 | Order_Complaint | 订单管理 | 对服务或产品表示不满或提供反馈。| | 23 | 询问客服联系方式 | Order_Contact_Support | 订单管理 | 询问如何联系人工客服。| | 24 | 感谢/赞扬 | General_Gratitude | 通用/辅助 | 对机器人的帮助表示感谢。| | 25 | 问候/开始对话 | General_Greeting | 通用/辅助 | 开始对话，如“你好”、“在吗”。| | 26 | 告别/结束对话 | General_Farewell | 通用/辅助 | 结束对话，如“再见”、“谢谢”。| | 27 | 肯定/确认 | General_Affirmation | 通用/辅助 | 对机器人的提问表示“是”、“对”。| | 28 | 否定/拒绝 | General_Negation | 通用/辅助 | 对机器人的提问表示“否”、“不对”。| | 29 | 询问机器人能力 | General_Capability_Inquiry | 通用/辅助 | 询问机器人能做什么。| | 30 | 寻求帮助 | General_Help | 通用/辅助 | 表达需要帮助，但未指明具体意图。| | 31 | 询问价格 | General_Price_Inquiry | 通用/辅助 | 询问任何产品或服务的价格。| | 32 | 询问天气 | General_Weather_Inquiry | 通用/辅助 | 询问特定城市的天气情况。| | 33 | 询问时间/日期 | General_Time_Date_Inquiry | 通用/辅助 | 询问当前时间或特定日期。| | 34 | 询问促销/优惠 | General_Promotion_Inquiry | 通用/辅助 | 询问是否有折扣或优惠活动。| | 35 | 询问签证要求 | General_Visa_Inquiry | 通用/辅助 | 询问特定国家或地区的签证要求。| | 36 | 询问货币汇率 | General_Currency_Inquiry | 通用/辅助 | 询问货币兑换汇率。| | 37 | 询问交通方式 | General_Transportation_Inquiry | 通用/辅助 | 询问如何从A地到B地。| | 38 | 询问会员权益 | General_Membership_Inquiry | 通用/辅助 | 询问会员等级或权益。| | 39 | 闲聊/非任务对话 | General_ChitChat | 通用/辅助 | 任何与旅行任务无关的闲聊内容。| | 40 | 意图不明确/噪音 | General_Out_of_Scope | 通用/辅助 | 无法识别或意义不明的输入。| 这是“为 AI Chat 设计意图体系（Intent Taxonomy）”的经典问题变体。 # 1) 核心设计原则（一眼就能落地） - **以动作为中心**：每个意图都要能触发一类明确的后端动作（API/工作流），否则宁可做实体或对话行为（dialog act），不要做意图。 - **互斥且可穷举（尽量 MECE）**：同一层级下尽量互斥；漏斗底端用 **OOS/拒识** 承接“不可归类”的表达。 - **粒度以“页面或接口”为度**：能对应到一个页面、一个服务或一个策略单元的粒度，既不过粗（全都归“咨询”），也不过细（把“晚到”“早到”拆成两个顶层意图）。 - **可观测、可评估**：意图必须能以**Macro-F1/per-class F1**、**延迟/吞吐**、**拒识指标**进行稳定评估。 - **演进有版本**：给意图体系加 **schema 版本号**，保持向后兼容（旧模型/历史数据可映射）。 # 2) 别把这些误当“意图” - **实体/槽位（slots）**：城市、日期、人数、价位、星级、航段等属于实体，不是意图。 - **对话行为**：感谢、问候、澄清、追问、确认、拒绝等是 **dialog acts**，不等于“业务意图”。 - **情绪与语气**：情绪（愤怒/焦虑）应作为**特征**或“客服路由信号”，不要混入意图标签。 - **渠道元信息**：来自 App/H5/呼叫中心等，是样本切片标签，而非意图。 # 3) 三层结构与命名规范 - **域（domain）→ 意图（intent）→ 子意图（sub_intent）** - 命名：`domain_intent[_sub]`；英文下划线小写；动作动词优先（search/book/cancel/modify/query…） - 示例（OTA 酒店域）： - `hotel_search` → `sub_intent`: `nearby_poi`, `by_price`, `by_star` - `hotel_book` → `prepay_hold`, `with_breakfast` - `hotel_modify` → `extend_stay`, `change_guest`, `change_bed` - `hotel_cancel` → `free_cancel`, `waive_fee` # 4) 多意图/复合意图策略 - **解析策略**（按业务强度从强到弱）： 1. **多头预测**：允许一句话触发多个意图（如“查+订”），后端做**顺序编排**； 2. **主-从拆解**：先判主意图（如 `hotel_search`），再以规则或小模型抽“伴随意图”（`price_alert`）。 - 规定**并发/串行**：如“先搜→再订”，串行落地；“比价+订阅提醒”，并行落地。 # 5) OOS/拒识与澄清 - 预留 **OOS** 超类，线上用 **双阈值**（`τ_low` 拒答兜底，`τ_high` 直接应答，中间走澄清）。 - 为“易混意图对”准备**澄清模板**： - 退款 vs 取消： - “你是想**取消未入住的订单**，还是**对已扣款发起退款**？”（附订单号候选） # 6) 上下文与会话态 - **意图解析 ≠ 槽位齐全**：缺槽位走**slot-filling**补齐（时间、地点、人数/乘客等）。 - **会话状态机**：为关键链路（订、改、退、赔）设计状态机（`SELECT_ITEM → CONFIRM → PAY → ISSUE`），在每步允许**自然语言跳转**与**回退**。 # 7) 数据与标注规范（避免脏标签） - **一条样本 = 一次可执行请求**；复合请求按策略拆分或标注“主/伴随”。 - **难例切片**：错别字、口语、ASR 噪声、中英混杂、数字与时间歧义、多语言。 - **一致性检查**：同一句子多标员一致率（κ 值）< 0.8 的类目重新定义边界或并类。 # 8) 评测与门槛（用于“能否上线”） - 总体：Macro-F1（ID）≥ **0.92**；关键 Top-10 类 **F1≥0.95**、不得低于 0.92； - OOS：AUROC ≥ **0.97**；FPR@95%TPR ≤ **5%**； - 性能：P95 延迟（纯 NLU）**≤80ms**（CPU）/ **≤40ms**（GPU）； - 看板：分版本对比、OOS 曲线、**混淆热力图（Top-30 类）**、多切片（渠道/语言/长度/ASR-WER）监控。 # 9) 多语言与语音入口 - 多语言优先 **共享 schema** + 语言特定实体辞典（地名/品牌/俗称），跨语蒸馏到 **XLM-R/mDeBERTa**。 - 语音场景：建 **ASR-WER 桶** 评测；文本侧对**数字、时间、货币**做鲁棒正则化（“两千五”“2k5”“$2,500”→标准数值）。 # 10) 与工具路由（Tooling）的边界 - 意图到 **动作映射表**（playbook）： - `hotel_search` → `SearchHotelAPI`（必需槽：`city|poi|date_range`） - `hotel_book` → `CreateOrderAPI`（必需槽：`hotel_id|room_id|checkin|nights|guests`） - `order_status` → `GetOrderStatusAPI`（必需槽：`order_id`） - 缺槽位 → 走 **澄清问句模板**，并把澄清结果写回上下文。 --- ## OTA 起步意图清单（可直接用） **Hotel**：`hotel_search`, `hotel_book`, `hotel_cancel`, `hotel_modify`, `hotel_refund_query`, `policy_query`, `property_amenities`, `checkin_checkout`, `location_directions` **Flight/Train**：`flight_search`, `flight_change`, `flight_refund`, `train_search` **Order/Payment**：`order_status`, `invoice_request`, `coupon_query`, `payment_issue`, `price_alert` **Service**：`customer_service_contact`, `complaint`, `give_feedback` **General**：`chitchat`, `fallback_noise`, `oos` --- ## 样例 Schema（JSON） ```json { "schema_version": "v1.3.0", "utterance": "上海本周五到周日两晚，近地铁，500以内", "domain": "hotel", "intent": "hotel_search", "sub_intent": "by_price_nearby", "entities": { "city": "上海", "checkin": "2025-10-31", "nights": 2, "budget_max": 500, "nearby": "地铁" }, "dialog_act": "inform", "confidence": 0.91, "oos_score": 0.07, "context": { "channel": "app", "locale": "zh-CN", "session_id": "abc123" } } ``` --- ## 上线前 Checklist（压到可执行） 1. 意图-动作映射表完整，**必需槽位**定义清晰 2. 离线 Macro-F1 / per-class F1 / OOS 指标达标；Top-30 混淆对人工过样 3. 澄清模板覆盖易混意图对（改/退/退款、成人/儿童、发票类型） 4. 线上阈值与兜底策略（双阈值、转人工、重试流水线） 5. 分桶监控与告警（渠道/语言/ASR-WER/节假日） 6. 版本与回滚：`v_prev ↔ v_new` 映射、灰度策略、成本与延迟压测通过需要的话，我可以把上述**意图清单+映射表+澄清模板**打成一份可导入你们标注平台/配置中心的 **CSV/JSON 套件**，再配一个 Notebook 生成分版本对比、OOS 曲线和混淆热力图，方便你们做首次上线评审。上线标准 # 一、上线“硬门槛”（建议值，适用于 DeBERTa-v3-large / RoBERTa-large 微调的意图识别） > 面向 OTA 业务，一般用 **Macro-F1** 作为总指标，并对关键意图做 **per-class F1** 把关，同时校验 OOS（拒识）能力与在线性能。 |维度|指标与口径|建议生产阈值（文本入口）|说明| |---|---|--:|---| |总体分类|Macro-F1（ID 类）|**≥ 0.92**|长尾多类时 0.90 是最低红线；0.94+ 进入“稳健”。| |关键意图|per-class F1（如“下单/改期/退款/支付异常/人工”）|**≥ 0.95**（Top-10 关键类）；任一关键类**不得低于 0.92**|关键路径要更严。| |长尾类|per-class F1@support<0.5%|**≥ 0.80** 或标注为“可回退/兜底”|结合置信度或少样本增强策略。| |OOS 拒识|AUROC（ID vs OOS）|**≥ 0.97**|以验证集/领域 OOS 合成集联合评估。| |OOS 拒识|FPR@95%TPR（ID 召回 95% 下的误接收率）|**≤ 5%**（理想 ≤ 3%）|业务高风险时更严。| |置信拒答|Coverage@Precision≥0.98（只在高置信时作答的覆盖率）|**≥ 70%**|余量走“兜底/人工”。| |延迟|P95 模型推理时延|**≤ 80 ms**（CPU/小 batch）；GPU ≤ 40 ms|仅 NLU，不含 ASR。| |吞吐|线上每核 QPS|**≥ 30**（CPU，FP16/INT8 优化后可翻倍）|视部署而定。| |稳定性|漂移监控（分桶 Macro-F1 与 OOS 指标波动）|**7 天内波动 ≤ 1.5pp**|数据分布、节假日流量切片监控。| > 语音入口（ASR→NLU）可放宽 Macro-F1 约 1–2pp，或在看板上单列“ASR-WER≥X 切片”的指标门槛。 # 二、分版本对比（Release 看板该怎么长）最小必备 4 块： 1. **主面板**：Macro-F1（ID）、AUROC（OOS）、FPR@95%TPR、Coverage@P≥0.98、P50/P95 延迟、成本/千次。 2. **分桶面板**：渠道（App/H5/Callcenter）、语言（zh/en/混合）、文本长度、时段（工作日/节假日）、ASR-WER 桶、错别字强度等。 3. **版本对比**：`v_prev` vs `v_new` 的差值条形图 + 可信区间；关键类 Top-N 的 **per-class F1 瀑布图**。 4. **错误热力图**：真实标签×预测标签（Top-30 混淆对），点击能展开样本与注意力/关键词解释。 **验收规则（示例）** - `ΔMacro-F1 ≥ +0.5pp` 且 **关键类**无下降>0.5pp； - `OOS FPR@95%TPR` 不劣化； - 任一关键类 F1 < 0.92 必须给出改进计划或回退； - 在线 P95 延迟不劣化且容量压测通过。 # 三、OOS 曲线与阈值如何落地 1. 训练时保留 ID 类交叉熵（可配 Focal），输出 **max-softmax** 或 **能量分数**。 2. 验证集上绘制： - **AUROC 曲线**（ID vs OOS）； - **FPR@TPR** 曲线，读出 95%/98% TPR 对应 FPR； - **Precision-Coverage** 曲线，用于“只在高置信作答”的运营策略。 3. 线上使用 **双阈值**： - 低于 `τ_low` → 直接兜底/转人工； - 高于 `τ_high` → 正常应答； - 中间区间走**澄清问句**或**轻量重试**（检索/重打分）。 # 四、错误热力图与质检采样 - 生成 **Confusion Matrix（Top-K 类）**：按样本数归一化，标红“语义近邻”的常错对（如 _退款_↔_取消_、_改期_↔_改签_、_酒店改期_↔_航班改签_）。 - 每个热区**等比抽样**做人工质检（建议每版 ≥ 200 条），输出语言现象标签：错别字、口语化、方言、代码混杂、价格/时间数值型误差、OOS 误接收等。 - 质检闭环形成**数据回灌清单**（难例与对抗样本），用于下版微调与数据增强。 # 五、模型训练与上线配置建议 - **损失**：CE 起步；类不均衡可加 **Focal γ=1–2** 或类权重； - **优化**：AdamW + 余弦退火（3–5 epoch 热身、总 5–8 epoch），AMP 混合精度； - **正则/增强**：R-Drop、Mixout；文本侧做 **拼写扰动、同义改写、ASR 噪声模拟**； - **阈值选择**：以验证集 `FPR@95%TPR` 最优点设 `τ_high`；结合运营成本做 `τ_low`； - **上线流程**：离线过门槛 → 影子流（1–5%）→ 金丝雀（10–20%）→ 全量；每阶段都跑上面的看板卡点。 --- 如果你愿意，我可以把这些门槛和图表模板打包成一个**可直接填数据的评测看板（CSV+Notebook）**，包含： - 版本对比表（per-class F1 差值） - OOS ROC / FPR@TPR 曲线绘制脚本 - 混淆热力图与样本抽样脚本你直接喂入你们当前 `v_prev` 和 `v_new` 的离线推理结果（含 `y_true / y_pred / score`）即可出图与生成评审页。 ![image.png|1000](https://imagehosting4picgo.oss-cn-beijing.aliyuncs.com/imagehosting/fix-dir%2Fpicgo%2Fpicgo-clipboard-images%2F2025%2F09%2F20%2F18-22-44-3d861393958fd1bba6ca2b6c8133b235-202509201822703-41897b.png) - 从项目视角拆解题目，开发独立 IM 系统，打造友好的 AI 交互方式。 - 整合项目群聊与文档信息，通过知识库问答、语义搜索、催办待办、项目进度总结等方式，全方位挖掘项目生命周期中的各种信息价值。 - 追踪社区最新实践，使用 OpenAI、Anthropic、Cerebras 等原生 API 的新特性 - Agent 智能交互解决日常工作中的繁琐操作 - 开发过程从 UI设计、前端、后端、PPT 制作，50% 以上由 AI 助力完成。 # 一、交互 ![image.png|1000](https://imagehosting4picgo.oss-cn-beijing.aliyuncs.com/imagehosting/fix-dir%2Fpicgo%2Fpicgo-clipboard-images%2F2024%2F11%2F10%2F05-05-07-73d413ef83d74ff79e66d96a48d64f92-202411100505954-148d67.png) 1. 输入框输入@Agent 之后的信息触发后端意图识别接口 2. 提取出来的意图显示在图中卡片上，之后槽位信息可以加到卡片上，进一步优化 3. 用了前端 Debounce (防抖)，用户停止输入 800ms 后才调用 API，800ms 可以调整 # 二、整体架构（降级处理还待优化） ```mermaid flowchart TD Input[用户输入] --> RuleEngine[规则引擎] Input --> LLM[大语言模型] subgraph RuleEngine[规则引擎层] R1[正则表达式匹配] --> R2[模板解析] R2 --> R3[规则评分] end subgraph LLM[大语言模型层] L1[意图分类] --> L2[槽位提取] L2 --> L3[置信度评估] end LLM --> Arbitrator Arbitrator --> Output[最终结果] subgraph Fallback[降级处理] F1[规则回退] F2[模型回退] end Arbitrator -.-> Fallback Fallback -.-> Output ``` # 三、实现细节（缓存、错误重试还未实现） ```mermaid flowchart TD Input[用户输入] --> Cache{缓存匹配} Cache -->|命中| CacheResult[返回缓存结果] Cache -->|未命中| Parallel[并行处理] subgraph Parallel[并行处理层] direction TB Rule[规则引擎处理] --> RuleMatch{规则匹配} LLM[LLM处理] --> LLMProcess{LLM解析} end subgraph RuleEngine[规则引擎层] direction TB R1[正则匹配] --> R2[模板解析] R2 --> R3[槽位提取] end subgraph LLMProcess[LLM处理层] direction TB L1[Prompt构造] --> L2[API调用] L2 --> L3[结果解析] end Rule --> RuleEngine LLM --> LLMProcess RuleMatch -->|匹配成功| RuleResult[规则结果] RuleMatch -->|匹配失败| WaitLLM[等待LLM结果] LLMProcess -->|处理成功| LLMResult[LLM结果] LLMProcess -->|超时/错误| Fallback[降级处理] RuleResult --> ResultProcess[结果处理] LLMResult --> ResultProcess ResultProcess --> Cache2[更新缓存] ResultProcess --> Output[返回结果] Fallback --> Output CacheResult --> Output subgraph Optimization[优化策略] direction TB O1[请求去重] O2[批量处理] O3[超时控制] O4[错误重试] end Optimization -.-> Parallel ``` # 四、场景分析 ## 1. 语义搜索 ## 2. 总结内容 or 形成结论槽位里最关键的是起止时间我可以帮你将这些消息按主题和事件进行分类。我会分析消息内容、时间连续性以及参与者之间的对话来进行分组。让我们把它分成几个主要的话题群: 1. 需求开发初期讨论与工时评估 (9月24-25日) - 主要参与者:徐赟哲、崔宇、赵赵力等 - 主要内容:讨论工时评估、接口定义、技术方案等 1. 项目联调与问题修复 (10月8-11日) - 主要参与者:赵赵力、乔路、董威宁、王颖yw等 - 内容: - 接口联调 - bug修复 - 配置调整 - 环境问题处理 1. 项目发布与上线 (10月18日) - 主要参与者:王颖yw、赵赵力、董威宁、刘丽慧等 - 内容: - 发布步骤确认 - 配置检查与修改 - 各模块依次发布 - 发布验证 1. 线上问题跟进与优化 (10月21-29日) - 主要参与者:刘丽慧、赵赵力、蔡创基等 - 内容: - 曝光率监控 - 埋点问题 - 用户反馈问题处理 - 性能优化这种分类可以帮助我们更好地理解整个项目的进展过程,以及在不同阶段遇到的主要问题。每个子群都有其相对独立但又相互关联的主题。你觉得这样的分类方式合理吗？如果需要,我可以针对某个子群做更详细的分析。 ## 3. 进入发布模式 `QA 触发整个群进入发布模式` ```Java "【FD-286154】项目发布中发布类型：prod 开始时间：2024-10-18 14:49:17 appcode：f_athena_order..." "@徐赟哲【即将发布周知】【FD-285952订单详情页二次售卖改版】将于（2024-10-22）发布上线..." "【发布delay】【FD-286155 订单详情页二次售卖改版】未按计划发布时间（2024-10-11）发布..." ``` 1. 测试验证相关: ```Java "发布拦截了快速点下哈" "好的，刚才那个问题他们看下，应该不是本次改动的" "我这边验证好了哈" ``` 1. 配置管理相关: ```Java "@王颖yw 审核一下配置，加了一下新的模块" "这个标签是根据什么维度的" "谨慎操作qconfig" ``` 1. 问题排查相关: ```Java "[obj type="image" value="https://qtalk.qunarzz.com/pp_qtalk_file_0003/f714c57c1cce3f27031df0935d477707.jpg" width=1236 height=628]@蔡创基看下异常？" "CompensateSecondSaleService_getCompensateInfo_param_error_Count]近期有值,但未添加报警..." "qmall有npe我先回滚了" ``` ## 4. 生成项目报告 1. 对于已完成的项目，提取项目过程流水，生成项目过程报告 `响应式生成` or `意图识别` 1. 项目概览：项目名称、项目时长、参与团队、参与人、提出问题数、解决问题数、有效沟通次数 2. 项目流水：人、时间、动作、结果 3. 过程问题：问题描述、提出人、解决人、解决状态、解决时长 4. 项目关键结论：项目群中的关键结论 ## 5. 生成每周回顾基于文档的 commit 的 diff 信息 ## 6. 生成待办、催办过去的群只有两个级别的信息艾特我的和不艾特我的现在我们要借助ai做成三个分个人维度和多人维度甚至群维度 1. 主动 push 别人，`意图识别，强提醒的功能，如果做成响应式，可能会泛滥，所以需要人为触发并点击确认` 2. 主动查看自己，`响应式`or`意图识别` 每个人可以触发找出可能和自己相关的事情 ```Java - "@all 今天开发人员大家各自子啊群里面报一下自己的进度" - "目前卡在支付前校验，待支付中心联调" - "售前主流程/交易/辅营售前阻塞在支付前校验，待支付中心联调,目前售前剩余授权回调验证还得1pd调通" "董威宁邀请您参加腾讯会议会议主题：董威宁的快速会议..." "@乔路能给我清个缓存不" "@王颖yw 审批的时候也注意下哈" ``` 1. 技术支持相关: ```Java "@赵赵力检查一下配置吧" "@伊海迪可以关注下这个问题" "@国内交易热线热线帮忙看下这个接口..." ``` 1. 环境配置与问题排查 ```Java - "环境没搞通" "还没听人说环境搞好了" - "org.apache.dubbo.rpc.RpcException: No provider available..." - "软路由能不能进服务页，现在没法进 case没法覆盖到" - "[obj type="url" value="http://portal.corp.qunar.com/servicePortal/apptask/console.html?id=9302554"] trade_core 重启下" ``` 1. 联调与测试协调 ```Java - "@蔡宜身现在进度如何呀，今天提测有风险吗？晚上能showcase吗？" - "现在目前是各个环节都有卡点，先是北京-上海营销不出，现在是航班都没了" - "@黄启孟帮看下支付完成页的几个问题..." ``` 1. 技术方案讨论 ```Java - "@赵述佳这个cashierJumpUrl构建的时候有判断payToken为空的时候不返这个url吗？" - "@蔡宜身轮询接口报了参数异常" - "batchSeq为什么是yyw格式的啊，不是20格式的啊，合单情况下又传的是什么呢" ``` 1. 任务分配与协作 ```Java - "@李皓雪皓雪姐看一下你那边的排期" - "@all 任命陈民华担任项目技术负责人，请知晓！" - "@黄启孟 @郝泽楠 @李皓雪 @谭鹏yy @何钢 @肖杨 @刁洪亮来对一下排期吧" ``` 1. 文档与知识共享 ```Java - "[obj type="url" value="https://wiki.corp.qunar.com/pages/viewpage.action?pageId=658756458"]" - "按照这个更新checklist吧" - "@赵述佳技术方案的wiki在哪有" ``` # 五、一句话多个意图（待实现）一句话有多个意图怎么办呢？将 suggestion 卡片做成跑马图，或者干脆不实现多意图？ ![image.png|1000](https://imagehosting4picgo.oss-cn-beijing.aliyuncs.com/imagehosting/fix-dir%2Fpicgo%2Fpicgo-clipboard-images%2F2024%2F11%2F10%2F04-52-22-c78b4b3a020bee41f137d761bd9bb436-202411100452153-5c1378.png) # 六、避免幻觉 **Best-of-N verficiation**: Run Claude through the same prompt multiple times and compare the outputs. Inconsistencies across outputs could indicate hallucinations. 并发调用多次，比较结果