参考答案
核对日期:2026-05-13。
1. 阶段练习参考方向
1.1 场景打分
参考打分表:
| 场景 | 业务价值 | 频率 | 技术可行 | 风险可控 | 组织可采用 | 结论 |
|---|---|---|---|---|---|---|
| 客服回复草稿 | 4 | 5 | 4 | 4 | 4 | 优先 MVP |
| 合同自动审批 | 5 | 3 | 3 | 1 | 2 | 先做人审辅助 |
| 会议纪要总结 | 3 | 4 | 5 | 4 | 5 | 可快速试点 |
| 生产变更自动执行 | 5 | 2 | 2 | 1 | 1 | 不适合自治 |
| 销售线索摘要 | 4 | 4 | 4 | 4 | 3 | 可试点 |
优先选择高频、高价值、数据可得、风险可控、容易嵌入现有流程的场景。
1.2 MVP 范围
合格 MVP 应明确:
- 做什么:例如生成客服回复草稿。
- 不做什么:不自动发送、不处理赔付、不承诺法律结论。
- 输入输出:用户问题、订单信息、政策证据 -> 带引用草稿。
- 用户流程:生成、编辑、确认、发送、反馈。
- 成功指标:采纳率、编辑距离、处理时长、投诉率。
- 风险边界:敏感问题转人工,高金额需审批。
1.3 ROI 测算
参考公式:
月收益 = 月任务量 * 单次节省分钟 / 60 * 人力时薪 * 采纳率
月成本 = 模型成本 + 人工复核成本 + 运维成本 + 标注/评测成本
ROI = (月收益 - 月成本) / 月成本
注意不要只算 token 成本。培训、流程改造、评测、安全治理和运维都应进入总成本。
1.4 Build vs Buy 决策
参考判断:
| 维度 | 自研适合 | 采购适合 |
|---|---|---|
| 上线速度 | 可接受较长周期 | 需要快速试点 |
| 数据安全 | 数据敏感、需内控 | 数据可托管或已合规 |
| 定制能力 | 深度嵌入内部流程 | 标准场景 |
| 长期成本 | 长期高频使用 | 短期验证 |
| 锁定风险 | 需要可迁移架构 | 可接受供应商绑定 |
| 退出方案 | 内部掌控数据和接口 | 合同明确导出和迁移 |
1.5 试点计划
4 周试点参考:
- 第 1 周:明确场景、用户、数据、权限、基线指标。
- 第 2 周:完成 MVP、eval 样例、安全门禁。
- 第 3 周:小范围真实使用,收集 trace、反馈和失败样例。
- 第 4 周:复盘 ROI、风险和采用率,决定继续、调整或停止。
2. 项目评分样例
高分立项方案应具备:
- 从业务流程图开始,不从模型开始。
- 明确用户、任务、频率、痛点和现有基线。
- 技术方案能解释为什么选 RAG、Workflow、Agent 或非 AI。
- MVP 有明确非目标和风险边界。
- ROI 包含全成本。
- 试点计划有退出标准和回滚策略。
不合格表现:
- 只写“接入大模型提升效率”。
- 没有业务 owner。
- 只算模型调用成本。
- 没有评测和安全门禁。
- 试点成功后直接全量推广。
3. 验收题参考答案
- 什么样的场景适合优先做 AI?
高频、高价值、非结构化输入多、现有流程痛点明显、数据可获得、风险可控、结果可验证、用户愿意采用的场景。
- 为什么 AI 产品要从业务流程图开始?
AI 必须嵌入真实工作流才能产生价值。流程图能暴露用户任务、系统边界、审批点、数据来源和可自动化范围。
- 如何判断一个场景应该用规则、RAG、Workflow 还是 Agent?
规则清晰用规则;需要外部知识和引用用 RAG;路径固定但需模型节点用 Workflow;路径不固定且需工具反馈迭代时才用 Agent。
- AI 产品 MVP 应该包含哪些内容?
核心任务流、输入输出、模型调用、用户确认、失败处理、基础 eval、日志、成本记录、安全边界和反馈入口。
- ROI 除了模型成本还要计算哪些成本?
人力复核、标注、评测、数据治理、安全合规、开发运维、培训、供应商、监控、错误成本和组织推广成本。
- 为什么采用率比调用量更重要?
调用量可能来自试用或误用,采用率表示输出真正进入工作流并被用户认可。还应结合编辑距离、复用率和业务结果。
- Build vs Buy 需要比较哪些维度?
上线速度、数据安全、定制能力、长期成本、供应商锁定、合规、集成成本、可观测性、退出方案和 SLA。
- AI 产品为什么需要可编辑、可确认和可回退?
模型输出可能错误或不适合当前语境。编辑和确认让用户保持控制,回退能降低错误进入业务系统后的损失。
- 试点成功为什么不等于规模化成功?
试点样本小、用户受控、场景有限。规模化会遇到长尾输入、组织培训、权限差异、成本增长、监控和治理压力。
- 组织落地通常会遇到哪些阻力?
流程改变、责任不清、用户不信任、指标不一致、数据权限、合规担忧、工具割裂、培训不足和业务 owner 缺位。