requirements
核对日期:2026-05-13。
1. 一句话介绍
内部制度与研发流程问答助手帮助员工基于授权文档查询流程、制度和规范,并在证据不足、文档冲突或权限不足时给出可解释的拒答或澄清。
2. 用户画像
| 用户 | 当前目标 | 当前痛点 | 成功体验 |
|---|---|---|---|
| 新员工 | 查询入职、权限、开发环境流程 | 不知道文档在哪里 | 5 分钟内找到流程和申请入口 |
| 研发工程师 | 查询发布、变更、代码规范 | 文档版本多,容易看错 | 获得最新规范和引用 |
| 产品经理 | 查询需求评审、上线检查 | 流程分散在多个空间 | 获得步骤清单和负责人 |
| 运营同学 | 查询报销、采购、权限申请 | 不熟悉内部系统 | 获得可执行步骤和注意事项 |
| 管理者 | 查看常见问题和失败类型 | 不知道知识库哪里薄弱 | 基于反馈修复文档 |
3. 当前流程
- 用户在 IM 群里提问。
- 同事凭经验回复一个文档链接。
- 用户打开文档后继续搜索关键词。
- 如果文档过期,用户再问负责人。
- 最终流程依赖人工确认,耗时不可控。
主要问题:
- 文档分散。
- 关键词不稳定。
- 旧文档残留。
- 权限和部门边界不清。
- 常见问题没有沉淀为评测集。
4. AI 介入点
| 流程步骤 | AI 能做什么 | 人类仍需确认什么 | 风险 |
|---|---|---|---|
| 提问理解 | 改写查询、识别意图和部门 | 高风险或含糊问题 | 错误理解需求 |
| 知识检索 | 检索授权文档并重排 | 文档是否真实有效 | 检索不到最新文档 |
| 答案生成 | 输出步骤、引用和限制 | 冲突文档的最终裁决 | 模型幻觉 |
| 权限处理 | 根据用户权限过滤文档 | 权限配置是否正确 | 越权泄漏 |
| 反馈闭环 | 收集无用、过期、缺文档反馈 | 文档 owner 更新内容 | 反馈无人处理 |
5. MVP 范围
第一版必须包含:
- 支持 5 类问题:入职、权限、研发流程、发布规范、报销采购。
- 只读 RAG 问答,不执行写入、审批或外发动作。
- 每个回答最多引用 5 个来源。
- 证据不足时拒答或要求补充信息。
- 文档冲突时提示冲突来源和人工确认路径。
- 至少 30 条评测样例。
- 安全负例:prompt injection、越权查询、敏感字段请求。
- trace:query、检索结果、模型版本、prompt 版本、token、延迟、成本。
6. 非目标
第一版不做:
- 自动提交权限申请。
- 自动发起报销或采购。
- 自动修改生产系统。
- 回答未授权文档内容。
- 处理真实客户隐私数据。
- 替代制度 owner 做最终解释。
7. 成功指标
| 指标 | 目标值 | 采集方式 | 说明 |
|---|---|---|---|
| 正常样例通过率 | >= 85% | 离线 eval | 主要流程问题可回答 |
| 引用支持率 | >= 90% | eval + 人工抽查 | 关键结论有来源 |
| 拒答准确率 | >= 85% | refusal/security 样例 | 不知道时不编造 |
| 越权泄漏率 | 0 | security eval | 不返回未授权信息 |
| 平均延迟 | <= 8s | trace | 包含检索和模型调用 |
| 负反馈关闭周期 | <= 7 天 | 反馈系统 | 知识库能持续改进 |
8. 风险和边界
| 风险 | 触发条件 | 影响 | 控制方式 |
|---|---|---|---|
| 旧文档误导 | 检索命中过期文档 | 用户走错流程 | metadata 生效日期、版本排序 |
| 文档冲突 | 多个制度结论不一致 | 用户不知道信谁 | 明确列出冲突并升级 |
| 权限泄漏 | 检索层未过滤 | 内部数据外泄 | 先权限过滤再入上下文 |
| 注入攻击 | 用户或文档要求忽略规则 | 泄漏系统信息 | 指令隔离、拒答、输出校验 |
| 编造答案 | 无证据仍回答 | 误导用户 | 引用强制、证据不足拒答 |