跳到主要内容

requirements

核对日期:2026-05-13。

1. 一句话介绍

内部制度与研发流程问答助手帮助员工基于授权文档查询流程、制度和规范,并在证据不足、文档冲突或权限不足时给出可解释的拒答或澄清。

2. 用户画像

用户当前目标当前痛点成功体验
新员工查询入职、权限、开发环境流程不知道文档在哪里5 分钟内找到流程和申请入口
研发工程师查询发布、变更、代码规范文档版本多,容易看错获得最新规范和引用
产品经理查询需求评审、上线检查流程分散在多个空间获得步骤清单和负责人
运营同学查询报销、采购、权限申请不熟悉内部系统获得可执行步骤和注意事项
管理者查看常见问题和失败类型不知道知识库哪里薄弱基于反馈修复文档

3. 当前流程

  1. 用户在 IM 群里提问。
  2. 同事凭经验回复一个文档链接。
  3. 用户打开文档后继续搜索关键词。
  4. 如果文档过期,用户再问负责人。
  5. 最终流程依赖人工确认,耗时不可控。

主要问题:

  • 文档分散。
  • 关键词不稳定。
  • 旧文档残留。
  • 权限和部门边界不清。
  • 常见问题没有沉淀为评测集。

4. AI 介入点

流程步骤AI 能做什么人类仍需确认什么风险
提问理解改写查询、识别意图和部门高风险或含糊问题错误理解需求
知识检索检索授权文档并重排文档是否真实有效检索不到最新文档
答案生成输出步骤、引用和限制冲突文档的最终裁决模型幻觉
权限处理根据用户权限过滤文档权限配置是否正确越权泄漏
反馈闭环收集无用、过期、缺文档反馈文档 owner 更新内容反馈无人处理

5. MVP 范围

第一版必须包含:

  • 支持 5 类问题:入职、权限、研发流程、发布规范、报销采购。
  • 只读 RAG 问答,不执行写入、审批或外发动作。
  • 每个回答最多引用 5 个来源。
  • 证据不足时拒答或要求补充信息。
  • 文档冲突时提示冲突来源和人工确认路径。
  • 至少 30 条评测样例。
  • 安全负例:prompt injection、越权查询、敏感字段请求。
  • trace:query、检索结果、模型版本、prompt 版本、token、延迟、成本。

6. 非目标

第一版不做:

  • 自动提交权限申请。
  • 自动发起报销或采购。
  • 自动修改生产系统。
  • 回答未授权文档内容。
  • 处理真实客户隐私数据。
  • 替代制度 owner 做最终解释。

7. 成功指标

指标目标值采集方式说明
正常样例通过率>= 85%离线 eval主要流程问题可回答
引用支持率>= 90%eval + 人工抽查关键结论有来源
拒答准确率>= 85%refusal/security 样例不知道时不编造
越权泄漏率0security eval不返回未授权信息
平均延迟<= 8strace包含检索和模型调用
负反馈关闭周期<= 7 天反馈系统知识库能持续改进

8. 风险和边界

风险触发条件影响控制方式
旧文档误导检索命中过期文档用户走错流程metadata 生效日期、版本排序
文档冲突多个制度结论不一致用户不知道信谁明确列出冲突并升级
权限泄漏检索层未过滤内部数据外泄先权限过滤再入上下文
注入攻击用户或文档要求忽略规则泄漏系统信息指令隔离、拒答、输出校验
编造答案无证据仍回答误导用户引用强制、证据不足拒答