跳到主要内容

requirements

核对日期：2026-05-13。

1. 一句话介绍

内部制度与研发流程问答助手帮助员工基于授权文档查询流程、制度和规范，并在证据不足、文档冲突或权限不足时给出可解释的拒答或澄清。

2. 用户画像

用户	当前目标	当前痛点	成功体验
新员工	查询入职、权限、开发环境流程	不知道文档在哪里	5 分钟内找到流程和申请入口
研发工程师	查询发布、变更、代码规范	文档版本多，容易看错	获得最新规范和引用
产品经理	查询需求评审、上线检查	流程分散在多个空间	获得步骤清单和负责人
运营同学	查询报销、采购、权限申请	不熟悉内部系统	获得可执行步骤和注意事项
管理者	查看常见问题和失败类型	不知道知识库哪里薄弱	基于反馈修复文档

3. 当前流程

用户在 IM 群里提问。
同事凭经验回复一个文档链接。
用户打开文档后继续搜索关键词。
如果文档过期，用户再问负责人。
最终流程依赖人工确认，耗时不可控。

主要问题：

文档分散。
关键词不稳定。
旧文档残留。
权限和部门边界不清。
常见问题没有沉淀为评测集。

4. AI 介入点

流程步骤	AI 能做什么	人类仍需确认什么	风险
提问理解	改写查询、识别意图和部门	高风险或含糊问题	错误理解需求
知识检索	检索授权文档并重排	文档是否真实有效	检索不到最新文档
答案生成	输出步骤、引用和限制	冲突文档的最终裁决	模型幻觉
权限处理	根据用户权限过滤文档	权限配置是否正确	越权泄漏
反馈闭环	收集无用、过期、缺文档反馈	文档 owner 更新内容	反馈无人处理

5. MVP 范围

第一版必须包含：

支持 5 类问题：入职、权限、研发流程、发布规范、报销采购。
只读 RAG 问答，不执行写入、审批或外发动作。
每个回答最多引用 5 个来源。
证据不足时拒答或要求补充信息。
文档冲突时提示冲突来源和人工确认路径。
至少 30 条评测样例。
安全负例：prompt injection、越权查询、敏感字段请求。
trace：query、检索结果、模型版本、prompt 版本、token、延迟、成本。

6. 非目标

第一版不做：

自动提交权限申请。
自动发起报销或采购。
自动修改生产系统。
回答未授权文档内容。
处理真实客户隐私数据。
替代制度 owner 做最终解释。

7. 成功指标

指标	目标值	采集方式	说明
正常样例通过率	>= 85%	离线 eval	主要流程问题可回答
引用支持率	>= 90%	eval + 人工抽查	关键结论有来源
拒答准确率	>= 85%	refusal/security 样例	不知道时不编造
越权泄漏率	0	security eval	不返回未授权信息
平均延迟	<= 8s	trace	包含检索和模型调用
负反馈关闭周期	<= 7 天	反馈系统	知识库能持续改进

8. 风险和边界

风险	触发条件	影响	控制方式
旧文档误导	检索命中过期文档	用户走错流程	metadata 生效日期、版本排序
文档冲突	多个制度结论不一致	用户不知道信谁	明确列出冲突并升级
权限泄漏	检索层未过滤	内部数据外泄	先权限过滤再入上下文
注入攻击	用户或文档要求忽略规则	泄漏系统信息	指令隔离、拒答、输出校验
编造答案	无证据仍回答	误导用户	引用强制、证据不足拒答

1. 一句话介绍
2. 用户画像
3. 当前流程
4. AI 介入点
5. MVP 范围
6. 非目标
7. 成功指标
8. 风险和边界