requirements
核对日期:2026-05-13。
1. 一句话介绍
用一句话说明项目帮助谁完成什么任务,以及 AI 介入后带来的改进。
示例:
面向内部工程团队的代码库分析 Agent,帮助开发者快速定位模块职责、调用链和潜在风险,并输出带文件引用的分析报告。
2. 用户画像
| 用户 | 当前目标 | 当前痛点 | 成功体验 |
|---|---|---|---|
| [用户角色] | [要完成的任务] | [现有流程的问题] | [任务完成后的可观察结果] |
3. 当前流程
描述没有 AI 时用户怎么完成任务:
- 触发任务的入口是什么。
- 用户需要收集哪些信息。
- 需要使用哪些系统或工具。
- 哪些步骤最耗时、最容易出错。
- 当前结果如何被确认或交付。
4. AI 介入点
| 流程步骤 | AI 能做什么 | 人类仍需确认什么 | 风险 |
|---|---|---|---|
| [步骤] | [生成、检索、分类、解释、草稿] | [审批、判断、执行] | [误判、泄漏、越权] |
5. MVP 范围
本项目第一版必须包含:
- [核心功能 1]
- [核心功能 2]
- [核心功能 3]
- 基础日志和错误处理。
- 最少 30 条评测样例。
- 安全负例和失败样例库。
6. 非目标
本项目第一版不做:
- [非目标 1]
- [非目标 2]
- [非目标 3]
非目标必须写清楚,避免项目范围失控。
7. 成功指标
| 指标 | 目标值 | 采集方式 | 说明 |
|---|---|---|---|
| 任务完成率 | [例如 >= 80%] | eval / 人工复核 | 核心任务是否完成 |
| 引用支持率 | [例如 >= 90%] | eval | 关键结论是否有证据 |
| 拒答准确率 | [例如 >= 85%] | eval | 信息不足或越权时是否拒答 |
| 平均延迟 | [例如 <= 8s] | trace | 用户体验指标 |
| 单任务成本 | [例如 <= 0.05 USD] | token 日志 | 运营指标 |
8. 风险和边界
| 风险 | 触发条件 | 影响 | 控制方式 |
|---|---|---|---|
| 输出错误 | 模型幻觉、检索失败 | 用户误用 | 引用、拒答、人工确认 |
| 数据外泄 | 输入含敏感信息 | 合规风险 | 脱敏、权限过滤、日志控制 |
| 工具越权 | Agent 调错工具 | 破坏数据 | 最小权限、审批、dry-run |
9. 里程碑
| 时间 | 目标 | 产出 |
|---|---|---|
| 第 1 阶段 | 场景收敛 | PRD、架构图、eval 草案 |
| 第 2 阶段 | MVP 实现 | 可运行链路、日志、基础 UI |
| 第 3 阶段 | 评测与收口 | 评测报告、安全评审、演示材料 |