跳到主要内容

RAG与知识系统

本目录说明 RAG(Retrieval-Augmented Generation,检索增强生成)和 Agent 知识系统。RAG 的核心是:在生成前或生成中,从外部知识源检索相关证据,把证据以可控方式提供给模型,并尽可能让回答可追溯。

RAG 不等于 Agent Memory。Memory 保存 Agent 与用户、任务互动后的状态;RAG 连接外部知识、文档、网页、代码库和数据库。两者可以共享检索基础设施,但必须分数据域、权限、写入流程和评测指标。

1. 文件导览

2. RAG 基础流程

离线索引流程:

3. 与记忆系统的边界

问题应优先使用
“用户偏好用中文简短回答”Agent Memory
“公司报销政策最新版是什么”RAG
“上次这个仓库测试失败的原因”Agent Memory 的 episodic memory
“这个仓库 README 和源码怎么描述 API”RAG / 代码检索
“以后生成日报都用这个格式”Agent Memory 的 procedural memory
“请引用产品手册第几节”RAG

4. 工程验收标准

一个生产 RAG 系统至少要回答:

  • 数据从哪里来,谁有权索引和检索。
  • chunk 如何生成,metadata 是否足够回溯。
  • 检索质量如何评测,bad case 如何修复。
  • prompt 中如何区分证据与指令,防止提示注入。
  • 回答如何引用来源,无法找到证据时如何拒答。
  • 索引如何更新、删除、回滚和监控。

权威资料