记忆系统

本目录说明 Agent 记忆（Memory）的工程体系。这里的“记忆”不是把所有历史消息塞进上下文，也不是把企业文档放进向量库；它是 Agent 为了跨轮次、跨任务、跨会话保持状态、偏好、经验和操作规则而设计的持久化机制。

1. 与 RAG 的边界

维度	Agent Memory	RAG
主要对象	用户偏好、任务状态、历史经验、工作习惯、可更新指令	外部知识库、文档、网页、代码、规范
写入方式	由 Agent 或后台任务选择性写入、合并、删除	通常由数据管道批量采集、切分、索引
读取时机	会话启动、Agent loop 中、工具调用前后、个性化生成前	回答知识问题、查证事实、生成引用前
更新频率	高频、小粒度、需要权限和冲突处理	中低频、批处理、重建索引较常见
风险重点	隐私、错误画像、越权持久化、记忆污染	提示注入、检索污染、引用错误、索引过期

RAG 相关内容见 06-RAG与知识系统。工程上可以用同一个向量库同时承载长期记忆和知识检索，但逻辑上必须分命名空间、分权限、分评测指标。

2. 文件导览

Agent记忆系统总览：总架构、数据模型、Memory 与 RAG 的边界。
短期记忆：线程内会话状态、消息裁剪、摘要、checkpoint。
长期记忆：跨会话持久化、命名空间、生命周期和治理。
Episodic-Memory：事件型记忆与任务轨迹复用。
Semantic-Memory：事实、偏好、实体画像等语义记忆。
Procedural-Memory：技能、指令、工作流规则和可更新 prompt。
用户画像记忆：用户偏好、约束、同意与可解释管理。
记忆写入策略：热路径写入、后台 consolidation、冲突合并。
记忆检索策略：召回、排序、注入上下文、隔离与回放。
记忆压缩与遗忘：摘要、TTL、归档、删除权。
记忆安全与隐私：敏感信息、权限、审计、注入防护。

3. 推荐工程架构

关键原则：

短期记忆是当前线程的工作状态，不等于长期画像。
长期记忆必须有 namespace、key、source、confidence、updated_at、ttl。
写入记忆要比读取记忆更严格，尤其是用户画像、组织信息和安全偏好。
记忆进入模型上下文前要做最小化选择，不把整库原样注入 prompt。
任何可被外部内容影响的记忆写入都要防记忆投毒。

4. 最小数据模型

{
  "namespace": ["user", "u_123", "preferences"],
  "key": "communication_style",
  "value": {
    "preference": "short_direct_chinese",
    "evidence": ["user said: 用中文，直接一点"],
    "confidence": 0.82
  },
  "type": "semantic",
  "source": {
    "conversation_id": "c_456",
    "turn_id": "t_008"
  },
  "created_at": "2026-05-09T10:00:00+08:00",
  "updated_at": "2026-05-09T10:00:00+08:00",
  "ttl_days": 180,
  "sensitivity": "low",
  "write_policy": "user_visible"
}

5. 验收重点

是否能解释短期记忆、长期记忆、语义/情景/程序性记忆的差异。
是否把 Memory 与 RAG 在数据来源、写入机制、权限和评测上分开。
是否具备记忆写入、检索、压缩、删除和审计闭环。
是否能通过离线 eval 和线上 trace 判断记忆是否真的改善任务。
是否覆盖隐私、敏感信息、提示注入、记忆污染和越权访问。

权威资料

OpenAI Agents SDK Sessions: https://openai.github.io/openai-agents-python/sessions/ （核对日期：2026-05-09）
OpenAI Agents SDK Agent memory: https://openai.github.io/openai-agents-js/guides/sandbox-agents/memory （核对日期：2026-05-09）
LangChain Memory overview: https://docs.langchain.com/oss/python/concepts/memory （核对日期：2026-05-09）
LangGraph add memory: https://docs.langchain.com/oss/python/langgraph/add-memory （核对日期：2026-05-09）
OWASP Top 10 for LLM Applications: https://owasp.org/www-project-top-10-for-large-language-model-applications/ （核对日期：2026-05-09）
NIST AI RMF 1.0: https://www.nist.gov/itl/ai-risk-management-framework （核对日期：2026-05-09）

1. 与 RAG 的边界​

2. 文件导览​

3. 推荐工程架构​

4. 最小数据模型​

5. 验收重点​

权威资料​

1. 与 RAG 的边界

2. 文件导览

3. 推荐工程架构

4. 最小数据模型

5. 验收重点

权威资料