LlamaIndex

核对日期：2026-05-09。

10.10 上线验收补充

验收项	通过标准
入库治理	source_id、owner、ACL、时间戳和版本齐全
检索评测	recall@k、引用准确率和拒答正确率达标
权限	检索前过滤，跨租户文档不可召回
注入防护	恶意文档只作为数据，不驱动工具调用
数据删除	删除请求能从索引、缓存和引用中清理
证据回放	每个答案能回到检索片段和索引版本

1. 定义与边界

LlamaIndex 是以数据连接、索引、检索增强生成（RAG）和知识型 Agent 为核心的 LLM 应用框架。它适合把企业数据、文档、数据库和工具接入 Agent，不应被理解为只做向量数据库封装。

2. 官方能力、社区能力、实验能力和营销说法

类型	内容
官方能力	readers/connectors、index、retriever、query engine、agent、workflow、observability 集成
社区能力	第三方数据源 reader、向量库、工具和模板
实验/快速变化	工作流、Agent API、部分云服务和集成
营销说法	“接入企业知识库即可避免幻觉”不成立，仍需检索评测和引用校验

3. 核心机制

LlamaIndex 的优势是围绕数据管道和 RAG 组织 Agent，而不是只让模型自由调用工具。

4. 架构与工程实现

适合场景：

场景	设计
企业文档问答	ingestion + index + retriever + citation
数据分析 Agent	database/tool + query planning
多知识源整合	router retriever 或 query engine
数据驱动 workflow	LlamaIndex workflow 管理步骤

数据节点建议保留元数据：

{
  "doc_id": "hr-policy-2026",
  "chunk_id": "hr-policy-2026#12",
  "source": "confluence",
  "acl": ["hr", "manager"],
  "updated_at": "2026-05-01",
  "text": "..."
}

5. 生产实践

ingestion、chunking、embedding、reranking 和生成要分开评测。
检索必须尊重 ACL，不能让向量相似度绕过权限。
对索引增量更新和删除做一致性检查。
输出需要引用来源，并在证据不足时拒答或请求补充。
对 reader 和 connector 做供应链审查。

6. 常见反模式

反模式	后果
默认 chunking 上生产	关键上下文被切断
只看答案流畅度	检索失败被模型掩盖
忽略文档时间戳	使用过期政策
无 ACL 过滤	跨租户或跨部门泄漏

7. 评测方法

RAG/Agent 评测应拆为检索召回率、重排质量、引用准确率、答案 groundedness、拒答正确率和端到端成功率。建议维护包含冲突文档、过期文档和权限边界的数据集。

8. 安全与治理

主要风险是敏感文档进入错误上下文、外部文档注入、引用伪造和数据源凭证泄露。治理措施包括 ACL 前置过滤、source metadata、工具最小权限和审计。

9. 权威资料

LlamaIndex docs: https://docs.llamaindex.ai/en/stable/
LlamaIndex agents: https://docs.llamaindex.ai/en/stable/understanding/agent/
LlamaIndex workflows: https://docs.llamaindex.ai/en/stable/module_guides/workflow/
LlamaIndex evaluation: https://docs.llamaindex.ai/en/stable/module_guides/evaluating/
LlamaIndex GitHub: https://github.com/run-llama/llama_index

10. 二次精修：数据型 Agent 决策材料

10.1 当前官方能力

能力	作用	决策含义
Data connectors / readers	接入文件、数据库、SaaS、网页	适合数据源多的 RAG
Index / retriever / query engine	建索引、检索、问答	适合知识库和搜索增强
Agents	用工具和数据源完成任务	适合数据密集型 Agent
Workflows	事件驱动、可组合流程	适合把 RAG 与工具流程编排
Evaluation / observability	评测检索和生成质量	适合建立 RAG 回归集

10.2 适用场景

场景	推荐原因
企业文档问答	数据接入、索引和检索能力完整
研究/分析 Agent	多数据源、多步骤查询、引用追踪
需要对 RAG 质量细粒度调优	检索、重排、评测组件清晰
要把数据管道和 Agent 合并	workflows 可组织数据处理链路

10.3 不适用场景

主要是业务写操作、审批和状态机，不是数据检索，优先工作流/图框架。
数据权限非常复杂但无法在检索前过滤，任何 RAG 框架都不应直接接入。
极简工具调用或纯聊天应用，LlamaIndex 可能过重。

10.4 数据流架构

10.5 生产实践

文档入库时保留 source_id、owner、tenant、acl、effective_at、expires_at。
检索前做权限过滤，不要检索后再让模型“不要看无权限内容”。
对切分、embedding、rerank、top_k、引用规则建立版本。
对过期文档、冲突文档和低可信来源建立降权或拒答策略。
数据源凭证由连接器代理，不进入 prompt 和日志。

10.6 评测矩阵

评测项	指标
检索	recall@k、MRR、权限过滤正确率
生成	groundedness、引用准确率、拒答正确率
数据治理	过期文档命中率、跨租户泄露率
Agent	工具选择准确率、多跳任务成功率
安全	注入文档成功率、敏感字段外发率

10.7 反模式补充

反模式	后果
只调 top_k 直到答案看起来好	成本上升且可能引入噪声
不保存检索证据	无法解释错误答案
文档入库无 owner 和 ACL	无法满足企业权限和删除请求
用 RAG 替代数据权限系统	跨租户泄露风险

10.8 集成边界

边界	建议
与 LangGraph	LlamaIndex 负责数据检索，LangGraph 负责长流程状态
与业务数据库	读操作通过受控查询层，写操作走业务 API
与低代码平台	平台可做入口，索引和评测仍需工程化管理
与安全系统	接入 DLP、ACL、审计和数据保留策略

10.9 迁移策略

从传统搜索迁移：先并行评测检索召回，再接入生成回答。
从简单 RAG 迁移：先补 metadata 和 eval，再替换索引/检索组件。
从 LangChain 迁移：保留业务工具，逐步把数据接入和 query engine 迁到 LlamaIndex。

核对日期：2026-05-09。

10.10 上线验收补充​

1. 定义与边界​

2. 官方能力、社区能力、实验能力和营销说法​

3. 核心机制​

4. 架构与工程实现​

5. 生产实践​

6. 常见反模式​

7. 评测方法​

8. 安全与治理​

9. 权威资料​

10. 二次精修：数据型 Agent 决策材料​

10.1 当前官方能力​

10.2 适用场景​

10.3 不适用场景​

10.4 数据流架构​

10.5 生产实践​

10.6 评测矩阵​

10.7 反模式补充​

10.8 集成边界​

10.9 迁移策略​