RAG 三种范式总结

对比 Naive / Agentic / Advanced 三种 RAG 范式，理清演进逻辑、适用场景与选择方法。

一、对比总览

	Naive RAG	Agentic RAG	Advanced RAG
核心	检索 → 拼 prompt → 生成	检索作为工具，LLM 决策	三段式优化检索质量
检索时机	每次必检索	LLM 判断要不要检索	每次必检索（但优化）
检索词	用户原话	LLM 自定	LLM 改写多份
检索方式	单路向量	单路向量	多路（向量+关键词）
检索结果	拼 prompt context	ToolMessage	拼prompt（rerank后）
优化手段	无	智能判断	query改写 + rerank
架构	流程硬编码	ReAct Agent	优化流水线
复杂度	低	中	高
精度	一般	取决于LLM	高
延迟	低	中	高
适用	简单QA	问题多样	生产级

二、演进逻辑

三种范式是递进关系，每个解决前一个的问题：

Naive RAG: 每次必检索 + 用户原话 + 无优化
   ↓ 问题: 不该检索时也检索（浪费）; 检索词差; 无精度优化
Agentic RAG: LLM 判断要不要检索 + LLM 自定 query
   ↓ 解决: 智能判断（不无脑检索）
   ↓ 未解决: 检索质量仍靠单次向量检索
Advanced RAG: query改写 + 多路检索 + rerank
   ↓ 解决: 检索质量系统优化

Naive → Agentic：解决"该不该检索"的智能判断问题
Agentic → Advanced：解决"检索得好不好"的质量问题

两个方向正交：Agentic 关注"何时检索"，Advanced 关注"检索多准"。

三、三者关系（不是互斥）

三种范式可以组合，不是三选一：

Agentic + Advanced: LLM 判断要不要检索 + 检索时用改写/rerank 优化

实际生产系统常常是组合体：

用 Agentic 思路让 LLM 决定何时检索
检索时用 Advanced 的 rerank 提精度

四、怎么选

按场景选：

场景	推荐
简单 QA，问题明确，文档少	Naive RAG
问题多样，有的不需要检索，要多工具	Agentic RAG
生产级，追求准确率，文档量大	Advanced RAG（或 Agentic + Advanced 组合）
想要 Agent 风格的智能交互	Agentic RAG
对延迟敏感	Naive RAG（最简单最快）

五、按需取舍

不必全套上 Advanced。实际项目常按需选优化：

优化	收益	成本
只加 rerank	精度提升明显	多一个模型，延迟增加
只加 query 改写	召回更全	多次 LLM 调用
只加混合检索	精确词匹配改善	多维护一套关键词索引
全套	最优	最复杂最慢

通常 rerank 是性价比最高的优化——只加一个模型，精度提升明显。

六、关键认知清单

三种范式递进：Naive（基础）→ Agentic（智能判断）→ Advanced（质量优化）。
两个正交方向：Agentic 解决"何时检索"，Advanced 解决"检索多准"。
不是互斥：Agentic + Advanced 可组合。
Naive RAG 是底子：所有范式都建立在"检索→拼prompt→生成"基础上。
Agentic 把检索工具化：LLM 决定何时调、用什么 query，结果走 ToolMessage。
Advanced 三段式：检索前改写、检索中多路、检索后 rerank。
rerank 性价比最高：只加一个模型，精度提升明显。
按需取舍：不必全套 Advanced，按场景选优化组合。
复杂度递增：Naive 低、Agentic 中、Advanced 高，延迟和成本也递增。
选型看场景：简单用 Naive，智能用 Agentic，精准用 Advanced。

附：三种范式详解

Naive RAG —— 基础流程：切片 → embedding → 检索 → 拼 prompt
Agentic RAG —— 检索作为工具：ReAct + function calling
Advanced RAG —— 质量优化：query 改写 + 多路检索 + rerank

配合 RAG 综合笔记阅读效果更佳。

目录CONTENT

RAG总结