目 录CONTENT

文章目录

RAG总结

~梓
2026-06-29 / 0 评论 / 0 点赞 / 0 阅读 / 0 字
温馨提示:
部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

RAG 三种范式总结

对比 Naive / Agentic / Advanced 三种 RAG 范式,理清演进逻辑、适用场景与选择方法。


一、对比总览

Naive RAG Agentic RAG Advanced RAG
核心 检索 → 拼 prompt → 生成 检索作为工具,LLM 决策 三段式优化检索质量
检索时机 每次必检索 LLM 判断要不要检索 每次必检索(但优化)
检索词 用户原话 LLM 自定 LLM 改写多份
检索方式 单路向量 单路向量 多路(向量+关键词)
检索结果 拼 prompt context ToolMessage 拼prompt(rerank后)
优化手段 智能判断 query改写 + rerank
架构 流程硬编码 ReAct Agent 优化流水线
复杂度
精度 一般 取决于LLM
延迟
适用 简单QA 问题多样 生产级

二、演进逻辑

三种范式是递进关系,每个解决前一个的问题:

Naive RAG: 每次必检索 + 用户原话 + 无优化
   ↓ 问题: 不该检索时也检索(浪费); 检索词差; 无精度优化
Agentic RAG: LLM 判断要不要检索 + LLM 自定 query
   ↓ 解决: 智能判断(不无脑检索)
   ↓ 未解决: 检索质量仍靠单次向量检索
Advanced RAG: query改写 + 多路检索 + rerank
   ↓ 解决: 检索质量系统优化
  • Naive → Agentic:解决"该不该检索"的智能判断问题
  • Agentic → Advanced:解决"检索得好不好"的质量问题

两个方向正交:Agentic 关注"何时检索",Advanced 关注"检索多准"。


三、三者关系(不是互斥)

三种范式可以组合,不是三选一:

Agentic + Advanced: LLM 判断要不要检索 + 检索时用改写/rerank 优化

实际生产系统常常是组合体:

  • 用 Agentic 思路让 LLM 决定何时检索
  • 检索时用 Advanced 的 rerank 提精度

四、怎么选

按场景选:

场景 推荐
简单 QA,问题明确,文档少 Naive RAG
问题多样,有的不需要检索,要多工具 Agentic RAG
生产级,追求准确率,文档量大 Advanced RAG(或 Agentic + Advanced 组合)
想要 Agent 风格的智能交互 Agentic RAG
对延迟敏感 Naive RAG(最简单最快)

五、按需取舍

不必全套上 Advanced。实际项目常按需选优化:

优化 收益 成本
只加 rerank 精度提升明显 多一个模型,延迟增加
只加 query 改写 召回更全 多次 LLM 调用
只加混合检索 精确词匹配改善 多维护一套关键词索引
全套 最优 最复杂最慢

通常 rerank 是性价比最高的优化——只加一个模型,精度提升明显。


六、关键认知清单

  1. 三种范式递进:Naive(基础)→ Agentic(智能判断)→ Advanced(质量优化)。
  2. 两个正交方向:Agentic 解决"何时检索",Advanced 解决"检索多准"。
  3. 不是互斥:Agentic + Advanced 可组合。
  4. Naive RAG 是底子:所有范式都建立在"检索→拼prompt→生成"基础上。
  5. Agentic 把检索工具化:LLM 决定何时调、用什么 query,结果走 ToolMessage。
  6. Advanced 三段式:检索前改写、检索中多路、检索后 rerank。
  7. rerank 性价比最高:只加一个模型,精度提升明显。
  8. 按需取舍:不必全套 Advanced,按场景选优化组合。
  9. 复杂度递增:Naive 低、Agentic 中、Advanced 高,延迟和成本也递增。
  10. 选型看场景:简单用 Naive,智能用 Agentic,精准用 Advanced。

附:三种范式详解

  • Naive RAG —— 基础流程:切片 → embedding → 检索 → 拼 prompt
  • Agentic RAG —— 检索作为工具:ReAct + function calling
  • Advanced RAG —— 质量优化:query 改写 + 多路检索 + rerank

配合 RAG 综合笔记 阅读效果更佳。

0

评论区