RAG与知识检索

13人浏览 / 0人评论 / 添加收藏

RAG（检索增强生成）= 知识检索 + 大模型生成；知识检索是 RAG 的核心引擎，负责从外部知识库精准召回信息，解决大模型幻觉、知识过时、领域盲区三大痛点。下面从概念、原理、架构、检索技术、应用与选型讲透。

知识检索（Knowledge Retrieval）：从海量文档 / 数据库中，按语义或关键词快速找到与用户问题最相关的信息片段（如段落、句子），是传统搜索的升级（从关键词匹配到语义理解）。
RAG（Retrieval-Augmented Generation，检索增强生成）：把知识检索与 ** 大语言模型（LLM）** 结合，先检索外部知识，再把检索结果 “喂” 给 LLM 生成答案，相当于给 LLM 开卷考试。
关系：知识检索是 RAG 的必要组件；没有检索，RAG 就退化成普通 LLM；检索质量直接决定 RAG 答案的准确性。

文档入库（预处理）
- 对 PDF/Word/ 网页等文档做清洗、分段（Chunking）、去重
- 用 Embedding 模型（如 BGE、text-embedding）把文本转成向量，存入向量数据库（如 FAISS、Milvus、Pinecone）
用户提问 → 向量转换
- 用户问题同样转成向量，进入检索阶段
知识检索（核心）
- 向量数据库做相似度搜索（ANN），召回 Top-K 最相关文本片段（如 3–5 条）
- 可选：重排（Rerank）（如 Cross-Encoder）提升相关性
增强 Prompt
- 把 “用户问题 + 检索结果” 拼接成 Prompt，输入 LLM
生成答案
- LLM 基于检索到的真实数据生成回答，附带引用来源，降低幻觉

用户提问 → 向量化 → 向量库检索 → 重排 → 增强Prompt → LLM生成 → 答案（带引用）

技术	核心特点	优点	缺点
传统检索（搜索引擎）	只返回文档片段，不生成答案	快、准、可追溯	无生成能力，需人工总结
普通 LLM（无 RAG）	纯模型生成，依赖训练数据	自然流畅	幻觉高、知识过时、无领域知识
RAG（检索 + 生成）	先检索后生成，外部知识增强	幻觉低、知识新、可解释、低成本	依赖检索质量，多一步检索耗时
微调（Fine-tuning）	用领域数据重训模型	深度适配领域	成本高、周期长、难更新、易遗忘

结论：企业知识库 / 专业问答首选RAG；微调适合高频、深度领域场景；传统检索适合纯文档查找。

知识检索是 RAG 的根基，RAG 是知识检索的价值放大。通过 “检索 + 生成”，RAG 让 LLM 从 “闭卷记忆” 升级为 “开卷查阅”，在保证回答自然流畅的同时，大幅提升准确性、时效性与可解释性，成为当前企业 AI 落地的主流方案。

搜索