【RAG】RAG模型的过程

张开发
2026/6/9 0:30:48 15 分钟阅读
【RAG】RAG模型的过程
一.RAG模型的过程1.1 阶段一: 建立向量数据库离线建库只做一次加载数据用「非结构化数据加载器」把本地的 PDF/Word/TXT/Excel 等文件统一提取成纯文本Text。例子把《公司差旅管理制度》《报销规范》等文档全部读成纯文字。文本切分用「文本切分工具Text Splitter」把长文本切成语义完整的小文本块Text Chunk比如每段 500 字左右。作用避免文本太长嵌入模型处理不了同时保证检索精度。向量嵌入用「嵌入模型Embedding Model」把每个文本块转换成一串数字向量 Embeddings。大白话给每段文字生成「数字身份证」语义越像向量越接近。存储索引把所有向量 原文存进向量数据库做好索引。作用后续用户提问时能一秒从海量数据里找到最相关的内容。阶段核心作用把「人类能看懂的文档」变成「AI 能快速检索的向量库」为后续问答做准备。1.2 阶段 2检索阶段用户提问后第一步对应图中绿框是 RAG 的「搜索环节」核心是从向量库中找到和用户问题最相关的资料。1.2.1 完整流程用户提问User Query员工问「我去北京出差 3 天审批流程是什么」问题向量化用和建库时完全相同的嵌入模型把用户问题也转换成向量。关键必须用同一个模型否则向量空间不一致检索会完全失效。相似度搜索拿着问题的向量去向量数据库里做余弦相似度搜索捞出最相关的 Top3/Top5 文本块。例子匹配到「出差审批流程」「申请时限」这两段最相关的制度原文。1.2.2 阶段核心作用精准筛选出和用户问题相关的知识过滤无关内容为大模型提供「靠谱的参考资料」。1.3 阶段 3增强阶段Prompt 工程核心对应图中黄框是 RAG 的「灵魂环节」核心是把检索到的资料变成大模型能理解、能遵守的 Prompt也就是「检索增强」的核心。1.3.1 完整流程组装上下文把检索到的相似向量对应的原文作为「上下文 Context」。套用提示词模板用提前写好的 Prompt 模板把「上下文 用户问题」拼成完整的 Prompt。模板就是你学的「提示词五要素」核心要求只基于上下文回答不准瞎编。示例【参考资料】{检索到的差旅制度原文}【用户问题】我去北京出差 3 天审批流程是什么请严格基于参考资料回答不得编造任何信息。生成最终 PromptPrompt Context User Query发给大模型。1.3.2 阶段核心作用用「提示词约束」「上下文注入」强制大模型只从给定资料里回答彻底解决幻觉问题这就是「增强」的本质。1.4 阶段 4生成阶段最终输出对应图中蓝框是 RAG 的「收尾环节」核心是大模型基于参考资料生成最终回答。完整流程大模型推理LLM大模型拿到 Prompt只根据参考资料生成符合要求的回答。例子大模型根据制度准确告诉你审批流程、申请时限不会乱编公司没有的规则。返回给用户把生成的回答原样返回给提问的员工完成一次问答。阶段核心作用把「结构化的参考资料」转换成「自然、通顺、符合人类习惯的回答」完成从「知识检索」到「智能问答」的闭环。

更多文章