【RAG】RAG模型的过程

张开发

• 2026/6/9 0:30:48 • 15 分钟阅读

分享文章

一.RAG模型的过程1.1 阶段一: 建立向量数据库离线建库只做一次加载数据用「非结构化数据加载器」把本地的 PDF/Word/TXT/Excel 等文件统一提取成纯文本Text。例子把《公司差旅管理制度》《报销规范》等文档全部读成纯文字。文本切分用「文本切分工具Text Splitter」把长文本切成语义完整的小文本块Text Chunk比如每段 500 字左右。作用避免文本太长嵌入模型处理不了同时保证检索精度。向量嵌入用「嵌入模型Embedding Model」把每个文本块转换成一串数字向量 Embeddings。大白话给每段文字生成「数字身份证」语义越像向量越接近。存储索引把所有向量原文存进向量数据库做好索引。作用后续用户提问时能一秒从海量数据里找到最相关的内容。阶段核心作用把「人类能看懂的文档」变成「AI 能快速检索的向量库」为后续问答做准备。1.2 阶段 2检索阶段用户提问后第一步对应图中绿框是 RAG 的「搜索环节」核心是从向量库中找到和用户问题最相关的资料。1.2.1 完整流程用户提问User Query员工问「我去北京出差 3 天审批流程是什么」问题向量化用和建库时完全相同的嵌入模型把用户问题也转换成向量。关键必须用同一个模型否则向量空间不一致检索会完全失效。相似度搜索拿着问题的向量去向量数据库里做余弦相似度搜索捞出最相关的 Top3/Top5 文本块。例子匹配到「出差审批流程」「申请时限」这两段最相关的制度原文。1.2.2 阶段核心作用精准筛选出和用户问题相关的知识过滤无关内容为大模型提供「靠谱的参考资料」。1.3 阶段 3增强阶段Prompt 工程核心对应图中黄框是 RAG 的「灵魂环节」核心是把检索到的资料变成大模型能理解、能遵守的 Prompt也就是「检索增强」的核心。1.3.1 完整流程组装上下文把检索到的相似向量对应的原文作为「上下文 Context」。套用提示词模板用提前写好的 Prompt 模板把「上下文用户问题」拼成完整的 Prompt。模板就是你学的「提示词五要素」核心要求只基于上下文回答不准瞎编。示例【参考资料】{检索到的差旅制度原文}【用户问题】我去北京出差 3 天审批流程是什么请严格基于参考资料回答不得编造任何信息。生成最终 PromptPrompt Context User Query发给大模型。1.3.2 阶段核心作用用「提示词约束」「上下文注入」强制大模型只从给定资料里回答彻底解决幻觉问题这就是「增强」的本质。1.4 阶段 4生成阶段最终输出对应图中蓝框是 RAG 的「收尾环节」核心是大模型基于参考资料生成最终回答。完整流程大模型推理LLM大模型拿到 Prompt只根据参考资料生成符合要求的回答。例子大模型根据制度准确告诉你审批流程、申请时限不会乱编公司没有的规则。返回给用户把生成的回答原样返回给提问的员工完成一次问答。阶段核心作用把「结构化的参考资料」转换成「自然、通顺、符合人类习惯的回答」完成从「知识检索」到「智能问答」的闭环。

更多文章

前端开发 2026/6/9 0:29:32

5个核心技术模块构建现代化智能Agent系统：fast-agent框架深度解析

5个核心技术模块构建现代化智能Agent系统：fast-agent框架深度解析【免费下载链接】fast-agent Code, Build and Evaluate agents - excellent Model and Skills/MCP/ACP Support 项目地址: https://gitcode.com/gh_mirrors/fa/fast-agent 在当今AI技术快速发…

张开发

前端开发 2026/6/9 0:26:30

信捷XDH PLC与西门子V20变频器Modbus通讯实践：功能实现、配件说明及参数设置

信捷XDH/PLC与西门子V20变频器通讯案例程序功能：信捷XDH/PLC与西门子V20变频器进行modbus通讯，实现正转、反转、点动、停止、和速度参数的写入,以及变频器运行频率、输出电流、输出电压的读取，PLCcom1与触摸屏通讯，com2与西门子V…

张开发

前端开发 2026/6/9 0:23:58

论“贾子哲学”理论体系的建构逻辑与“鸽姆智库”的学术-实践范式

论“贾子哲学”理论体系的建构逻辑与“鸽姆智库”的学术-实践范式摘要：在21世纪全球化和高度复杂性的时代语境下，传统哲学范式在应对非线性社会现实时呈现出显著的解释力滞后，而现代智库往往因缺乏深层本体论支撑而陷入“技术主义”与“短视主…

张开发

前端开发 2026/6/9 0:27:16

seo网站优化软件的售后服务如何

SEO网站优化软件的售后服务如何随着互联网市场的快速发展，越来越多的企业开始重视SEO网站优化软件。这些软件在提升网站排名和流量方面起到了关键作用。购买后的售后服务往往被忽视，但其实，优质的售后服务对于一个软件的长期成功至关重要。…

张开发

前端开发 2026/6/9 0:22:55

《Windows Internals》10.1.11 应用程序 Hive（Application hives）：为什么 Windows 要允许应用拥有“只对自己可见”的私有注册表？

🔥个人主页：杨利杰YJlio❄️个人专栏：《Sysinternals实战教程》《Windows PowerShell 实战》《WINDOWS教程》《IOS教程》《微信助手》《锤子助手》《Python》《Kali Linux》《那些年未解决的Windows疑难杂症》🌟 让复杂的事情更…

张开发

前端开发 2026/6/9 0:29:31

1-9-13-14-20

1/* 给定一个整数数组 nums 和一个整数目标值 target， 请你在该数组中找出和为目标值 target 的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案，并且你不能使用两次相同的元素。你可以按任意顺序返回答案。示例 1…

张开发

前端开发 2026/5/25 6:23:08

城市内涝预警新思路：如何用YOLO实例分割模型+监控视频流实时监测路面积水？

城市内涝预警新思路：基于YOLO实例分割与视频流分析的实时积水监测系统暴雨季节的城市道路积水问题一直是困扰市政管理和交通安全的重要隐患。传统的人工巡查和定点传感器监测方式存在覆盖范围有限、响应速度慢等缺陷。本文将详细介绍如何利用YOLO实例分割模型结合实…

张开发

前端开发 2026/6/3 3:49:40

OpenClaw模型微调实践：千问3.5-35B-A3B-FP8适配专业领域自动化任务

OpenClaw模型微调实践：千问3.5-35B-A3B-FP8适配专业领域自动化任务 1. 为什么需要专业领域微调？ 去年我接手了一个法律文书自动化处理的需求，发现直接用通用大模型效果并不理想。当OpenClaw调用千问3.5处理合同条款时，模型经常把…

张开发

前端开发 2026/5/25 6:24:06

HarmonyOS 5.0实战：基于Promise与拦截器构建企业级网络请求库

1. 为什么企业级应用需要更强大的网络请求库在开发一个中型电商App时，网络请求就像App的血管系统，负责在各个功能模块之间输送数据。你可能已经用过简单的HTTP请求封装，但当用户量达到十万级别时，问题就开始显现了：某…

张开发

前端开发 2026/5/26 13:12:27

Your build is currently configured to use incompatible Java 26 and Gradle 8.13. Cannot sync the proj

Your build is currently configured to use incompatible Java 26 and Gradle 8.13. Cannot sync the project. The maximum compatible Gradle JVM version is 23. 版本不匹配：你的项目使用了 Java 26（最新版本），但 Gradle 8.1…

张开发

前端开发 2026/5/25 6:22:41

SEO 关键词优化对于电商网站有哪些具体应用_SEO 关键词优化与广告投放之间的联系是什么

SEO 关键词优化对于电商网站有哪些具体应用在电商网站的运营中，SEO 关键词优化扮演着不可或缺的角色。随着互联网的发展，越来越多的消费者在搜索引擎上寻找产品和服务，这使得SEO 关键词优化成为提升电商网站流量和销售的关键手段之一。SEO …

张开发

前端开发 2026/6/8 18:02:35

华硕笔记本轻量级替代方案：G-Helper性能调校完全指南

华硕笔记本轻量级替代方案：G-Helper性能调校完全指南【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix, Sca…

张开发

【RAG】RAG模型的过程

最新文章

Mac Mouse Fix终极指南：让你的普通鼠标秒变苹果触控板！[特殊字符]

mysql事务什么时候需要回滚_mysql异常处理解析

虚拟线程在Spring WebFlux中偷偷泄露数据库连接？深度剖析ThreadLocal跨虚拟线程失效的5类隐蔽漏洞，立即修复！

别再傻傻分不清了！一张图看懂NI USRP和Ettus USRP的区别与选型

从“鱼与熊掌”到帕累托最优：NSGA-II算法如何帮你做更聪明的决策？

2026年高并发AI应用架构指南：5款主流大模型API中转服务性能横评与接入实战

推荐文章

相关文章

分享文章

更多文章

5个核心技术模块构建现代化智能Agent系统：fast-agent框架深度解析

信捷XDH PLC与西门子V20变频器Modbus通讯实践：功能实现、配件说明及参数设置

论“贾子哲学”理论体系的建构逻辑与“鸽姆智库”的学术-实践范式

seo网站优化软件的售后服务如何

《Windows Internals》10.1.11 应用程序 Hive（Application hives）：为什么 Windows 要允许应用拥有“只对自己可见”的私有注册表？

1-9-13-14-20

城市内涝预警新思路：如何用YOLO实例分割模型+监控视频流实时监测路面积水？

OpenClaw模型微调实践：千问3.5-35B-A3B-FP8适配专业领域自动化任务

HarmonyOS 5.0实战：基于Promise与拦截器构建企业级网络请求库

Your build is currently configured to use incompatible Java 26 and Gradle 8.13. Cannot sync the proj

SEO 关键词优化对于电商网站有哪些具体应用_SEO 关键词优化与广告投放之间的联系是什么

华硕笔记本轻量级替代方案：G-Helper性能调校完全指南