RAG与Agent性能调优50讲 / 全面掌握高性能 RAG 系统构建与优化能力

Name: RAG与Agent性能调优50讲
Author: 尹会生

尹会生大模型领域连续创业者 & 技术战略专家

更新：2026-07-05 09:09:01

课程目录
课程介绍

02｜跨页表格怎么自动对齐合并？实现结构化输出的关键技术实战
03上｜领域术语总混淆？构建精准术语词库，提升检索一致性
03下｜领域术语总混淆？构建精准术语词库，提升检索一致性
04上｜切片语义割裂怎么办？基于滑动窗口+关键词的语义段落识别
04下｜切片语义割裂怎么办？基于滑动窗口+关键词的语义段落识别
05｜固定切片召回率低？动态重叠切片机制显著提升覆盖率
06｜OCR文本错漏频发？结合LLM纠错，让图像文本也能精准使用
07｜图像切分不合理？文本图像矫正和版面区域检测保障信息完整且不冗余
08｜打造可配置、可扩展的自动化预处理流水线
09｜FAISS、HNSW还是BM25？如何选择最适合业务的向量检索引擎？
10｜多阶段召回总不准？设计高效混合检索架构提升覆盖率与精度
11｜HNSW参数调优难？掌握SQ8量化压缩技术，实现速度与准确率平衡
12｜用户查询太模糊？用查询扩展提升语义匹配能力
13｜稀疏查询召回差？HyDE伪文档生成技术解决冷启动问题
14｜多路召回融合难？动态阈值机制确保高质量结果优先排序
15｜政策文档检索总是漏关键点？构建高精度垂直领域检索系统
16｜如何科学调节切片长度与滑动窗口？结合倒排索引与向量索引对比优化
17｜模型忽略关键实体怎么办？注意力权重分配机制引导生成聚焦重点
18｜生成内容出错？构建事实验证链+溯源标注方案有效抑制幻觉
19｜资源有限还想微调大模型？掌握LoRA参数高效方法适配垂直领域
20｜轻量级部署术语准确率低？Adapter网络微调实现低开销优化
21｜提示词效果不稳定？上下文融合Prompt工程显著提升生成质量
22｜多个模型不知选哪个？设计多模型路由机制智能选择最优生成器
23｜长文本生成结构混乱？使用记忆网络与分段生成，确保长文内容逻辑清晰、结构完整
24｜金融问答系统生成不准？端到端流程优化提升结果可靠性
25｜Agentic RAG原理与多阶段任务分解机制详解
26｜工具调用效率优化：基于Top Agent与Tool Agent的协同调度架构
27｜如何让Agent智能选工具？Gumbel-Softmax决策算法实现自动选择
28｜Agent记不住历史信息？Memory Transformer实现长期记忆建模
29｜动态任务规划支持复杂推理与执行，实战构建合规审查系统
30｜图文混合文档解析难？OCR+LLM三阶段提取与联合索引构建
31｜文本与图像怎么一起检索？跨模态Embedding融合实现图文召回
32｜自然语言怎么转SQL？Text2SQL生成与Schema自适应策略
33｜如何用向量数据库搜索图像？基于Milvus的图像嵌入与相似性检索实践
34｜CRAG自修正机制提升文档匹配精度与召回稳定性
35｜多模态任务怎么做评估？详解跨模态检索与生成的质量评价方法
期中编程作业

课程介绍

限时福利你将获得深度覆盖：一站搞定 Python 工程化到 LLM 企业级部署广度兼容：数据预处理、RAG 检索优化、评估指标体系等前沿融合：引入 Agent-RAG 架构设计与多模态综合处理工程闭环：9...

限时福利

你将获得

深度覆盖：一站搞定 Python 工程化到 LLM 企业级部署
广度兼容：数据预处理、RAG 检索优化、评估指标体系等
前沿融合：引入 Agent-RAG 架构设计与多模态综合处理
工程闭环：9 大真实行业案例，实战大模型优化与微调进阶

讲师介绍

曾服务于金山、新浪等大型企业；研发有「生成式 AI 知识库+智能硬件」融合系统；国内首批大模型工业化应用实践者，创新性将 RAG 技术应用于智能制造领域，实现业务流程智能化升级，平均效能提升 30% 以上；工业自动驾驶系统架构师，基于点云与运动控制技术路径规划算法，获 2 项技术发明专利；当前聚焦打造新一代企业级 AI Agent 平台，通过自主知识产权的 RAG 引擎，助力金融、制造、法律、审计等领域客户实现知识资产智能化转型。

头部科技教育平台专家（极客时间/得到 APP），课程累计学习人数超 22 万人，出品《ACP 大模型认证训练营》《AIGC 应用实战营》《21 天 AIGC 行动营》《AI 数据分析课》《零基础学 Python》《Linux 实战技能 100 讲》《动手学 DeepSeek 22 讲》等多门爆款课程，广受好评；全栈技术实践者，横跨智能硬件研发、工业物联网架构、企业级 SaaS 开发三大领域；大模型应用布道者，年交付 1000+ 高管培训人天，独创的「场景化 Prompt 工程方法论」被多家机构纳入内部标准；企业智能化转型顾问，2023～2024 年为中金所/中国银联/华润集团/VMware/安永等 30+ 世界 500 强企业构建 AI 赋能体系。

课程介绍

在大模型应用落地日益深入的今天，RAG（Retrieval-Augmented Generation）技术已成为连接通用语言模型与垂直领域知识的关键桥梁。它不仅能够显著提升模型在特定任务中的表现，还能有效解决模型幻觉、知识更新滞后、生成内容不准确等问题。

然而，在实际开发中，许多工程师和技术团队却常常陷入以下困境：

文档检索总是遗漏关键信息？
模型生成内容频繁出错，影响业务信任度？
提示词效果不稳定，难以形成标准化流程？
长文本输入导致推理卡顿，性能瓶颈难突破？
系统面对高频请求时响应迟缓，稳定性堪忧？
RAG 整体效果如何评估？缺乏科学衡量标准？

这些问题的背后，是 RAG 技术栈中隐藏的工程挑战与性能瓶颈——而这些，正是我们为你打造这门课的核心出发点。

本课程是专为中级开发工程师、初入大模型领域的从业者量身打造的企业级 RAG 实战指南，聚焦于高性能、可落地的 RAG 系统构建与调优能力，帮助你在真实业务场景中实现从“会用”到“精通”的跨越。

课程以 Python 工程化 + LangChain等技术栈应用 + 开源企业级 RAG 平台实践为主线，贯穿数据预处理、模型选型、性能调优、多模态扩展、Agentic 架构设计、监控评估等多个核心环节，覆盖医疗问诊、智能客服、法律检索等典型行业场景。

你将亲手打造的实战项目包括：

高精度垂直领域检索系统
支持多跳推理的法律长文本问答系统
医疗领域的糖尿病问答引擎
可配置的 Agentic RAG 架构
图文混合检索引擎
高并发下的缓存与部署优化方案

通过大量实战案例与代码解析，可以帮助你在复杂场景中建立系统性认知，提升解决实际问题的能力，真正做到“知其然，更知其所以然”。

最终，不再让 RAG 成为“纸上谈兵”，这一次，让你真正拥有“落地能力”。

课程目录

适合人群

中级 Python 开发工程师
初级大模型 / NLP 开发工程师
希望转型 AI 工程落地的技术经理/架构师
对 RAG 系统、LLM 性能优化有实际需求的企业开发者

02｜跨页表格怎么自动对齐合并？实现结构化输出的关键技术实战

03上｜领域术语总混淆？构建精准术语词库，提升检索一致性

03下｜领域术语总混淆？构建精准术语词库，提升检索一致性

04上｜切片语义割裂怎么办？基于滑动窗口+关键词的语义段落识别

04下｜切片语义割裂怎么办？基于滑动窗口+关键词的语义段落识别

05｜固定切片召回率低？动态重叠切片机制显著提升覆盖率

06｜OCR文本错漏频发？结合LLM纠错，让图像文本也能精准使用

07｜图像切分不合理？文本图像矫正和版面区域检测保障信息完整且不冗余

08｜打造可配置、可扩展的自动化预处理流水线

09｜FAISS、HNSW还是BM25？如何选择最适合业务的向量检索引擎？

10｜多阶段召回总不准？设计高效混合检索架构提升覆盖率与精度

11｜HNSW参数调优难？掌握SQ8量化压缩技术，实现速度与准确率平衡

12｜用户查询太模糊？用查询扩展提升语义匹配能力

13｜稀疏查询召回差？HyDE伪文档生成技术解决冷启动问题

14｜多路召回融合难？动态阈值机制确保高质量结果优先排序

15｜政策文档检索总是漏关键点？构建高精度垂直领域检索系统

16｜如何科学调节切片长度与滑动窗口？结合倒排索引与向量索引对比优化

17｜模型忽略关键实体怎么办？注意力权重分配机制引导生成聚焦重点

18｜生成内容出错？构建事实验证链+溯源标注方案有效抑制幻觉

19｜资源有限还想微调大模型？掌握LoRA参数高效方法适配垂直领域

20｜轻量级部署术语准确率低？Adapter网络微调实现低开销优化

21｜提示词效果不稳定？上下文融合Prompt工程显著提升生成质量

22｜多个模型不知选哪个？设计多模型路由机制智能选择最优生成器

23｜长文本生成结构混乱？使用记忆网络与分段生成，确保长文内容逻辑清晰、结构完整

24｜金融问答系统生成不准？端到端流程优化提升结果可靠性

25｜Agentic RAG原理与多阶段任务分解机制详解

26｜工具调用效率优化：基于Top Agent与Tool Agent的协同调度架构

27｜如何让Agent智能选工具？Gumbel-Softmax决策算法实现自动选择

28｜Agent记不住历史信息？Memory Transformer实现长期记忆建模

29｜动态任务规划支持复杂推理与执行，实战构建合规审查系统

30｜图文混合文档解析难？OCR+LLM三阶段提取与联合索引构建

31｜文本与图像怎么一起检索？跨模态Embedding融合实现图文召回

32｜自然语言怎么转SQL？Text2SQL生成与Schema自适应策略

33｜如何用向量数据库搜索图像？基于Milvus的图像嵌入与相似性检索实践

34｜CRAG自修正机制提升文档匹配精度与召回稳定性

35｜多模态任务怎么做评估？详解跨模态检索与生成的质量评价方法

期中编程作业

课程介绍

限时福利

你将获得

讲师介绍

课程介绍

课程目录

适合人群

订阅须知