RAG与Agent性能调优50讲

RAG与Agent性能调优50讲 / 全面掌握高性能 RAG 系统构建与优化能力

尹会生 大模型领域连续创业者 & 技术战略专家

  • 课程介绍
  1. 02|跨页表格怎么自动对齐合并?实现结构化输出的关键技术实战

  2. 03上|领域术语总混淆?构建精准术语词库,提升检索一致性

  3. 03下|领域术语总混淆?构建精准术语词库,提升检索一致性

  4. 04上|切片语义割裂怎么办?基于滑动窗口+关键词的语义段落识别

  5. 04下|切片语义割裂怎么办?基于滑动窗口+关键词的语义段落识别

  6. 05|固定切片召回率低?动态重叠切片机制显著提升覆盖率

  7. 06|OCR文本错漏频发?结合LLM纠错,让图像文本也能精准使用

  8. 07|图像切分不合理?文本图像矫正和版面区域检测保障信息完整且不冗余

  9. 08|打造可配置、可扩展的自动化预处理流水线

  10. 09|FAISS、HNSW还是BM25?如何选择最适合业务的向量检索引擎?

  11. 10|多阶段召回总不准?设计高效混合检索架构提升覆盖率与精度

  12. 11|HNSW参数调优难?掌握SQ8量化压缩技术,实现速度与准确率平衡

  13. 12|用户查询太模糊?用查询扩展提升语义匹配能力

  14. 13|稀疏查询召回差?HyDE伪文档生成技术解决冷启动问题

  15. 14|多路召回融合难?动态阈值机制确保高质量结果优先排序

  16. 15|政策文档检索总是漏关键点?构建高精度垂直领域检索系统

  17. 16|如何科学调节切片长度与滑动窗口?结合倒排索引与向量索引对比优化

  18. 17|模型忽略关键实体怎么办?注意力权重分配机制引导生成聚焦重点

  19. 18|生成内容出错?构建事实验证链+溯源标注方案有效抑制幻觉

  20. 19|资源有限还想微调大模型?掌握LoRA参数高效方法适配垂直领域

  21. 20|轻量级部署术语准确率低?Adapter网络微调实现低开销优化

  22. 21|提示词效果不稳定?上下文融合Prompt工程显著提升生成质量

  23. 22|多个模型不知选哪个?设计多模型路由机制智能选择最优生成器

  24. 23|长文本生成结构混乱?使用记忆网络与分段生成,确保长文内容逻辑清晰、结构完整

  25. 24|金融问答系统生成不准?端到端流程优化提升结果可靠性

  26. 25|Agentic RAG原理与多阶段任务分解机制详解

  27. 26|工具调用效率优化:基于Top Agent与Tool Agent的协同调度架构

  28. 27|如何让Agent智能选工具?Gumbel-Softmax决策算法实现自动选择

  29. 28|Agent记不住历史信息?Memory Transformer实现长期记忆建模

  30. 29|动态任务规划支持复杂推理与执行,实战构建合规审查系统

  31. 30|图文混合文档解析难?OCR+LLM三阶段提取与联合索引构建

  32. 31|文本与图像怎么一起检索?跨模态Embedding融合实现图文召回

  33. 32|自然语言怎么转SQL?Text2SQL生成与Schema自适应策略

  34. 33|如何用向量数据库搜索图像?基于Milvus的图像嵌入与相似性检索实践

  35. 34|CRAG自修正机制提升文档匹配精度与召回稳定性

  36. 35|多模态任务怎么做评估?详解跨模态检索与生成的质量评价方法

  37. 期中编程作业

课程介绍

限时福利 你将获得 深度覆盖:一站搞定 Python 工程化到 LLM 企业级部署 广度兼容:数据预处理、RAG 检索优化、评估指标体系等 前沿融合:引入 Agent-RAG 架构设计与多模态综合处理 工程闭环:9...

限时福利


你将获得

  • 深度覆盖:一站搞定 Python 工程化到 LLM 企业级部署
  • 广度兼容:数据预处理、RAG 检索优化、评估指标体系等
  • 前沿融合:引入 Agent-RAG 架构设计与多模态综合处理
  • 工程闭环:9 大真实行业案例,实战大模型优化与微调进阶

讲师介绍

曾服务于金山、新浪等大型企业;研发有「生成式 AI 知识库+智能硬件」融合系统;国内首批大模型工业化应用实践者,创新性将 RAG 技术应用于智能制造领域,实现业务流程智能化升级,平均效能提升 30% 以上;工业自动驾驶系统架构师,基于点云与运动控制技术路径规划算法,获 2 项技术发明专利;当前聚焦打造新一代企业级 AI Agent 平台,通过自主知识产权的 RAG 引擎,助力金融、制造、法律、审计等领域客户实现知识资产智能化转型。

头部科技教育平台专家(极客时间/得到 APP),课程累计学习人数超 22 万人,出品《ACP 大模型认证训练营》《AIGC 应用实战营》《21 天 AIGC 行动营》《AI 数据分析课》《零基础学 Python》《Linux 实战技能 100 讲》《动手学 DeepSeek 22 讲》等多门爆款课程,广受好评;全栈技术实践者,横跨智能硬件研发、工业物联网架构、企业级 SaaS 开发三大领域;大模型应用布道者,年交付 1000+ 高管培训人天,独创的「场景化 Prompt 工程方法论」被多家机构纳入内部标准;企业智能化转型顾问,2023~2024 年为中金所/中国银联/华润集团/VMware/安永等 30+ 世界 500 强企业构建 AI 赋能体系。


课程介绍

在大模型应用落地日益深入的今天,RAG(Retrieval-Augmented Generation)技术已成为连接通用语言模型与垂直领域知识的关键桥梁 。它不仅能够显著提升模型在特定任务中的表现,还能有效解决模型幻觉、知识更新滞后、生成内容不准确等问题。

然而,在实际开发中,许多工程师和技术团队却常常陷入以下困境:

  • 文档检索总是遗漏关键信息?
  • 模型生成内容频繁出错,影响业务信任度?
  • 提示词效果不稳定,难以形成标准化流程?
  • 长文本输入导致推理卡顿,性能瓶颈难突破?
  • 系统面对高频请求时响应迟缓,稳定性堪忧?
  • RAG 整体效果如何评估?缺乏科学衡量标准?

这些问题的背后,是 RAG 技术栈中隐藏的工程挑战与性能瓶颈——而这些,正是我们为你打造这门课的核心出发点。

本课程是专为中级开发工程师、初入大模型领域的从业者量身打造的企业级 RAG 实战指南,聚焦于高性能、可落地的 RAG 系统构建与调优能力,帮助你在真实业务场景中实现从“会用”到“精通”的跨越。

课程以 Python 工程化 + LangChain等技术栈应用 + 开源企业级 RAG 平台实践为主线,贯穿数据预处理、模型选型、性能调优、多模态扩展、Agentic 架构设计、监控评估等多个核心环节,覆盖医疗问诊、智能客服、法律检索等典型行业场景。

你将亲手打造的实战项目包括:

  • 高精度垂直领域检索系统
  • 支持多跳推理的法律长文本问答系统
  • 医疗领域的糖尿病问答引擎
  • 可配置的 Agentic RAG 架构
  • 图文混合检索引擎
  • 高并发下的缓存与部署优化方案

通过大量实战案例与代码解析,可以帮助你在复杂场景中建立系统性认知,提升解决实际问题的能力,真正做到“知其然,更知其所以然”。

最终,不再让 RAG 成为“纸上谈兵”,这一次,让你真正拥有“落地能力”。


课程目录


适合人群

  • 中级 Python 开发工程师
  • 初级大模型 / NLP 开发工程师
  • 希望转型 AI 工程落地的技术经理/架构师
  • 对 RAG 系统、LLM 性能优化有实际需求的企业开发者

订阅须知