- 课程目录
- 课程介绍
-
02|跨页表格怎么自动对齐合并?实现结构化输出的关键技术实战
-
03上|领域术语总混淆?构建精准术语词库,提升检索一致性
-
03下|领域术语总混淆?构建精准术语词库,提升检索一致性
-
04上|切片语义割裂怎么办?基于滑动窗口+关键词的语义段落识别
-
04下|切片语义割裂怎么办?基于滑动窗口+关键词的语义段落识别
-
05|固定切片召回率低?动态重叠切片机制显著提升覆盖率
-
06|OCR文本错漏频发?结合LLM纠错,让图像文本也能精准使用
-
07|图像切分不合理?文本图像矫正和版面区域检测保障信息完整且不冗余
-
08|打造可配置、可扩展的自动化预处理流水线
-
09|FAISS、HNSW还是BM25?如何选择最适合业务的向量检索引擎?
-
10|多阶段召回总不准?设计高效混合检索架构提升覆盖率与精度
-
11|HNSW参数调优难?掌握SQ8量化压缩技术,实现速度与准确率平衡
-
12|用户查询太模糊?用查询扩展提升语义匹配能力
-
13|稀疏查询召回差?HyDE伪文档生成技术解决冷启动问题
-
14|多路召回融合难?动态阈值机制确保高质量结果优先排序
-
15|政策文档检索总是漏关键点?构建高精度垂直领域检索系统
-
16|如何科学调节切片长度与滑动窗口?结合倒排索引与向量索引对比优化
-
17|模型忽略关键实体怎么办?注意力权重分配机制引导生成聚焦重点
-
18|生成内容出错?构建事实验证链+溯源标注方案有效抑制幻觉
-
19|资源有限还想微调大模型?掌握LoRA参数高效方法适配垂直领域
-
20|轻量级部署术语准确率低?Adapter网络微调实现低开销优化
-
21|提示词效果不稳定?上下文融合Prompt工程显著提升生成质量
-
22|多个模型不知选哪个?设计多模型路由机制智能选择最优生成器
-
23|长文本生成结构混乱?使用记忆网络与分段生成,确保长文内容逻辑清晰、结构完整
-
24|金融问答系统生成不准?端到端流程优化提升结果可靠性
-
25|Agentic RAG原理与多阶段任务分解机制详解
-
26|工具调用效率优化:基于Top Agent与Tool Agent的协同调度架构
-
27|如何让Agent智能选工具?Gumbel-Softmax决策算法实现自动选择
-
28|Agent记不住历史信息?Memory Transformer实现长期记忆建模
-
29|动态任务规划支持复杂推理与执行,实战构建合规审查系统
-
30|图文混合文档解析难?OCR+LLM三阶段提取与联合索引构建
-
31|文本与图像怎么一起检索?跨模态Embedding融合实现图文召回
-
32|自然语言怎么转SQL?Text2SQL生成与Schema自适应策略
-
33|如何用向量数据库搜索图像?基于Milvus的图像嵌入与相似性检索实践
-
34|CRAG自修正机制提升文档匹配精度与召回稳定性
-
35|多模态任务怎么做评估?详解跨模态检索与生成的质量评价方法
-
期中编程作业
课程介绍
限时福利 你将获得 深度覆盖:一站搞定 Python 工程化到 LLM 企业级部署 广度兼容:数据预处理、RAG 检索优化、评估指标体系等 前沿融合:引入 Agent-RAG 架构设计与多模态综合处理 工程闭环:9...限时福利
你将获得
- 深度覆盖:一站搞定 Python 工程化到 LLM 企业级部署
- 广度兼容:数据预处理、RAG 检索优化、评估指标体系等
- 前沿融合:引入 Agent-RAG 架构设计与多模态综合处理
- 工程闭环:9 大真实行业案例,实战大模型优化与微调进阶
讲师介绍
曾服务于金山、新浪等大型企业;研发有「生成式 AI 知识库+智能硬件」融合系统;国内首批大模型工业化应用实践者,创新性将 RAG 技术应用于智能制造领域,实现业务流程智能化升级,平均效能提升 30% 以上;工业自动驾驶系统架构师,基于点云与运动控制技术路径规划算法,获 2 项技术发明专利;当前聚焦打造新一代企业级 AI Agent 平台,通过自主知识产权的 RAG 引擎,助力金融、制造、法律、审计等领域客户实现知识资产智能化转型。
头部科技教育平台专家(极客时间/得到 APP),课程累计学习人数超 22 万人,出品《ACP 大模型认证训练营》《AIGC 应用实战营》《21 天 AIGC 行动营》《AI 数据分析课》《零基础学 Python》《Linux 实战技能 100 讲》《动手学 DeepSeek 22 讲》等多门爆款课程,广受好评;全栈技术实践者,横跨智能硬件研发、工业物联网架构、企业级 SaaS 开发三大领域;大模型应用布道者,年交付 1000+ 高管培训人天,独创的「场景化 Prompt 工程方法论」被多家机构纳入内部标准;企业智能化转型顾问,2023~2024 年为中金所/中国银联/华润集团/VMware/安永等 30+ 世界 500 强企业构建 AI 赋能体系。
课程介绍
在大模型应用落地日益深入的今天,RAG(Retrieval-Augmented Generation)技术已成为连接通用语言模型与垂直领域知识的关键桥梁 。它不仅能够显著提升模型在特定任务中的表现,还能有效解决模型幻觉、知识更新滞后、生成内容不准确等问题。
然而,在实际开发中,许多工程师和技术团队却常常陷入以下困境:
- 文档检索总是遗漏关键信息?
- 模型生成内容频繁出错,影响业务信任度?
- 提示词效果不稳定,难以形成标准化流程?
- 长文本输入导致推理卡顿,性能瓶颈难突破?
- 系统面对高频请求时响应迟缓,稳定性堪忧?
- RAG 整体效果如何评估?缺乏科学衡量标准?
这些问题的背后,是 RAG 技术栈中隐藏的工程挑战与性能瓶颈——而这些,正是我们为你打造这门课的核心出发点。
本课程是专为中级开发工程师、初入大模型领域的从业者量身打造的企业级 RAG 实战指南,聚焦于高性能、可落地的 RAG 系统构建与调优能力,帮助你在真实业务场景中实现从“会用”到“精通”的跨越。
课程以 Python 工程化 + LangChain等技术栈应用 + 开源企业级 RAG 平台实践为主线,贯穿数据预处理、模型选型、性能调优、多模态扩展、Agentic 架构设计、监控评估等多个核心环节,覆盖医疗问诊、智能客服、法律检索等典型行业场景。
你将亲手打造的实战项目包括:
- 高精度垂直领域检索系统
- 支持多跳推理的法律长文本问答系统
- 医疗领域的糖尿病问答引擎
- 可配置的 Agentic RAG 架构
- 图文混合检索引擎
- 高并发下的缓存与部署优化方案
通过大量实战案例与代码解析,可以帮助你在复杂场景中建立系统性认知,提升解决实际问题的能力,真正做到“知其然,更知其所以然”。
最终,不再让 RAG 成为“纸上谈兵”,这一次,让你真正拥有“落地能力”。
课程目录

适合人群
- 中级 Python 开发工程师
- 初级大模型 / NLP 开发工程师
- 希望转型 AI 工程落地的技术经理/架构师
- 对 RAG 系统、LLM 性能优化有实际需求的企业开发者