01-RAG学习路线与文档链接目录

138 阅读4分钟

RAG学习路线与文档链接目录

RAG(检索增强生成)技术学习路线与专栏文档链接目录

📋 专栏概述

RAG(检索增强生成)是将信息检索与大语言模型结合的技术框架,它能通过从外部知识库检索相关信息来增强模型输出的准确性、时效性和可溯源性,有效解决知识幻觉问题。本专栏基于最新技术趋势,涵盖RAG核心概念、数据预处理、向量化技术、检索算法、重排序优化以及大模型集成等关键技术,帮助开发者从入门到精通掌握企业级RAG应用开发。

📌 文档更新说明:本专栏文档会不定期更新,随着新文档的发布,将及时在下方链接目录中添加对应的在线文档链接。

1. 为什么需要学习RAG

我们发现大语言模型(LLM)存在一些固有缺陷,比如知识时效性滞后、幻觉问题频发、领域专业知识不足等。通过引入RAG技术,我们能够有效解决这些问题。在企业级应用中,我们将学会如何让AI系统实时访问最新数据、提供专业领域知识支撑、确保回答可追溯验证。RAG已成为智能客服、企业知识库、法律医疗助手等知识密集型场景的标配技术,掌握这项技术是我们作为AI开发者的核心能力要求。

2. 学习阶段概览

flowchart TD
    A[1.RAG核心概念与架构] --> B[2.数据预处理流水线]
    B --> C[3.智能文档解析技术]
    C --> D[4.文本分块策略设计]
    D --> E[5.Embedding模型与向量化]
    E --> F[6.向量数据库构建与优化]
    F --> G[7.检索算法与策略]
    G --> H[8.检索结果重排序]
    H --> I[9.提示词工程与上下文组装]
    I --> J[10.生成模型调用与输出优化]
    J --> K[11.RAG系统评估体系]
    K --> L[12.高级优化技术]
    L --> M[13.生产环境部署与运维]
    M --> N[14.完整项目实战]

📚 专栏文档链接目录(按学习顺序排序)

01-RAG学习路线

02-RAG核心概念与架构

03-数据预处理流水线

04-智能文档解析技术

04a-LayoutParser安装指南

05-文本分块策略设计

06-Embedding模型与向量化

07-向量数据库构建与优化

08a-检索算法与策略-稠密检索技术

08b-检索算法与策略-稀疏检索

08c-检索算法与策略-混合检索

08d-布隆过滤器是什么?

09-检索结果重排序与优化-重排序基本原理

10-重排序模型实战-BGE-Rerank应用

11a-阿里云大模型API调用基础

11b-OpenAI API密钥获取指南

11c-Token智能压缩技术


最后更新时间:2026-03-18