转RAG方向时的思考以及计划

5 阅读5分钟

我本人是一位iOS开发工程师,现在AI技术发展迅猛,对于一个开发者来说,要随时拥抱新技术,更别说AI对于软件开发行业冲击特别大了.经过再三思考,决定转RAG方向.

RAG 是 检索增强生成(Retrieval-Augmented Generation)  的缩写,是当前大语言模型(LLM)领域一项非常重要的技术 简单来说,它的核心思想是:在让大模型回答问题之前,先让它去一个可靠的知识库里“查资料”,然后把查到的资料和问题一起交给模型,让它基于资料来生成答案。

为什么需要 RAG?

大语言模型(如GPT)虽然强大,但存在两个固有缺陷:

  1. 知识截止日期:模型训练好后,知识就凝固了。它不知道训练截止日期之后发生的事情。
  2. “幻觉”问题:当模型不知道答案时,它可能会“编造”一个听起来合理但错误的答案。

RAG 正是为了解决这两个问题而生的。

⚙️ RAG 的工作原理

RAG 的工作流程通常分为三个步骤:

  1. 检索

    • 用户提出一个问题。
    • 系统将问题转换为向量(一种数学表示),去一个预先建立好的知识库(如公司内部文档、最新的网页、专业书籍等)中进行搜索。
    • 系统找出与问题最相关的几段文本内容。
  2. 增强

    • 系统将用户原本的问题,和刚才检索到的相关文本内容,组合成一条新的、更完整的指令(Prompt)。
  3. 生成

    • 大语言模型接收这条包含“参考资料”的指令。
    • 模型基于提供的资料来生成答案,而不是依赖自己可能过时或不准确的内部知识。

💡 RAG 的价值与优势

  • 解决“幻觉” :模型不再凭空编造,而是有据可依,答案的准确性大幅提升。
  • 知识实时更新:只需更新外部的知识库,无需重新训练昂贵的模型,就能让AI掌握最新信息。
  • 提高透明度:RAG 可以展示引用了哪些资料,用户可以去查证,增加了可信度。
  • 利用私有知识:企业可以将内部文档、数据库作为知识库,打造出真正懂业务的“企业大脑”,同时保证数据不外泄。

🆚 RAG 与 微调

这是两个经常被放在一起比较的概念。它们的目的都是让模型更好地完成特定任务,但思路完全不同:

维度RAG(检索增强生成)微调
思路让模型 “开卷考试” ,边查资料边回答。让模型 “闭卷考试” ,将新知识“背诵”进参数里。
成本。无需训练,主要成本是调用模型和搭建向量库。。需要GPU算力进行模型训练,对硬件和技术要求高。
数据更新实时。知识库一变,答案立刻变。滞后。知识更新需要重新训练模型。
适用场景知识问答、客服、需要引用来源的场景。改变模型风格、学习特定格式、小规模专业领域知识。

🌟 实际应用场景

RAG 技术的应用非常广泛,比如:

  • 智能客服:让AI读取最新的产品说明书和售后政策,准确回答用户问题。
  • 企业知识库问答:员工可以像聊天一样,向AI询问公司内部的规章制度、项目文档。
  • 法律/医疗助手:让AI基于最新的法律法规或医学文献,辅助专业人士进行研究和分析。
  • 实时信息获取:让AI联网搜索最新新闻,然后结合搜索结果进行总结。

总的来说,RAG 是一种低成本、高效率、高可靠性的方法,它让大模型从依赖“死记硬背”转向了“理解与表达”,极大地扩展了大语言模型的应用边界。

从 iOS 开发 转向 RAG(检索增强生成)方向,是一次跨度不小但有清晰路径可循的转型。你已有的工程能力和对移动端用户体验的敏感度,其实是很大的优势。

下面我从 能力匹配、技术补全、学习路径、项目实战、求职策略 五个方面,帮你理清怎么转。


我的存量优势(iOS → RAG 的桥梁)

很多 iOS 开发者在转 AI 应用时会低估自己的存量能力,但其实以下几点非常值钱:

你的现有能力在 RAG 方向的价值
扎实的编程与架构能力RAG 本质是“AI + 工程”,工程部分占 70% 以上
网络 / 多线程 / 存储经验向量数据库、异步 pipeline、缓存策略完全相通
移动端落地经验RAG 最终大量场景在 App 内(智能助手、文档问答)
对 UI/UX 的理解RAG 应用最难的往往不是模型,而是交互与体验
调试与问题定位能力RAG 链路长(检索 → 排序 → 生成),非常需要工程化排查能力

你不是“从头学起”,而是“在工程底座上长出新能力”

学习计划(3–6 个月)

第 1 阶段:Python + LLM 基础(2–3 周)

  • 学习资源:

    • 《Python 工匠》
    • FastAPI 官方教程
    • LangChain / LlamaIndex 官方 Quickstart
  • 产出:一个能调用 LLM API 的命令行工具

第 2 阶段:完整 RAG 项目(4–6 周)

做一个你熟悉的领域项目(这一点很重要)

👉 推荐项目(结合你的 iOS 背景):

「iOS 开发文档问答助手」

  • 爬取:Apple Developer Documentation、WWDC 文本
  • 分块 + Embedding + 向量库
  • 实现问答接口
  • 可选:做成一个 iOS Demo App

这个项目的好处:

  • 你懂领域,知道什么是“好答案”
  • 面试时能讲出深度
  • 天然体现“移动端 + AI”的转型路径

第 3 阶段:进阶与工程化(3–4 周)

  • 增加 Rerank 模块
  • 增加 HyDESelf-RAG 等高级策略
  • 做 评估体系(用真实问题集)
  • 尝试 部署(Docker + 云服务)

第 4 阶段:构建作品集(持续)

  • GitHub 上维护 2–3 个高质量 RAG 项目
  • 写 1–2 篇技术文章(很加分)
  • 把你的 iOS 项目“AI 化”一个真实功能