元哥开讲:Prompt Engineering(六)给AI一个“外挂”和“工具箱”:RAG与ART的强强联合!

37 阅读6分钟

嘿,老铁们,元哥又来跟你们“传道授业”了!

上回书咱们聊到,通过“提示链”和“思维树”,已经能把AI从“单兵”调教成“军团”,能完成复杂的项目规划了。有朋友在后台问我:“元哥,我的AI军团已经能运筹帷幄了,能不能让它们别光说不练,真正地下场干活?”

问到点子上了!一个只会思考和规划的AI,说白了还是个“军师”。真正的王牌,得是那种既能“运筹帷幄”,又能“下场实干”的全能选手。

今天,咱们就来学习两招,给你的AI装上“外挂”和“工具箱”,让它从“军师”进化成“行动派”!

第一式:给AI一个“外挂”——检索增强生成 (RAG)

这招“RAG”,元哥之前在别的系列里聊过,但它在Prompt工程里是如此重要,必须再拿出来讲讲。

咱们都知道,大模型有个天生的“缺陷”:知识不是实时的。你问它昨天发生的新闻,它一概不知。而且它还特爱“一本正-经地胡说八道”,我们管这叫**“幻觉”**。

RAG(Retrieval-Augmented Generation)就是专治这俩毛病的“神丹妙药”。

它的玩法,就是给AI请了个“外部资料检索员”。

这就好比,你让AI写一份关于“最新显卡RTX 5090”的报告。

  • 没有RAG的AI: 知识停留在2023年,只能告诉你“RTX 4090很牛”,然后开始瞎编5090的参数。
  • 有RAG的AI: 它会先让“检索员”去网上(你的外部知识库)搜刮一堆关于RTX 5090的最新评测、新闻和数据,然后把这些“新鲜资料”和你的问题一起阅读,最后给你一份信息准确、有理有据的报告。

RAG的核心就是“先检索,再生成”。 它给AI接上了一个“外置硬盘”或“实时网线”,让AI的知识库瞬间变得无限大且实时更新,从根源上消灭了“知识过时”和大部分“幻觉”问题。

第二式:给AI一个“工具箱”——自动推理与工具使用 (ART)

如果说RAG给AI的是“知识”,那ART(Automatic Reasoning and Tool-use)给AI的就是“技能”。

ART这个框架,牛就牛在它教会了AI一件事:模仿学习,举一反三,并自主使用工具。

这就好比,你手下有一个聪明的实习生,他手上有一本“公司项目SOP手册”(任务库)。 这本手册里,记载了如何解决“历史问题”、“数学问题”、“代码问题”等多种案例的详细步骤。

现在,你给了他一个他从未见过的“物理问题”。他会怎么做? 他会翻开SOP手册,发现虽然没有“物理问题”的模板,但解决“历史问题”需要用到【搜索引擎】,解决“数学问题”需要用到【代码计算器】。于是,他“举一反三”,给自己规划了一个全新的SOP:

  1. 用【搜索引擎】查解决这个物理问题需要的公式。
  2. 用【代码计算器】把题目里的数值带入公式进行计算。
  3. 得出最终答案。

这个过程,就是ART的精髓。

【玩法解密】: ART的核心,是让AI面对一个新任务时,从一个“任务库”(Task Library)中,自动挑选出几个“解决范例”,然后模仿这些范例的“解题思路”,为新任务生成一个包含多个步骤和“工具调用”的“执行程序”。

【一个ART解决物理问题的例子】: 新任务:

“一个物体,质量6.8克,带电58mC,在一个7.2 N/C的电场里运动。如果它一开始的速度是...,请问0.7秒后它的速度是多少?”

ART的执行过程:

  1. 模仿学习: AI在“任务库”中看到,解决其他问题时,可以先用[search]工具查资料,再用[generate code][code execute]工具做计算。
  2. 生成新程序: 于是,它为这个新的物理问题,生成了如下“程序”:

    Q1: [search] "计算带电粒子在电场中运动速度的公式是什么?" #1: (搜索引擎返回公式 F=ma, a=qE/m, v_f = v_i + at)

    Q2: [generate code] "请使用Python代码,根据公式 a=qE/m 和 v_f = v_i + at,计算最终速度。已知 q=58e-3, m=6.8e-5, E=7.2, v_i=..., t=0.7" #2: (AI生成了一段Python代码)

    q = 58e-3
    m = 6.8e-5
    # ... 其他变量 ...
    a = (q * E) / m
    v_f = v_i + a * t
    print(v_f)
    

    Q3: [code execute] "执行上面的Python代码" #3: (代码解释器返回计算结果,例如 4200000.0)

    Q4: [EOQ] Ans: 4200000.0

ART最强大的地方在于**“跨任务泛化”“可扩展性”**。它不需要为每个新任务都人工编写模板,而是能从已有的、不相关的任务中学习通用的解题策略。而且,我们人类可以随时通过向“任务库”和“工具库”里添加新的SOP或新工具,来不断提升它的能力,就像给它的“SOP手册”增订新章节一样。

这才是真正的“干活”,AI从一个“缸中之脑”,变成了一个能够自主规划、调用万物的“数字员工”。

元哥小结

今天这两招,含金量极高,标志着我们从“训练AI思考”迈入了“赋予AI行动力”的新阶段:

  1. RAG: 解决了AI的“知识”问题。给它一个外部大脑,让它博古通今,言之有据。
  2. ART: 解决了AI的“技能”问题。给它一个内置的“SOP手册”和“工具箱”,让它学会举一反三,自主规划并调用工具。

当一个AI既拥有了RAG的“知识”,又掌握了ART的“技能”,它离一个真正的“AI Agent”(AI代理)也就不远了。

不过,你可能发现了,无论是设计RAG的检索策略,还是配置ART的任务库,我们作为“训练师”,工作还是挺繁琐的。

有没有可能……让AI自己学会写这些复杂的Prompt?甚至,在我们指令不够清晰时,主动向我们提问,引导我们完善指令?

当然有!

下一期,元哥就带大家聊聊“懒人福音”——如何让AI成为你肚子里的“蛔虫”,自己动手,丰衣足-食,把提示工程这件事也给“自动化”了!敬请期待!

【引用说明】

本文的创作灵感和核心知识点来源于《Prompt Engineering Guide》网站的技术文档及相关论文。

  1. Retrieval-Augmented Generation (RAG): www.promptingguide.ai/techniques/…
  2. Automatic Reasoning and Tool-use (ART): www.promptingguide.ai/techniques/…
  3. ART: Automatic Reasoning and Tool-use Paper: arxiv.org/abs/2303.09…

大家也可微信搜索“极客纪元”并关注我,获得更多分享。

扫码_搜索联合传播样式-标准色版.png