迅捷工程理论的即时说明

83 阅读2分钟

我想从这个系列开始,先讲一些一般的理论,然后我们再去建立一个实际的应用。

现在,你可能已经尝试过某种形式的 "Zero Shot "或 Few Shot提示。如果你还没有,这里有一个快速的解释:

这两种方法都是让一个大型语言模型(LLM)执行一个它没有经过专门训练的任务,而无需进行微调。一些用例可以是:

  • 对模型以前从未见过的文本进行情感分析
  • 用你或你公司的风格或语气来写作
  • 创建产品名称,这个清单不胜枚举,但我想你应该明白。

Zero Shot

最简单的方法是直接告诉或要求模型做你想做的事,没有任何例子。考虑到大多数真正流行的LLM都是在大量的训练数据上进行训练的,这可能效果很好。

Few Shot:

这只是意味着给模型几个你想要的任务或最终输出的例子。这是一种引导模型达到最终结果的方法。

这两种方法都是完成简单、较短任务的好方法。但是一旦你有了更复杂的东西,你就需要更多的 "人 "脑。而人的大脑允许我们进行思考和推理。这就是思维链发挥作用的地方。

思想链

论文全文见此

简而言之,思维链是一种促使LLM通过链式推理解决问题的方法,一次一个步骤,直到达成解决方案。同样,有两种类型:

Zero Shot

这涉及到让模型使用自然语言来解决一个问题,比如 "一步一步地展示你的理由 "或者 "让我们把这个问题分解成更小的步骤,依次考虑每个步骤。我们需要采取的第一步是什么,为了采取这一步,我们需要收集什么信息?一旦我们有了这些信息,下一个合理的步骤是什么?让我们继续这个过程,直到我们对手头的问题有一个清晰的认识,并制定一个如何进行的计划。"

Few Shot:

通过镜头,你给出一些理由链的例子,让它知道如何解决一个问题。例如,在要求它解决一个数学问题之前,通过提供一些关于如何做BODMAS的例子。

所以,你已经有了,一个非常快速的关于提示工程的理论课程。在下一篇文章中,我们将通过建立一个内容引擎开始把这个(特别是思维链)付诸行动。所有这些都由人工智能驱动。