LLM基础——提示词

318 阅读9分钟

能力图谱.png

上图展示了 DeepSeek 的能力分布。从图中可以看出,LLM 大语言模型已具备多种能力。作为人类,我们该如何更好地加以利用?

目前,大多数 LLM 模型主要通过对话形式提供服务,因此,如何与其高效交流成为关键。而在这一过程中,掌握“提示语”(Prompt)的艺术尤为重要。

提示语(Prompt)是用户输入给AI系统的指令或信息,用于引导AI生成特定的输出或执行特定的任务 [3]^{[3]}

在我们与 AI 进行“对话”时,所使用的语言被称为提示语(Prompt) 。它可以是一个简单直接的问题,也可以是一系列详细的指令,甚至是对复杂任务的具体描述。

在深入探讨如何更高效地使用提示语之前,让我们先了解两种主要类型的大语言模型:推理模型和非推理模型。

1 大语言模型的分类

我们可以将大语言模型简单地分为推理模型通用模型

  • 推理模型(Reasoning Model) :专注于逻辑推理、数学计算、代码分析等任务,强调深度思考和多步推理能力。这类模型通常用于解决复杂问题,如数学解题、法律分析或科学研究。典型代表DeepSeek-R1, GPT-o3, Kimi K1.5 长思考模型, 以及 GLM 4 Plus(智谱清言)。
  • 通用模型(General Model) :更侧重于广泛的知识覆盖和多功能应用,可用于文本生成、对话交流、内容创作等任务。这类模型通常用于客服、写作助手、翻译等日常应用场景。代表性的例子包括GPT-3、GPT-4(由OpenAI开发),BERT(来自Google),还有Kimi+ 和 GLM-4(同样出自智谱清言)。

总结来看,

比较维度推理模型通用模型
擅长任务在特定领域(例如数学推理、逻辑分析、代码生成及复杂问题分解等),因为经过了专门训练,表现优于通用模型通用场景更灵活,可满足日常需要,例如文本生成、创意写作、多轮对话、开放性问答。但专项任务可能需要通过详细的提示来增强其性能。
提示语策略- 简洁明确,只需明确任务目标和需求(因其已内化推理逻辑)
- 无需逐步指导,模型自动生成结构化推理过程(若强行拆解步骤,反而可能限制其能力)
- 需要详细引导推理步骤(例如使用CoT方法),否则可能跳过关键逻辑。
- 依赖提示语补偿能力短板(如要求分步思考、提供示例)

我们所说的 “CoT 提示” ,实际上是 “Chain of Thought”(思维链) 的简称。它类似于我们在教小朋友解决问题时所采用的方法——一步一步地分享自己的思考过程。这种方式不仅能让别人理解答案的推导过程,还能帮助他们培养独立思考的能力。

举个例子:

“如果你有 5 块糖,并且想要把它们分给两位朋友,每位朋友各分得一块,那么最后你还剩下多少块?”

可以用 思维链 的方式这样解释:

  1. 起初,你手上有 5 块 糖果。
  2. 你先给第一个朋友 1 块糖,这时你还剩下 4 块
  3. 接着,再给第二个朋友 1 块糖,这时候你就只剩下 3 块 了。

在这个过程中,每一步都清晰地表达了当前的状态下一步的推理,让听者能够顺着思路理解问题的解决过程

这种方法在 AI 提示工程中同样适用。通过引导 AI 按照 逐步推理 的方式作答,可以提高答案的准确性和可解释性,尤其适用于数学推理、逻辑分析和复杂任务拆解等场景。

知识点 [3]

  1. 模型选择:优先根据任务类型而非模型热度选择(如数学任务选推理模型,创意任务选通用模型)
  2. 提示语设计:
    • 推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)
    • 通用模型:结构化、补偿性引导(“缺什么补什么”),一步步引导。
  3. 避免误区
    • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。
    • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。

2 提示语的基本结构[1,2,3]^{[1,2,3]}

提示语(Prompt) ,也称为提示词,是与 AI 交互时用于引导其生成内容的指令。一个有效的提示语通常包含以下几个关键要素:

核心要素

  1. 指令(Instruction) :提示语的核心部分,明确告诉模型你需要什么样的内容。例如,一篇科技新闻、一段励志散文,或者一个创意故事。
  2. 上下文(Context)或背景信息:提供必要的背景信息,帮助模型更好地理解你的需求,使生成的内容更加连贯和相关。
  3. 期望(Expectation)或要求:明确或隐含地表达你对 AI 输出的要求,例如内容的格式、详细程度、信息来源等。

可选的扩展要素

  1. 角色(Role) :可以为 AI 设定一个角色,如“资深记者”“营销专家”或“儿童故事讲述者”,让 AI 以特定身份进行回答。注意,角色不适用于推理类的模型
  2. 风格与语气(Style & Tone) :指定生成内容的风格(如正式、幽默、温馨)和语气(如积极、中立、消极),确保输出符合预期。
  3. 约束条件(Constraints) :设定具体限制,如字数要求、必须包含的关键词、避免提及的内容等,以更精准地控制生成结果。

举个例子

普通提示语
"写一篇关于人工智能发展的文章。"

优化后的提示语(包含多个要素):
"作为一名科技专栏作家,请撰写一篇关于人工智能发展的文章,聚焦大语言模型的创新进展。文章应保持正式且专业的语气,字数在 800-1000 字之间,并包含至少两个具体的技术案例。"

通过优化提示语,我们可以更精准地引导 AI 生成符合需求的内容,从而提升交互的效率和质量。

3 一个完整的示例 [2]^{[2]}

题目:你是一名书法爱好者,写钢笔,现在创作一幅作品,送给朋友,作品纸有长(14)*宽(8)个格子,于是你希望用文本大模型找一首16行的七言古代诗歌(一行7个字),内容积极向上、充满乐观。尝试一下,完成这项任务。 注:书法创作一般不写标点符号,一般从右往左写

我们以智谱清言的 GLM-4 模型来演示, 首先,直接将问题丢给通用大模型,看看效果如何。

image.png

从附图中可以看出,给出的结果不是我们想要的。 接着,我们尝试按照提示语关键要素的形式将题目进行转换。

角色:你是一位书法爱好者,擅长使用钢笔进行创作。
背景:为朋友创作一幅书法作品作为礼物。

要求:
(1)作品纸张规格:长14个格子,宽8个格子。
(2)书法传统:不使用标点符号,书写顺序从右往左。
(3)诗歌必须为古代七言诗、严禁包含任何消极或悲观内容、不添加现代标点符号。
(4)输出格式:文本形式呈现诗歌内容。每行7个字,从右往左(从右边的第一个字开始写,然后依次向左书写,直到写完一行。当一行写完后,再从右边开始写下一行,依此类推),共16行。

示例(假设生成的诗歌):
路无疑复水重山
村一又明花暗柳
舞自蜂开花暖春
疾蹄马爽气高秋
...

看看通用大模型给出的回答,

image.png

内容对了,但是格式不对,要求的是从右往左书写,但是给出的是从左往右。继续对话,

image.png

参考资料

  1. 原理:文本提示词工程及优化
  2. AI+办公:成为“办公小能手”
  3. DeepSeek:从入门到精通
  4. 提示词编写宝典——一本关于如何编写提示词的全方位指南,涵盖基础技巧、高级策略与行业趋势