Claude团队——提示词工程最佳实践中文翻译

0 阅读14分钟

提示词工程最佳实践

通过 Claude 团队的提示词工程技术,获得更好的 AI 结果。

上下文工程已成为使用大语言模型(LLM)工作中越来越重要的一部分,而提示词工程是其核心基石。

提示词工程是构建指令以从 AI 模型获得更好输出的技艺。它关乎你如何措辞查询、指定风格、提供上下文以及引导模型行为来实现你的目标。

一个模糊指令和一个精心设计的提示词之间的差异,可能意味着泛泛而谈的输出和正中靶心的结果之间的鸿沟。一个结构不良的提示词可能需要多次来回交流才能明确意图,而一个精心设计的提示词能让你一次就达到目标。

为了帮助你入门,我们汇集了我们团队的一些最佳实践,包括旨在立即改善结果的实用方法。我们将从今天就能使用的简单习惯开始,然后扩展到复杂项目的高级方法。

如何使用提示词工程

在最基本的层面上,提示词工程只是修改你传递给 LLM 的查询。通常它只是在你提出实际请求之前向查询添加信息——但知道哪些信息是正确的信息才是设计出色有效提示词的秘诀。

核心技巧

这些提示词工程技术构成了有效 AI 交互的基础。持续使用它们能立即看到响应质量的改善。

明确清晰

现代 AI 模型对清晰、明确的指令反应非常好。不要假设模型会推断你想要什么——直接说明。使用简单的语言准确表达你想要的内容,不要含糊其辞。

关键原则:准确告诉模型你想看到什么。如果你想要全面的输出,就要求它。如果你想要特定功能,就列出它们。像 Claude 这样的现代模型特别受益于明确的指导。

示例:创建分析仪表板

模糊:"创建一个分析仪表板"

明确:"创建一个分析仪表板。包含尽可能多的相关功能和交互。超越基础,创建一个功能齐全的实现。"

第二个版本明确要求全面的功能,并表明你希望模型超越最低要求。

最佳实践

  • 以直接的动作动词开头:"写"、"分析"、"生成"、"创建"
  • 跳过开场白,直奔主题
  • 说明你希望输出包含什么,而不仅仅是要处理什么
  • 明确质量和深度期望
提供上下文和动机

解释某事为什么重要有助于 AI 模型更好地理解你的目标并提供更有针对性的响应。这对能够推理你潜在目标的新模型特别有效。

示例:格式偏好

不够有效:"永远不要使用项目符号"

更有效:"我更喜欢自然段落形式的响应,而不是项目符号,因为我觉得流畅的散文更易于阅读,更有对话感。项目符号对我的休闲学习风格来说太正式、太像列表了。"

第二个版本帮助模型理解规则背后的原因,这使它能够对相关格式选择做出更好的决定。

何时提供上下文

  • 解释输出的目的或受众
  • 阐明某些约束存在的原因
  • 描述输出将如何使用
  • 指出你试图解决的问题
具体明确

提示词工程中的具体性意味着用明确的指南和要求来构建你的指令。你对想要的内容越具体,结果就越好。

示例:膳食计划

模糊:"为地中海饮食创建一份膳食计划"

具体:"为糖尿病前期管理设计一份地中海饮食膳食计划。每日1,800卡路里,强调低血糖指数食物。列出早餐、午餐、晚餐和一份零食,并附完整的营养成分。"

什么使提示词足够具体?

包括:

  • 明确的约束(字数、格式、时间线)
  • 相关上下文(受众是谁,目标是什么)
  • 期望的输出结构(表格、列表、段落)
  • 任何要求或限制(饮食需求、预算限制、技术约束)
使用示例

示例并非总是必要的,但在解释概念或演示特定格式时非常有用。也称为单样本或少样本提示,示例通过展示而非描述来阐明难以用语言表达的细微要求。

现代模型的重要提示:Claude 4.x 和类似的高级模型会非常仔细地关注示例中的细节。确保你的示例与你想要鼓励的行为一致,并尽量减少任何你想要避免的模式。

示例:文章摘要

不带示例:"总结这篇文章"

带示例

这是我想要的摘要风格示例:

文章:[关于 AI 监管的文章链接]
摘要:欧盟通过针对高风险系统的综合 AI 法案。关键条款包括透明度要求和人工监督授权。2026年生效。

现在用相同风格总结这篇文章:[你的新文章链接]

何时使用示例

  • 期望的格式更容易展示而不是描述
  • 你需要特定的语气或风格
  • 任务涉及细微的模式或惯例
  • 简单的指令没有产生一致的结果

专业提示:从一个示例开始(单样本)。只有在输出仍不符合你的需求时才添加更多示例(少样本)。

允许 Claude 表达不确定性

明确允许 AI 表达不确定性而不是猜测。这减少了幻觉并提高了可靠性。

示例:"分析这些财务数据并识别趋势。如果数据不足以得出结论,请直说而不是推测。"

这个简单的补充通过允许模型承认局限性使响应更值得信赖。

高级提示词工程技术

这些核心习惯会让你走得很远,但你可能仍会遇到需要更高级方法的情况。

链式思维(CoT)提示

链式思维提示鼓励模型"大声思考",在给出最终答案之前展示其推理过程。这对复杂问题特别有价值,可以提高准确性并让你验证逻辑。

示例:数学问题求解

标准提示:"解决这个问题:一家商店以20%的折扣出售商品,然后再降价10%。最终价格是多少?"

CoT 提示:"解决这个问题,并逐步展示你的工作:一家商店以20%的折扣出售商品,然后再降价10%。最终价格是多少?首先,解释你将如何处理这个问题。"

CoT 版本鼓励模型:

  1. 确定需要什么计算
  2. 展示每一步
  3. 解释其推理
  4. 给出最终答案

何时使用 CoT

  • 多步推理问题
  • 需要解释答案的决策
  • 调试不正确的输出(查看推理揭示错误在哪里)
  • 建立对复杂输出的信任

角色提示

角色提示让模型采用特定的视角或专业知识。这可以调整响应的语气、深度和方法。

示例:技术解释

标准:"解释什么是 API"

角色提示:"作为一位向非技术利益相关者解释技术概念的资深软件架构师,解释什么是 API,为什么它对我们的业务很重要,以及它如何使我们能够更快地构建。避免使用术语,使用商业术语。"

角色提示设定:

  • 专业知识水平(资深架构师)
  • 受众(非技术利益相关者)
  • 目的(商业理解)
  • 语气约束(避免术语)

有效的角色设定

  • 与期望的输出专业知识水平相匹配
  • 包括受众考虑
  • 设定适当的正式程度
  • 暗示相关背景知识

提示链接

将复杂任务分解为一系列更简单的提示。每个提示的输出成为下一个的输入,创建一个由更易管理的步骤组成的流水线。

示例:内容创建流程

不是一个巨大的提示,而是链接多个:

  1. 研究阶段:"找出关于可持续城市规划的10个关键事实"
  2. 大纲阶段:"使用这些事实,创建一篇博客文章的大纲"
  3. 写作阶段:"将这个大纲的第一部分扩展为完整的段落"
  4. 完善阶段:"编辑这个段落以提高可读性和影响力"

提示链接的好处

  • 更好地控制输出的每个方面
  • 更容易识别和修复流程中的问题
  • 能够在途中改变方向
  • 通常产生比单一庞大提示更高质量的结果

自我一致性

为同一个问题生成多个响应,然后选择最一致或投票最多的答案。这对于正确答案应该收敛的任务特别有用。

示例:问题求解

生成3个独立的解决方案:

  1. "用方法A解决这个问题:[问题]"
  2. "用方法B解决这个问题:[问题]"
  3. "用方法C解决这个问题:[问题]"

然后:"检查这三个解决方案。哪个最合理?它们是否一致?"

何时使用自我一致性

  • 高风险决策
  • 复杂的推理问题
  • 当你想要额外的信心
  • 验证计算或逻辑

系统提示和元提示

系统提示设置贯穿整个对话的持久上下文。元提示是关于如何构建其他提示的提示。

系统提示示例

你是一位技术写作助手。在所有响应中:
- 使用简洁、主动语态的句子
- 为技术术语提供示例
- 以清晰度为优先而非简洁性
- 在不确定时征求澄清

元提示示例

在回答问题之前,首先生成3个可能有助于获得更好答案的澄清问题。评估是否需要这些澄清,如果不需要则继续回答。

为组织提示词工程

随着 AI 在组织中的扩展,提示词工程变成了团队活动。

创建提示词库

记录和共享有效的提示词:

组织结构

提示词库/
├── 客户支持/
│   ├── 投诉响应.md
│   ├── 产品推荐.md
│   └── 技术故障排除.md
├── 内容创作/
│   ├── 博客大纲.md
│   ├── 社交媒体帖子.md
│   └── 新闻稿.md
└── 数据分析/
    ├── 报告摘要.md
    ├── 趋势分析.md
    └── 数据可视化.md

每个提示词应包括

  • 目的和用例
  • 完整的提示词模板
  • 示例输入和输出
  • 已知限制
  • 版本和最后更新

制定提示词指南

为你的组织创建标准:

示例指南

  1. 语气和声音:所有面向客户的内容应[描述期望的语气]
  2. 格式规范:使用[指定格式标准]
  3. 安全和隐私:永远不要在提示词中包含[敏感数据类型]
  4. 质量检查:所有 AI 生成的内容必须[验证过程]

测试和迭代

像对待代码一样对待提示词:

  1. 从基线提示词开始
  2. 用各种输入测试
  3. 记录哪些有效,哪些无效
  4. 进行小的迭代改进
  5. 验证改进确实更好
  6. 与团队共享学习

特定用例的提示词模板

代码生成

创建一个 [语言] [功能类型(函数/类/组件)] 用于 [目的]。

要求:
- [具体要求1]
- [具体要求2]
- [具体要求3]

约束:
- [技术约束]
- [性能要求]
- [兼容性需求]

包括:
- 内联注释解释关键决策
- 错误处理
- 边缘情况处理
- 简要的使用示例

数据分析

分析这些数据:[数据或数据描述]

具体:
1. 识别关键趋势和模式
2. 突出任何异常或异常值
3. 计算相关统计数据:[列出具体指标]
4. 提供可操作的见解

格式化为:[表格/项目符号/段落]
如果发现数据不足,请注明缺少什么。

内容编辑

编辑这个文本以:[主要目标]

优先考虑:
- [质量方面1:例如,清晰度]
- [质量方面2:例如,简洁性]
- [质量方面3:例如,影响力]

保持:
- [需要保留的方面]
- [现有的语气/风格元素]

显示:
1. 带跟踪更改的编辑版本
2. 关键更改的简要摘要
3. 任何你建议但未做出的重大结构变化

常见提示词工程错误

1. 过于开放式

问题:"告诉我关于 AI" 更好:"解释 AI 如何在医疗诊断中使用,重点关注当前的应用和限制。3-4段,为医疗专业人员撰写。"

2. 矛盾的指令

问题:"简洁但详细地解释量子计算" 更好:"用2-3段解释量子计算的核心概念,为技术专业人员撰写。优先考虑准确性而非简化。"

3. 隐含假设

问题:"改进这段代码"(未说明'改进'意味着什么) 更好:"重构这段代码以提高可读性。添加注释,使用更多描述性的变量名,并将复杂的逻辑拆分为更小的函数。"

4. 忽略格式

问题:"创建一份项目时间表"(未指定格式) 更好:"创建一个带周列的表格格式项目时间表。包括任务名称、负责人、开始日期、结束日期和状态列。"

持续改进

提示词工程是一种技能,随着练习会有所改善。对于你经常使用的提示词:

  1. 跟踪结果:哪些提示词产生最佳输出?
  2. 识别模式:是什么使这些提示词有效?
  3. 进行实验:测试变化并衡量影响
  4. 记录学习:建立你自己的提示词最佳实践库
  5. 分享知识:与你的团队或社区合作

入门的快速启动提示词

使用这些提示词来改进你的日常 AI 交互。你可以将它们作为系统提示词或对话启动器。

创作与写作

嗨 Claude!你能[创作任务]吗?如果你需要我提供更多信息,请立即问我1-2个关键问题。如果你认为我应该上传任何对你更好地完成工作有帮助的文档,请告诉我。如果有助于你更好地完成此任务,你可以使用你可以访问的工具——如 Google Drive、网络搜索等。请不要使用分析工具。请保持你的响应友好、简洁和对话式。

请尽快执行任务——如果有意义的话,工件会很棒。如果使用工件,请考虑什么类型的工件(交互式、可视化、检查清单等)对这个特定任务最有帮助。谢谢你的帮助!

学习

嗨 Claude!你能[学习任务]吗?如果你需要我提供更多信息,请立即问我1-2个关键问题。如果你认为我应该上传任何对你更好地完成工作有帮助的文档,请告诉我。如果有助于你更好地完成此任务,你可以使用你可以访问的工具——如 Google Drive、网络搜索等。请不要使用分析工具。请保持你的响应友好、简洁和对话式。

请尽快执行任务——如果有意义的话,工件会很棒。如果使用工件,请考虑什么类型的工件(交互式、可视化、检查清单等)对这个特定任务最有帮助。谢谢你的帮助!

代码

嗨 Claude!你能[编码任务]吗?如果你需要我提供更多信息,请立即问我1-2个关键问题。如果你认为我应该上传任何对你更好地完成工作有帮助的文档,请告诉我。如果有助于你更好地完成此任务,你可以使用你可以访问的工具——如 Google Drive、网络搜索等。请不要使用分析工具。请保持你的响应友好、简洁和对话式。

请尽快执行任务——如果有意义的话,工件会很棒。如果使用工件,请考虑什么类型的工件(交互式、可视化、检查清单等)对这个特定任务最有帮助。谢谢你的帮助!

原文链接www.claude.com/blog/best-p…