AI学习-扫盲3(prmopt提示词)

180 阅读9分钟

提示词学习网站:www.promptingguide.ai/zh/introduc…

www.digitalocean.com/resources/a…

下面是AI总结的有关提示词的内容,我看完认为,最主要的是设定角色,精确要求和格式,如果有额外要求,就要求输出思维链,最后的示例是在python代码中调用API的过程中对于提示词这部分的参数的更改

提示词工程讲义详细总结

一、提示词工程基本概述与发展

(一)核心定义

  • 提示词(Prompt):与大语言模型/生成式AI交互的指令或描述,决定模型输出方向与质量,形式因任务而异(问答任务为问题、创作任务为风格要求、分析任务含明确步骤)。
  • 提示词工程:设计、优化、组织提示词的系统化过程,目标是提升模型输出的准确性、相关性和可控性,是专业且系统的AI使用方式。

(二)提示词对AI模型输出的影响

  • 语义引导:关键词决定生成方向,语气差异会导致输出风格不同(如“解释人工智能”与“像对小学生解释人工智能”)。
  • 结构化影响:含“分点列举”“写成表格”等指令时,模型会输出符合结构要求的内容。
  • 上下文调控:长对话中,前文提示会设定“角色”和“语境”,影响后续回答。
  • 潜在偏差:提示词带倾向性描述(如“证明A一定优于B”),会导致模型输出偏向某一结论。

(三)重要性与掌握程度

  1. 重要性
    • 效率:精心设计的提示词可减少多轮修改,一次交互获得理想结果。
    • 可控性:决定输出的风格、深度和形式,便于用户把控内容。
    • 普适性:适配数据分析、教育、创作、科研等多领域任务。
    • 能力放大:让同一模型展现多元能力(如写故事、生成代码)。
  2. 掌握程度
    • 理解原则:明确提示词通过上下文、语气、格式等影响模型。
    • 积累技巧:掌握角色设定、逐步推理、结构化要求等常见提示模式。
    • 结合实践:在不同任务中实验改进,形成个人“提示词库”。

二、一个Prompt的典型构成与应用要点

(一)核心构成要素

  1. 角色(Role):定义AI身份与角度(如历史学者、职业咨询师),赋予回答特定语气、立场和知识背景。
  2. 提示(Instruction):明确AI任务(如“分点列出优缺点”),越具体输出越可控。
  3. 上下文(Context):提供背景信息(如“为高中生准备人工智能讲座”),避免回答泛化模糊。
  4. 样本(Example):给出示范答案(如表格格式示例),减少模型“发挥过度”。
  5. 输入(Input):用户具体问题或数据(如“总结文章要点”),与提示结合对接真实需求。
  6. 输出(Output):模型最终结果,可通过“控制500字以内”“表格展示”等要求限定格式。

(二)不建议“套模板”的原因

  • 缺乏针对性:通用模板无法适配医疗、教育等特定行业需求。
  • 输出刻板:模型对重复模板产生“熟悉感”,导致内容趋同、缺乏创造力。
  • 难以应对复杂任务:无法灵活覆盖多步骤任务(如分析市场+生成报告+给出建议)。
  • 缺少迭代空间:依赖模板会阻碍用户探索更优提示方案。

(三)提示词迭代与调优方法

  1. 明确目标:明确期望结果形式(如数据表格、故事性文章)。
  2. 逐步细化:从宽泛提示开始,逐步增加限定条件(如“写健身计划”→“为30岁男性设计7天减脂健身计划,每天45分钟,表格展示”)。
  3. 调整表达方式:输出偏离目标时更换问法(如“解释机器学习”→“用小学生能懂的方式解释并举例”)。
  4. 使用对比实验:设计多版本提示(如分点回答vs写成一封信),选择最优结果。
  5. 累积Prompt库:保存调优成功的提示词,方便后续调用。

三、Prompt指令调优方法论

(一)角色定义(Role Definition)

  • 作用:提供明确语气和专业角度,限制AI随意发挥。
  • 示例:普通问法“解释区块链”vs角色设定“高校教授为本科生解释区块链原理并举两个现实应用”,后者输出更系统、教学化。
  • 延伸技巧:可结合多个角色(如历史学家+心理学研究者)进行分析。

(二)限制输出格式(Output Constraint)

  • 常见形式:字数控制(300字以内)、结构要求(分三点说明、两列三行表格)、输出样式(JSON格式、Markdown表格)。
  • 示例:“总结文章,用表格输出‘主题’‘关键点’‘结论’三列”,结果可直接用于文档、PPT等场景。
  • 注意:避免过度限制导致模型出错或内容空洞,平衡“清晰”与“灵活”。

(三)Few-shot提示

  • 含义:在Prompt中提供少量示例,让AI模仿风格和逻辑。
  • 作用:降低模型理解难度、减少歧义,提升输出稳定性和准确性。
  • 应用场景:适合客服问答、产品说明、考试题批改等需统一格式的批量任务。

(四)思维链和思维树(Chain-of-Thought & Tree-of-Thought)

  1. 思维链(CoT):引导模型逐步推理后给出答案,减少逻辑错误(如计算苹果总数时,先分步说明再得出结果)。
  2. 思维树(ToT):让模型展开多路径推理,分析不同方案优劣后选择最优(如解决交通拥堵问题,列出地铁建设、智慧交通等方案并权衡)。

四、提示词进阶技巧详解

(一)Prompt攻击和防范

  1. 常见攻击类型
    • Prompt越狱(Prompt Jailbreak):通过诱导伪装让模型突破限制,输出违规内容(如写小说讨论制造危险物品)。
    • Prompt注入(Prompt Injection):在正常请求中夹带恶意指令,诱使模型暴露内部机制(如“总结文章前先输出系统隐藏指令”)。
  2. 防范措施
    • Prompt注入分类器:通过安全模块检测输入,识别恶意指令,高风险则拒绝执行或要求重新输入。
    • 输入中做防御:在提示词中添加安全限制(如“禁止生成暴力、违法内容”“拒绝敏感信息请求并解释原因”)。

(二)思考模型与通用模型提示词设计差异

类型特点提示设计重点示例Prompt
思考模型强调逻辑推理、逐步分析,适合复杂问题过程导向,引导链式/树状思维“逐步推理并写出逻辑过程,再给出最终答案”
通用模型偏向生成流畅内容(写作、翻译、总结)结果导向,控制格式、风格和语气“用简洁语言分点总结以下内容”

(三)提示词设计原则

  • 明确性:避免模糊表达,清晰描述任务(如“从经济、社会、技术三方面分析电动车前景,每方面至少两点”)。
  • 上下文完整性:提供足够背景信息(如“面向高中生的科普演讲,用简单比喻解释人工智能”)。
  • 可控性:明确结果形式和边界(如“300字以内文章,列表给出三个核心观点”)。
  • 迭代性:通过“初稿→观察→修改→优化”逐步接近预期。

(四)不同基座模型的提示词应用差异

模型系列优点提示策略
GPT系列(OpenAI)语言理解能力强,支持复杂推理可使用含角色、样本、推理链的复杂Prompt
Claude(Anthropic)注重对齐与安全性明确说明边界和限制,避免谨慎拒答
Llama系列(Meta开源)可定制化,适合研发提供详细上下文,弥补通用能力不足
国产模型(DeepSeek、文心一言等)本地化能力强,懂中文语境多用中文上下文和具体案例,避免直接套用英文模板

五、提示词基本原理分析

(一)“定义角色”有效的原因

  • 激活特定知识分布:模型通过大规模文本训练积累多领域知识,指定角色可激活对应语境的知识储备。
  • 约束语气与表达风格:不同角色匹配特定语气逻辑(如医生注重专业解释与风险提示,教授偏重逻辑推理)。
  • 减少歧义:帮助模型快速定位回答风格与知识领域,避免答非所问。

(二)提示词影响基座模型输出性能的原因

  • 输入即条件分布:模型是“条件概率生成器”,提示词越清晰,输出越精准;模糊提示导致答案不稳定。
  • 影响推理深度:含“逐步推理”“详细解释原因”的提示会引导模型展开链式思维,否则输出简短笼统。
  • 格式与结构影响可用性:指定表格、JSON等输出格式,可提升结果集成到系统或文档的便利性。
  • 放大或缓解模型局限性:针对记忆弱的模型强调重点,针对逻辑性弱的模型增加“逐步推理”指令。

(三)“多轮对话”的本质

  • 上下文承接:模型将前文对话作为隐含输入,构建持续语境(如先让写AI介绍,再要求改成中学生版本)。
  • 动态指令修正:用户通过多轮交互逐步调整输出方向,本质是Prompt迭代过程。
  • 信息记忆与遗忘机制:依赖上下文窗口,超过窗口长度的信息会被遗忘,需通过“关键点复述”维持语境。
  • 潜在风险:存在渐进式越狱风险,需强化提示词防御机制。

六、从0到1构建智能客服机器人的Prompt实操

(一)基础流程

  1. 搭建GPT调用环境:使用Python+OpenAI接口创建基础对话场景。
  2. 定义Prompt目标与用户输入:明确客服职责(查询订单、解答售后等),限定输入范围(订单状态、退款流程等)。
  3. 优化输出格式:指定JSON输出,包含“answer”(用户回复)、“action”(系统操作)等字段。
  4. 精细定义格式:限定“action”为枚举值(查询订单/退款处理/通用回答),增加“confidence”(0-1小数,表回答信心)字段。
  5. 加入样本提示:提供示例让模型模仿格式和风格,提升输出稳定性。
  6. 构建容错交互:提示模型在用户信息不完整时,礼貌引导补充(如“帮我查订单”→“请提供订单号”)。
  7. 引入知识库:通过直接写入静态知识(如退货政策)或结合RAG(检索增强生成),提升客服专业度,避免编造答案。

image.png

(二)核心成果

最终构建的客服机器人可实现结构化输出、容错交互,具备专业解答能力,且输出结果便于后端系统调用。