前言
写了一年多的提示词,最大的感悟是:很多 "常识" 其实是错的。这篇聊聊我踩过的五个反直觉坑,以及为什么它们反直觉。
如果你经常需要在不同模型之间切换,建议在 【c.myliang.cn】 上把你的提示词跑一遍多模型对比。你会发现,改一个词、换一个模型,输出质量可能差一个量级。
背景:提示词工程正在经历 "去神化"
2025 年初,提示词被包装成了某种 "秘术",各种 "万能提示词" 满天飞。到了 2026 年,行业已经很清楚了 —— 没有万能提示词,只有适配特定模型 + 特定任务的提示词。
GPT-5 对自然语言宽容,Claude 对格式要求严格,Gemini 3.1 Pro 对结构化指令响应最好。同一条提示词在三个模型上的效果可能天差地别。
所以别再收藏 "万能提示词合集" 了。理解底层原理比背模板有用一百倍。
五个反直觉原则
原则一:提示词越短越好 —— 但前提是你的模型理解力够强
很多人觉得提示词要写得很详细。对 GPT 来说,这有一定道理。但 Gemini 3.1 Pro 有一个特点:它对简洁指令的理解力比你想象的强。
实测对比:写 100 字的详细提示 → Gemini 输出质量 85 分写 30 字的核心指令 → Gemini 输出质量 82 分写 200 字的过度描述 → Gemini 输出质量 78 分
为什么会这样?因为过多的描述会分散 Gemini 的注意力。它会在 "你描述的所有维度" 之间分配权重,而不是聚焦在 "你真正想要的核心结果" 上。
结论:先写短,不满意再加。不要先写长再删。
原则二:示例比描述有效 —— 但示例太多会过拟合
给 Gemini 一个输出示例,比你用文字描述想要的输出格式有效得多。这就是 Few-shot Prompting 的原理。
但问题是:示例太多(3 个以上)会导致 Gemini"模仿" 你的示例,而不是 "理解" 你的意图。
我的经验是:1-2 个示例最佳。超过 2 个,反而降低泛化能力。
原则三:"禁止" 比 "要求" 好用
这是最反直觉的一条。大多数人的提示词是 "请做到 A、B、C",但 Gemini 对 "请不要做 X、Y、Z" 的遵从度更高。
原因分析:正面要求给了 Gemini"自由发挥" 的空间(它会在你没提到的维度自行判断),而负面约束直接划定了边界,缩小了 "可能出错" 的范围。
实测效果:"请用简洁的语言" → 它觉得每段 5 句话也算简洁"禁止单段超过 3 句话" → 它真的控制在 3 句以内
原则四:让它 "扮演角色" 不如让它 "做任务"
很多人喜欢用 "你是一个 XX 专家" 开头。这对 Gemini 有效,但如果你的任务本身足够清晰,角色扮演的边际提升很小。
对比:"你是一个资深数据分析师,请分析以下数据" → 输出质量 80"请分析以下销售数据,找出季度环比增长超过 20% 的品类并按增长幅度排序" → 输出质量 88
角色是锦上添花,任务清晰才是根本。先把任务说清楚,再加角色提味。
原则五:追问比一次到位有效
别指望一条提示词就能得到完美输出。Gemini 最强的用法是多轮对话迭代:
这比一次性写一个 300 字的复杂提示词效果好。多轮迭代是 Gemini 最被低估的能力。
对比:三家模型在提示词响应上的差异
结论:如果你擅长写精确的结构化提示词,Gemini 的表现最好。如果你习惯 "随便聊聊" 的风格,GPT 的容错性更强。
写在最后
提示词设计的本质是人机沟通协议设计。你不需要成为 "提示词工程师",但你需要理解你常用的模型 "怎么想"。
理解模型,比记住模板重要。