人人都能懂的大模型 · 第13期：Temperature：AI 的“放飞自我”旋钮1. 引子：AI 的“双面性格”之谜

这是《人人都能懂的大模型》系列科普连载，第 13 期。我们的目标是：用最接地气的比喻，带你拆解大模型那些听起来很高大上的“黑话”。不管你是文科生还是理科生，只要会用手机，就能听懂 AI 的底层逻辑。

1. 引子：AI 的“双面性格”之谜

各位书友，我是你们的老朋友，科普作家阿模。

不知道大家在跟 AI 聊天的时候，有没有过这种感觉：有时候，AI 说话特别“死板”，像个永远不会出错但极其无趣的教科书；而有时候，它又会突然冒出一些让你拍案叫绝的“金句”，甚至有点天马行空的创造力。

小明最近就跑来问我：“阿模，我昨天让 AI 写个冷笑话，它回了我一个冷得掉渣的成语解释；今天心情好重试了一遍，它居然讲了个脱口秀级别的段子！难道 AI 也有‘起床气’，或者心情好坏之分吗？”

其实 AI 并没有情绪。这种“性格”的转变，背后其实藏着一个非常神奇的旋钮——Temperature（温度）。

我们先直观地理解一下。在 AI 的世界里，Temperature（温度）通常在 0 到 2 之间波动。你可以把它想象成一个人的“放飞程度”。

T = 0（学霸模式/贪婪搜索）： 极度保守。这时 AI 进入了**“贪婪搜索”（Greedy Search）**状态，永远只选那个概率最高的答案，不进行任何采样。
T = 0.7-1.0（文艺青年）： 这是一个平衡点。它开始尝试一些更有趣的表达方式，说话更有“人味儿”。
T = 2（喝醉的诗人）： 彻底失控。这时候的 AI 就像在酒吧喝高了的诗人，逻辑已经碎了一地，甚至开始自造词汇。

要理解温度，得先看 AI 选词的底层数学。AI 在开口说话前，会给词库里的每个词打一个原始分，我们管它叫 Logits。

AI 并不是直接拿分值来用，它会做一个简单的除法：将每个词的原始分除以温度 $T$ 。 $P_i = \frac{\exp(Logits_i / T)}{\sum \exp(Logits_j / T)}$ 这个公式看着玄乎，其实道理很简单：

当 $T$ 很小时（趋近 0）： 最大概率的词会被无限放大，直到概率趋近 100%。这就变成了贪婪搜索，AI 变得极其固执。
当 $T$ 很大时（趋近无穷）： 分子之间的差距被极度缩小。原本 80% 和 5% 的概率差距，在 Logits 层面被拉平，导致 Softmax 归一化后的概率分布变得非常平滑。

注意： 温度并没有往抽签箱里塞进新签，而是改变了原本那些签的“大小”。高温让“概率高峰”塌陷，让“概率低谷”抬升，给低概率词腾出了生存空间。

指令： “请写一句关于秋天的话。”

为了帮大家避坑，我整理了一份不同任务的参数组合建议：

任务类型	推荐 Temperature	推荐 Top_p	逻辑策略
法律合同审核 / 代码生成	0.0 - 0.2	0.9	追求极高的忠实度和精确性
数学题 / 客观事实问答	0.0	1.0	开启贪婪搜索，拒绝胡编乱造
日常聊天 / 润色邮件	0.7 - 0.8	0.95	保持自然流畅，带一点灵动
文学创作 / 广告文案	1.0 - 1.2	0.9	鼓励发散思维，寻找意料之外的词
玄幻小说续写 / 脑暴	1.3 - 1.5	1.0	彻底放开限制，只要新鲜感

很多人以为 Temperature 越高，AI 的智商就越高，甚至能解决更难的问题。这是一个巨大的误区。

高温增加的是“随机性”，而不是“逻辑能力”。过高的温度会导致幻觉（Hallucination）。比如你问“鲁迅为什么打周树人”，低温 AI 会告诉你他们是同一人，而高温 AI 可能会为了“出彩”编造出一段跌宕起伏的武打戏。记住：创造力不等于准确度。

如果说 Temperature 是改变“抽签的公平度”，那么 Top_k 和 Top_p 就是“进场筛选器”。

在实际的 Transformers 工程实现中，处理顺序通常是：Temperature 缩放 → Top_k 过滤 → Top_p 过滤。

Top_k（排名截断）： 比如 Top_k=3，AI 只看概率最高的前三名，第四名即便概率只比第三名低 0.01% 也会被无情抛弃。这能有效防止逻辑断层。
Top_p（动态截断）： 也就是“核采样”。它将候选词按概率降序排列，取前 $N$ 个词，直到它们的概率之和达到 $p$ 。

如果同时开启两者，AI 会先切掉排位靠后的词（Top_k），再从剩下的词里按概率总量（Top_p）进行二次筛选。这种“叠加过滤”能确保即便在高温度下，AI 也不会选到那些完全不着边际的废词。

总结一下：

下期预告： 《第14期：AI 也有“鱼的记忆”？——解密上下文窗口 Context Window》。带你看看 AI 的脑容量到底有多大，为什么聊久了它会开始“胡言乱语”！我们下期见！