获得徽章 0
前端 @小米 | FE
赞了这篇沸点
一辆半挂猫猫车
近战仙师于2025-02-09 09:55发布的图片
2
赞了这篇沸点
#挑战每日一条沸点# 看到篇讲大模型 temperature和top_p设置的文章,好奇[思考]为什么默认是0.7 和 (0.5-0.8)的设置,Gemini Flash thinking给的解释:

## 1. 为什么 0.7 常常作为 temperature 的默认值?

temperature = 0.7 通常被认为是 在创造性和可靠性之间取得较好平衡 的一个值。

在这个温度下,模型在各常见任务 (例如:对话、文本生成、摘要等) 中,都能产生相对令人满意的、质量和多样性兼顾的输出。

## 2. 为什么 top_p 的常用建议范围是 0.5 - 0.8?

top_p 的主要作用是控制采样范围,降低 top_p 可以约束模型的生成方向,使其更聚焦、更可控。

0.5 - 0.8 这个范围,被认为是既能有效控制发散程度,又能保留一定的多样性和创新性的一个平衡区间。

top_p 过高 (例如 0.9 - 1.0),采样范围过大,可能导致模型生成内容过于发散、主题不明确、跑题等。

在高 temperature 的情况下,这种 “失控” 的风险更高。

top_p 过低 (例如 0.3 或更低): 采样范围过窄,会导致生成内容过于保守、重复、缺乏新意,甚至出现 “卡壳” 或循环的情况。

对于需要较高准确性和可靠性的任务 ,例如:事实性问答、代码生成,top_p 可以适当调低一些,例如 0.3 - 0.6

对于需要较高创造性和多样性的任务 ,例如:故事创作、头脑风暴。 top_p 可以适当调高一些,例如 0.7 - 0.9

top_p 值越低,要考虑的词语数量越少,计算效率相对越高。
在某些对延迟敏感应用场景下,适当降低 top_p 也有一定的性能优化作用。
展开
评论
前端 @小米 | FE
人是一种很奇怪的动物,对于一切的经历,总是能记住美好的,忘记痛苦的。
评论
赞了这篇沸点
#新人报道# 第一个沸点,有没有玩poe2的
评论
前端 @小米 | FE
赞了这篇沸点
南京东流 那边房子怎么样
评论
赞了这篇沸点
上海停个车咋这么难,我们小区和附近停车场都不支持月租,都是一小时五块,一天40封顶。jym有什么好停车场推荐吗,人在孙桥这边
19
前端 @小米 | FE
赞了这篇沸点
明天放假吗
8
赞了这篇沸点
大佬们,你们还有班上吗?
22
前端 @小米 | FE
下一页