今天,我们通过Google AI Studio和Vertex AI推出了Gemini 2.5 Flash的预览版。作为2.0 Flash的升级版,Gemini 2.5 Flash在推理能力上有了显著提升,同时依然保持了高速和低成本的优势。这是我们的首款全混合推理模型,开发者可以根据需要开启或关闭推理功能,并通过设置“推理预算”来平衡质量、成本和延迟之间的关系。
什么是智能推理?
Gemini 2.5 Flash是一款具备智能推理能力的模型,它能够在生成输出之前进行“思考”,以更好地理解输入、分解复杂任务并规划响应。在处理需要多步推理的复杂任务(如解决数学问题或分析研究问题)时,这种思考过程能够帮助模型得出更准确和全面的答案。事实上,Gemini 2.5 Flash在LMArena的Hard Prompts测试中表现优异,仅次于2.5 Pro。
成本效益最高的推理模型
Gemini 2.5 Flash继续保持了最佳的价格性能比,是开发者处理复杂任务的理想选择。
精细控制推理过程
不同的应用场景对质量、成本和延迟的要求各不相同。为了给开发者提供更大的灵活性,我们引入了推理预算的概念,允许开发者精细控制模型在推理过程中生成的最大token数量。较高的预算可以让模型进行更深入的推理,从而提高输出质量。但重要的是,预算只是设置了模型推理的上限,如果输入不需要,模型不会使用全部预算。
开始使用Gemini 2.5 Flash
Gemini 2.5 Flash现已通过Google AI Studio和Vertex AI提供预览版。我们鼓励开发者尝试thinking_budget参数,探索可控推理如何帮助解决更复杂的问题。
我们将在Gemini 2.5 Flash正式发布前继续改进其功能,敬请期待!
*模型定价来源于Artificial Analysis及公司文档 ``