Gemini 2.5 Flash：开启智能推理的新篇章今天，我们通过Google AI Studio和Vertex AI

Gemini 2.5 Flash ai.dev

今天，我们通过Google AI Studio和Vertex AI推出了Gemini 2.5 Flash的预览版。作为2.0 Flash的升级版，Gemini 2.5 Flash在推理能力上有了显著提升，同时依然保持了高速和低成本的优势。这是我们的首款全混合推理模型，开发者可以根据需要开启或关闭推理功能，并通过设置“推理预算”来平衡质量、成本和延迟之间的关系。

什么是智能推理？

Gemini 2.5 Flash是一款具备智能推理能力的模型，它能够在生成输出之前进行“思考”，以更好地理解输入、分解复杂任务并规划响应。在处理需要多步推理的复杂任务（如解决数学问题或分析研究问题）时，这种思考过程能够帮助模型得出更准确和全面的答案。事实上，Gemini 2.5 Flash在LMArena的Hard Prompts测试中表现优异，仅次于2.5 Pro。

成本效益最高的推理模型

Gemini 2.5 Flash继续保持了最佳的价格性能比，是开发者处理复杂任务的理想选择。

Gemini 2.5 Flash价格性能比较

精细控制推理过程

不同的应用场景对质量、成本和延迟的要求各不相同。为了给开发者提供更大的灵活性，我们引入了推理预算的概念，允许开发者精细控制模型在推理过程中生成的最大token数量。较高的预算可以让模型进行更深入的推理，从而提高输出质量。但重要的是，预算只是设置了模型推理的上限，如果输入不需要，模型不会使用全部预算。

推理质量随预算增加而提升

开始使用Gemini 2.5 Flash

Gemini 2.5 Flash现已通过Google AI Studio和Vertex AI提供预览版。我们鼓励开发者尝试thinking_budget参数，探索可控推理如何帮助解决更复杂的问题。

代码示例参考
 开发者文档参考
 思考指南参考

我们将在Gemini 2.5 Flash正式发布前继续改进其功能，敬请期待！

*模型定价来源于Artificial Analysis及公司文档 ``