12月17日,谷歌公布了最新模型Gemini 3 Flash,旨在为开发者以极低的成本实现更快的执行性能,解决速度与智能之间的权衡问题。
1、价格与性能
Gemini 3 Flash基于Gemini 3 Pro的多模态、编程以及智能体功能进行构建,即进一步增强了Gemin3 Pro 的多种能力,使它能在不同类型的数据时更加有效,如文本、图像等。下图是它的价格与性能基准测试表。
从表格可以看出,Gemini 3 Flash在多个基准测试中超越了 Gemin2.5 Pro,而成本上,Gemini 3 Flash的价格仅为Gemin3 Pro的四分之一,同时具有更高的使用率限制,在使用时可以处理更多的请求。
Gemini 3 Flash在视觉和空间推理能力会更强一些,即可以更好的理解和处理图像、图形这些视觉信息,同时它支持代码执行功能,以及对视觉输入进行缩放、计数和编辑 ,即用户能够更灵活地处理和分析视觉数据。
同时,它具备一定的处理高难度问题时的潜力,例如在高难度的测试中且没有外部工具的情况下,Gemini 3 Flash 在 Humanity’s Last Exam跨学科研究生级别推理的测试中得分为 33.7%,且和GPT-5.2差不多。
同样,在编程能力上,Gemini 3 Flash 的智能编程能力在 SWE-bench Verified 测试中得分为 78%,超越了Gemini 3 Pro。
2、性能与成本
下图是Gemini 3 Flash在语言模型评估平台的性能与成本对比图,数据来自:LMArena Elo Score
Gemini 3 Flash在性能、成本方面相对于 Gemini 2.5 Pro有显著优势,同时透露它在基于人工分析基准下速度上也比2.5 Pro快了三倍。 Gemini 3 Flash拥有上下文缓存功能标配,因此在特定条件下可实现 90% 的成本节约,例如在某些阈值以上减少重复计算,从而降低费用。
3、企业应用
最后是关于Gemini 3 Flash的一些应用场景示例,分别是编程能力的升级迭代,如上,然后就是游戏开发、伪造检测以及法律行业
(1)游戏开发
在游戏创建引擎的开发中,Astrocade游戏公司 使用Gemini 3 Flash 引擎来简化和加速游戏开发过程,使得从初始概念到最终可玩游戏的转变更加高效。通过减少传统开发流程中的多个步骤,开发人员能够更快地实现创意并推出游戏。
Gemini 3 Flash 除了能提高了游戏开发的效率和质量,同样可助于改善游戏玩家体验。
例如Latitude通过它进行游戏创建引擎生成更智能的角色和更真实的游戏世界,直接提升游戏的玩法和互动性。
在以前,这些高质量输出和复杂任务的处理只能依赖于Latitude游戏公司自行开发的专业级人工智能模型Sonnet 4.5, 现在Gemini 3 Flash也能以低成本提供高质量的输出任务。
(2)深度伪造检测
Resemble AI 是一家专注于生成式语音AI和音频深度伪造检测的技术公司,它使用 Gemini 3 Flash 更快速的多模态分析提供近实时的深度伪造的智能痕迹,确保同时能够处理原始技术输出而不影响关键工作流程的情况下将复杂的法医数据进行编译。
(3)法律行业
Harvey是一家为律师事务所提供专业服务的AI解决方案公司,它们将Gemini 3 Flash的低延迟特性用于高频法律行业严格的准确性要求任务中,如提取合同中的定义术语和交叉引用。
4、总结
谷歌此次推出的Gemini 3 Flash在性能、成本与实用性之间取得的一次显著平衡,以 Gemini 3 Pro 的四分之一成本实现了超越前代模型的综合表现,在视觉推理、编程能力、高难度问题求解等多个维度同样满足,突出更快、更省、更智能的模型选择。