谷歌深夜放大招,正式推出 Gemini 3.1 Flash-Lite。
从名字就能看出,这款模型主打轻量快速。
官方给的 title 则更为直接——
迄今为止性价比最高的 Gemini 3 系列模型。
有多便宜呢?每百万输入 token 仅需 0.25 美元,百万输出 token 1.5 美元。
举个直观的例子就是,只需要折合人民币 1.8 元,就能让 AI 读完 3 本《三体》全集。
同时始终保持高性能表现,对比上一代主力 Flash 模型 Gemini 2.5 Flash,首次响应 token 时间快 2.5 倍,输出速度提升 45%。
而且专为大规模智能应用而生,能够低成本高效率地实现模型批量部署。
如此看来,OpenClaw 这盘龙虾肉,谷歌也想尝一尝了_(doge)_
拉爆极致性价比
官方介绍中,Gemini 3.1 Flash-Lite 是 Gemini 3 系列中速度最快、成本最低的一款模型,目前已经可以通过 Google AI Studio 中的 Gemini API 和 Vertex AI 平台获取。
在 Artificial Analysis 基准测试中,输出速度显著优于 Gemini 2.5 Flash,价格同时得到大幅度削减。
不过值得注意的是,谷歌官方并没有将其与 Gemini 3 Flash 对比,而且讨巧地选择了更旧版本的 Gemini 2.5 Flash。
二者在定位上有所不同,Gemini 3 Flash 侧重逻辑推理效率,Gemini 3.1 Flash-Lite 更关注极致性价比。
此外,对比市面同等轻量级模型,如 GPT-5 mini、Claude 4.5 Haiku,无论是速度还是成本,Gemini 3.1 Flash-Lite 都优势显著。
在 Arena 测评中,也取得了 1432 分的亮眼成绩,与 Grok-4.1-fast 水平相当,在创意写作和长篇查询方面表现出色,领跑低价位段模型。
而 Gemini-3.1 Pro 则持续在高价位型号中保持第一梯队,Gemini 3 Flash 处于二者之间。
在 Code Arena 中也与 Qwen3-coder 并列第 35 名,表现出优秀的智能 Web 开发能力。
另外,在 GPQA Diamond 和 MMMU Pro 上,Gemini 3.1 Flash-Lite 也分别斩获 86.9% 和 76.8% 的分数,超越了前几代更大的 Gemini 模型。
除了强大的性能以外,模型还额外支持可调思考层级,开发者能够根据当前任务复杂度,自由选择模型的思考深度。
这对于处理高频的大量请求场景相当重要,能够更好地平衡速度与效果。
换言之,该模型既能处理低成本批量任务,如长文本翻译,也能做那些需要深度思考的任务,比如生成用户界面、严格按指令执行复杂逻辑等。
在官方给出的示例中,Gemini 3.1 Flash-Lite 能够迅速将上百种不同类别的产品填充到电子商务线框图中。
简单来说,就是该款模型更适用于企业与开发者在生产环境中用于实时响应与大规模处理任务,高性价比也让它极具竞争力。
GPT 紧随其后
就在 Gemini 3.1 Flash-Lite 发布仅两小时后,ChatGPT 也迅速推出 GPT-5.3 Instant 加以回应。
同样主打即时快速响应,但与之不同的是,GPT-5.3 Instant 更关注用户交互体验。
据官方描述,GPT-5.3 Instant 不仅能提供更精准的回答,还能在联网搜索时给出信息更丰富、语境更契合的结果,是专门针对日常会话优化的版本。
有网友也迅速实测对比了两款模型,结果出乎意料,GPT-5.3 Instant 成功狙击 Gemini 3.1 Flash-Lite。
在编程测试中,Gemini 3.1 Flash-Lite 输出简洁直接,没有做复杂的项目拆分,以单文件实现了核心后端功能,可快速运行,无冗余内容。
而 GPT-5.3 Instant 给出的代码方案更完整和工程化,更接近真实上线情况,仪表盘数据也会实时自动刷新,而非静态页面。
Gemini 3.1 Flash-Lite | GPT-5.3 Instant |
在深度推理中,二者的表现则相当,结果均是正确的,且推导过程干净清晰。
Gemini 3.1 Flash-Lite 正确使用了复杂物理学公式,回复结构也很完整,先给简要结论,再进行明确的数学推导。
GPT-5.3 Instant 也成功完成了思考,并额外做了表格和通俗解释,让结果更易懂更完整。
Gemini 3.1 Flash-Lite | GPT-5.3 Instant |
但在大规模吞吐和成本控制上,显然 Gemini 3.1 Flash-Lite 更具优势。
所以你认为孰优孰劣呢?欢迎在评论区留言讨论。
参考链接:
[1]x.com/GoogleDeepM…
[2]blog.google/innovation-…
[3]x.com/latentengin…
[4]x.com/arena/statu…
[5]openai.com/zh-Hans-CN/…