Google Gemini 3 Flash 正式发布:3倍速度、80%降本,AI模型性价比王者来了

104 阅读4分钟

17号 Google DeepMind 发布了全新的 Gemini 3 Flash 模型,这款轻量级AI模型以惊人的速度和超低的成本,正在重新定义AI模型的性价比标准。

一、发布背景:AI竞争白热化

就在OpenAI推出GPT-5.2、Anthropic发布Claude 4.5之后,Google终于亮出了自己的底牌——Gemini 3系列。其中,Gemini 3 Flash 作为专为速度和效率优化的版本,已经成为Gemini App的默认模型,并在Google搜索的AI模式中全球铺开。

这意味着什么?数十亿用户可以免费使用这款前沿AI模型

二、核心亮点速览

🚀 3倍速度提升

Gemini 3 Flash 比上一代 Gemini 2.5 Pro 快 3倍,在输出速度上达到 220 tokens/秒,而 Claude Sonnet 4.5 仅为60 tokens/秒。

💰 成本降低80%+

与Claude相比:

  • 输入成本降低 83%
  • 输出成本降低 87%
  • 综合成本仅为Claude的 1/5

🧠 Pro级推理能力

别被"Flash"这个名字骗了。在博士级科学问题测试(GPQA Diamond)中,它拿下了 90.4% 的高分,在事实准确性测试中更是以 68.7% 远超 Claude 的 29.3%。

🎯 原生多模态

无需切换模型,直接处理:

  • 文本和代码
  • 图像和PDF
  • 音频(最长8.4小时)
  • 视频

三、官方定价

价格屠夫来了xdm

类型Gemini 3 FlashClaude Sonnet 4.5GPT-5.2
输入 ($/百万tokens)$0.50~$3.00~$2.00
输出 ($/百万tokens)$3.00~$23.00~$10.00

没看错,Gemini 3 Flash 的价格只有竞品的 1/4 到 1/5

而且它还支持 Context Caching,重复使用的token最高可节省 90% 成本。加上处理相同任务时平均减少 30% 的token使用量,实际成本优势更加明显。

附一个 google 官方贴出的价格对比图 image.png

四、性能基准:数据说话

基准测试Gemini 3 FlashGPT-5.2Claude 4.5
GPQA Diamond (博士级科学)90.4%--
MMMU-Pro (多模态理解)81.2%79.5%68.0%
SWE-bench (编程)78%-77.2%
Humanity's Last Exam33.7%34.5%13.7%
SimpleQA (事实准确性)68.7%38.0%29.3%

关键发现

  1. 多模态理解能力登顶(81.2%)
  2. 事实准确性遥遥领先(68.7%)
  3. 编程能力与顶级模型持平
  4. 在大多数测试中超越体积更大的竞品

五、核心规格

参数数值
上下文窗口100万 tokens
最大输出约65,535 tokens
响应速度3x 快于 2.5 Pro
输出速度220 tokens/秒
Token效率减少30%使用量

六、谁应该关注这款模型?

开发者

  • 需要高频调用API的场景
  • 预算有限但需要强大能力
  • 多模态应用开发

企业

  • 客服机器人和聊天系统
  • 大规模文档处理
  • 实时数据分析

普通用户

  • 已在Gemini App中免费可用
  • Google搜索AI模式默认使用
  • 日常问答、写作、分析

七、值得关注的新特性

1. Thinking Level(推理等级)

开发者可以控制模型的推理深度:

  • minimal: 最快速度
  • low/medium: 平衡选择
  • high: 最深度推理

2. Thought Signatures(思维签名)

跨API调用保持推理连贯性的加密机制,对于复杂多轮对话至关重要。

3. Media Resolution(媒体分辨率)

可调节视觉处理精度:low → medium → high → ultra-high,平衡精度与成本。

八、有什么缺点吗?

没有完美的模型,Gemini 3 Flash 也有一些已知问题:

  1. 使用限制:Pro用户每天100次,免费用户更少
  2. 幻觉问题:某些场景可能编造信息
  3. 长上下文漂移:超过120k tokens后可靠性下降
  4. 不支持图像分割:相比2.5版本有功能回退

九、如何开始使用?

普通用户

直接访问 gemini.google.com 即可使用。

开发者

  1. 访问 Google AI Studio
  2. 获取API Key
  3. 模型名称:gemini-3-flash-preview
  4. 端点:https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash-preview:generateContent

如果嫌麻烦或者即想使用 Gemini 模型又想使用其他几个主流大模型的,可以使用 中转类 API,一个 key 使用所有大模型,我自己经常用的一个平台是 147API (https://147ai.com/),有需要可以自行搜索了解

十、总结

Gemini 3 Flash 的发布标志着AI模型进入了一个新时代——你不再需要在速度、能力和成本之间做出痛苦的取舍

  • 比Claude快3倍
  • 比GPT便宜4倍
  • 能力却不输任何一个

如果你正在寻找一个用于生产环境的AI模型,或者只是想体验最新的AI能力,Gemini 3 Flash 绝对值得一试。