17号 Google DeepMind 发布了全新的 Gemini 3 Flash 模型,这款轻量级AI模型以惊人的速度和超低的成本,正在重新定义AI模型的性价比标准。
一、发布背景:AI竞争白热化
就在OpenAI推出GPT-5.2、Anthropic发布Claude 4.5之后,Google终于亮出了自己的底牌——Gemini 3系列。其中,Gemini 3 Flash 作为专为速度和效率优化的版本,已经成为Gemini App的默认模型,并在Google搜索的AI模式中全球铺开。
这意味着什么?数十亿用户可以免费使用这款前沿AI模型。
二、核心亮点速览
🚀 3倍速度提升
Gemini 3 Flash 比上一代 Gemini 2.5 Pro 快 3倍,在输出速度上达到 220 tokens/秒,而 Claude Sonnet 4.5 仅为60 tokens/秒。
💰 成本降低80%+
与Claude相比:
- 输入成本降低 83%
- 输出成本降低 87%
- 综合成本仅为Claude的 1/5
🧠 Pro级推理能力
别被"Flash"这个名字骗了。在博士级科学问题测试(GPQA Diamond)中,它拿下了 90.4% 的高分,在事实准确性测试中更是以 68.7% 远超 Claude 的 29.3%。
🎯 原生多模态
无需切换模型,直接处理:
- 文本和代码
- 图像和PDF
- 音频(最长8.4小时)
- 视频
三、官方定价
价格屠夫来了xdm
| 类型 | Gemini 3 Flash | Claude Sonnet 4.5 | GPT-5.2 |
|---|---|---|---|
| 输入 ($/百万tokens) | $0.50 | ~$3.00 | ~$2.00 |
| 输出 ($/百万tokens) | $3.00 | ~$23.00 | ~$10.00 |
没看错,Gemini 3 Flash 的价格只有竞品的 1/4 到 1/5。
而且它还支持 Context Caching,重复使用的token最高可节省 90% 成本。加上处理相同任务时平均减少 30% 的token使用量,实际成本优势更加明显。
附一个 google 官方贴出的价格对比图
四、性能基准:数据说话
| 基准测试 | Gemini 3 Flash | GPT-5.2 | Claude 4.5 |
|---|---|---|---|
| GPQA Diamond (博士级科学) | 90.4% | - | - |
| MMMU-Pro (多模态理解) | 81.2% | 79.5% | 68.0% |
| SWE-bench (编程) | 78% | - | 77.2% |
| Humanity's Last Exam | 33.7% | 34.5% | 13.7% |
| SimpleQA (事实准确性) | 68.7% | 38.0% | 29.3% |
关键发现:
- 多模态理解能力登顶(81.2%)
- 事实准确性遥遥领先(68.7%)
- 编程能力与顶级模型持平
- 在大多数测试中超越体积更大的竞品
五、核心规格
| 参数 | 数值 |
|---|---|
| 上下文窗口 | 100万 tokens |
| 最大输出 | 约65,535 tokens |
| 响应速度 | 3x 快于 2.5 Pro |
| 输出速度 | 220 tokens/秒 |
| Token效率 | 减少30%使用量 |
六、谁应该关注这款模型?
开发者
- 需要高频调用API的场景
- 预算有限但需要强大能力
- 多模态应用开发
企业
- 客服机器人和聊天系统
- 大规模文档处理
- 实时数据分析
普通用户
- 已在Gemini App中免费可用
- Google搜索AI模式默认使用
- 日常问答、写作、分析
七、值得关注的新特性
1. Thinking Level(推理等级)
开发者可以控制模型的推理深度:
minimal: 最快速度low/medium: 平衡选择high: 最深度推理
2. Thought Signatures(思维签名)
跨API调用保持推理连贯性的加密机制,对于复杂多轮对话至关重要。
3. Media Resolution(媒体分辨率)
可调节视觉处理精度:low → medium → high → ultra-high,平衡精度与成本。
八、有什么缺点吗?
没有完美的模型,Gemini 3 Flash 也有一些已知问题:
- 使用限制:Pro用户每天100次,免费用户更少
- 幻觉问题:某些场景可能编造信息
- 长上下文漂移:超过120k tokens后可靠性下降
- 不支持图像分割:相比2.5版本有功能回退
九、如何开始使用?
普通用户
直接访问 gemini.google.com 即可使用。
开发者
- 访问 Google AI Studio
- 获取API Key
- 模型名称:
gemini-3-flash-preview - 端点:
https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash-preview:generateContent
如果嫌麻烦或者即想使用 Gemini 模型又想使用其他几个主流大模型的,可以使用 中转类 API,一个 key 使用所有大模型,我自己经常用的一个平台是 147API (https://147ai.com/),有需要可以自行搜索了解
十、总结
Gemini 3 Flash 的发布标志着AI模型进入了一个新时代——你不再需要在速度、能力和成本之间做出痛苦的取舍。
- 比Claude快3倍
- 比GPT便宜4倍
- 能力却不输任何一个
如果你正在寻找一个用于生产环境的AI模型,或者只是想体验最新的AI能力,Gemini 3 Flash 绝对值得一试。