大模型全面爆发，所有榜一都是Gemini！谷歌一夜站到了台前北京时间今天凌晨 1 点，今年的 Google I/O 20

谷歌的 AI，再次站在了引领业界的位置。

北京时间今天凌晨 1 点，今年的 Google I/O 2025 开发者大会正式开启。谷歌最近的大模型技术风头正劲，今年的这场「科技春晚」吸引了全球关注的目光。

没有意外，今年的核心主题自然是 AI。会上，谷歌发布或升级了一系列 AI 相关工具和服务，如下图所示。

不过也有一些预料之外的发布。

下面我们就来概括性地盘点一番 Google I/O 2025 开发者大会这场 AI 的盛宴。

Gemini 大爆发

首先最重要的就是基础模型。

今年，Gemini 无疑是 Google I/O 2025 开发者大会上最亮眼的关键词。谷歌不仅为其带来了新升级，同时还推出了一系列围绕 Gemini 开发的工具。

2.5 Pro 不仅在学术基准测试中表现出色，如今更是 WebDev Arena 和 LMArena 排行榜上全球领先的模型，在帮助人们学习方面也同样出色。

DeepMind 为 2.5 Pro 和 2.5 Flash 带来了全新功能：原生音频输出 —— 能实现更自然的对话体验；先进的安全保障；以及 Project Mariner 的计算机使用功能。

Deep Think 还能进一步提升 2.5 Pro 的能力，这是一种实验性的增强型推理模式，适用于高度复杂的数学和编码。

另外，最高效的主力模型 Gemini 2.5 Flash 也在多个维度上得到了提升，包括推理、多模态、代码和长上下文等关键基准，同时效率进一步提升。在 DeepMind 自家的评估中，使用的 token 也减少了 20-30%。

2.5 Flash 现已在 Gemini 应用中面向所有用户开放，DeepMind 计划将于 6 月初在面向开发者的 Google AI Studio 和面向企业的 Vertex AI 中正式发布更新版本，2.5 Pro 也将很快发布。

谷歌还在 Gemini API 和 Vertex AI 中引入思维摘要（thought summaries）功能，以提高透明度；将思维预算扩展到 2.5 Pro 以增强控制力；并在 Gemini API 和 SDK 中增加对 MCP 工具的支持，以便用户访问更多开源工具。

另外，谷歌还宣布了一个名叫 Gemini Diffusion 的新模型。从名字上看，这应该是一个采用了扩散模型的 AI。

为了提升大模型推理速度，以进一步贴近生产应用，Google DeepMind 正在使用「扩散」技术来探索新的语言模型方向，该模型旨在为用户提供更强大的控制力、创造力和文本生成速度。

扩散模型的工作原理有所不同。它们不是像大语言模型那样直接预测下个文本 token，而是通过逐步细化噪声的方式来学习生成输出。这意味着它们可以快速迭代解决方案，并在生成过程中进行错误纠正。这有助于它们在编辑等任务中表现出色，包括在数学和代码环境中。

谷歌表示：「这个新的最先进的文本模型不仅速度快，而且速度非常快，今天发布的 Gemini Diffusion 实验演示的生成速度是我们迄今为止最快模型的五倍，同时具有相当的编程性能。」

谷歌表示，Gemini Diffusion 的推理速度可以达到每 12 秒 10095 token。

对这个新模型感兴趣的读者可以在这里加入等待列表：

docs.google.com/forms/d/1aL…

Gemini 应用的未来也值得期待。Demis Hassabis 亲自撰写了一篇题为「我们构建通用 AI 助手的愿景」的博客文章，其中写到：「我们正在将 Gemini 扩展为一个世界模型，它可以通过模拟世界的各个方面来制定计划并想象新的体验。」

「我们的终极愿景是将 Gemini 应用打造成一个通用的 AI 助手，它可以为我们执行日常任务，处理日常的日常管理，并提供令人愉悦的新建议，从而提高我们的工作效率，丰富我们的生活。」

这一愿景的起点是 Project Astra，谷歌基于其首次探索了视频理解、屏幕共享和记忆功能等功能。

在过去的一年里，谷歌一直在将这些功能集成到 Gemini Live 中，以便让更多人体验到这些功能。同时，谷歌也在创新，例如，升级了语音输出，使其更加自然地融入原生音频，改进了记忆功能，并增加了计算机控制功能。

编程工具升级

既然是开发者大会，那必然少不了编程工具的升级。在这方面，谷歌可以说是火力全开。

首先，谷歌正式宣布了前两天悄然上线的编程智能体 Jules。据介绍，Jules 是一款异步、智能体式的编码助手，可直接与用户现有的代码库集成。它可将用户代码库克隆到安全的 Google Cloud 虚拟机 (VM) 中，了解项目的完整上下文，并执行编写测试、构建新功能、提供音频更新日志、修复错误、升级依赖项版本等任务。

Jules 以异步方式运行，让用户可在 Jules 后台运行时专注于其他任务。完成后，它会展示其计划、推理过程以及所做更改的差异。Jules 默认为私有 —— 谷歌承诺不会使用用户的私有代码进行训练，并且会在执行环境中隔离用户数据。

视频详情

结语

以上的盘点性介绍还并未穷尽谷歌今年的 I/O 大会上发布、升级或规划的一切，比如他们还推出了 Gemma 3n 的预览版本，这是一个可以在手机、笔记本电脑和平板电脑上流畅运行的开放式多模态模型，可以处理音频、文本、图像和视频。另外，谷歌在 AI 辅助科研、AI 内容鉴定（SynthID Detector）、NotebookLM、云计算、办公辅助、增强现实等多个领域都有新的动态。他们甚至还推出了新的订阅套餐：每月 249.99 美元的 Google AI Ultra！

前三个月有折扣

谷歌一直是 AI 研究的先驱，早在 Transformer 架构和 AlphaGo 时代就奠定了技术基础。然而，近年来在 AI 应用层面，谷歌略显保守，未能在用户体验上与竞争对手齐头并进。此次 2025 年 I/O 大会，谷歌通过一系列重磅发布，展现了其在 AI 应用领域的强势回归。

从 AI Mode 彻底重塑搜索体验，到 Project Astra 引领多模态交互，再到 Gemini 2.5 的深度推理能力和 Project Mariner 的智能智能体，谷歌不仅追赶上了 AI 应用的浪潮，更在多个关键领域实现了超越。这场大会不仅是技术的展示，更是谷歌向未来发出的宣言：在 AI 驱动的新时代，谷歌将继续引领潮流，塑造更加智能和互联的世界。

参考链接：

blog.google/