前言
最近谷歌在AI领域持续发力,不断推出新模型和创新应用,AI搜索、图像和视频生成等能力全面升级。
前两天,更是举办了 Google I/O 2025大会,好东西一个接一个。
这就帮大家梳理一下。
AI
Gemini 2.5 Pro
Gemini 2.5 Pro号称世界上最智能的AI模型,新版本刷榜LMArena,在ELO基准测试中拿到了1448分。
它新增“Deep Think"版本,在USAMO 2025、LiveCodeBench、MMMU等多项测试中,Gemini 2.5 Pro深度思考版本表现均领先Gemini 2.5 Pro。
Gemini 2.5 Flash
Gemini 2.5 Flash属于轻量级模型,相较上一代效率提升了22%,使用的Token可减少20%到30%。
该模型输出速度极快,Artificial Analysis平台数据显示,Gemini 2.5 Flash每秒可输出340个Token,远超Gemini 2.5 Pro的152个Token每秒。
Gemini Diffusion
谷歌还带来了全新的文本扩散模型 Gemini Diffusion。不同于主流 Transformer 架构,它在编程和数学领域表现优异,生成速度可达每秒1000-2000 tokens,极大提升了生成效率。
MedGemma
MedGemma 是专为医学文本和图像理解设计的多模态模型,支持医学影像和文本分析。开发者可通过 Hugging Face 或 Google Cloud 轻松调用,助力医疗AI应用创新。
SignGemma
SignGemma 专为手语识别打造,可将美国手语(ASL)实时翻译为英文文本,为听障用户带来更便捷的沟通体验。
多模态 AI
Imagen 4
Imagen 4 是谷歌最新的文本到图像生成模型,图片生成速度比上一代快3-10倍,细节表现更丰富,支持2K高分辨率,能胜任贺卡、海报、漫画等多种创作场景。
Veo 3
Veo 3 是新一代视频生成模型,首次支持带音频的视频生成,画质提升明显,能自动添加背景音和角色对话,为内容创作带来更多可能。
搜索 x AI
谷歌搜索迎来25年来最大升级,推出全新 AI Mode 搜索模式。基于 Gemini 2.0,多模态推理、深度搜索和个性化功能全面融合。
用户可用文本、语音、图片等多种方式提出复杂问题,AI会自动整合多方信息,生成对话式答案,极大提升搜索体验。
全体系 + AI
Gmail
Gmail 智能回复升级,借助 Gemini 能力,能结合历史邮件和文档自动生成更贴合个人风格的回复。
Docs
Google宣布在Docs中加入实时写作辅助功能,该功能可以参考链接文档,帮助用户更高效地撰写文档。
Meet
Google Meet现在将包括实时语音翻译功能,该功能可以模仿说话者的原始语气和音色,有望打破专业环境中的语言障碍。
Chrome
Gemini 集成进 Chrome,可总结网页内容并跨标签页协作,提升浏览和信息整理效率。
Deep Research
用户现在可以完成和定制深度研究报告,并且能够将公共数据与自己的私人 PDF 和图像结合起来。
Canvas
现在,借助 Gemini 2.5 模型,Canvas 变得更加强大,用户可以创建交互式信息图、测验,甚至可以生成超过 45 种语言的播客和音频概述。
Gemini Live
Gemini Live 语音助手升级,支持多语言、摄像头识别和个性化服务,能帮用户完成日常任务,成为生活好帮手。
Personal Context
Gemini 现在可以使用用户的搜索历史来提供个性化、主动的帮助,例如提醒用户即将到来的考试或在用户询问之前提供量身定制的信息。
生态
Ironwood
第七代张量处理单元(TPU),它比其前身性能提升了10倍,每个Pod拥有42.5 exaflops的计算能力。
Android XR
Android XR 平台面向可穿戴设备,集成 Gemini 助手,支持智能眼镜等新硬件,带来全新交互体验。
Starline正式升级为Google Beam
Google Beam 升级为AI驱动的3D视频通信平台,采用多摄像头和AI技术,带来沉浸式对话和实时翻译,重新定义远程交流。
“AI Ultra”订阅
谷歌在I/O 2025大会上发布了全新的AI Ultra订阅计划,这是一档更高级的超级会员服务,定价为每月249.99美元,几乎囊括了这次发布的全部产品和服务。
但是,感觉还是好贵~
开发
作为一个程序员,肯定要额外关注下开发方面的内容。
代码开发助手
为了提升开发者效率,Google 对 AI 编程助手工具进行了升级。Colab AI 新版本变得更智能,开发者只需在 Colab 笔记本中描述目标,AI 代理就能自动补全代码、修复错误、安装依赖,主动协助编程,让 Colab 从被动工具变为智能 IDE。
同时,基于 Gemini 的 Code Assist 编码助手也正式免费开放。Code Assist 分为个人版(浏览器扩展,支持本地 IDE 代码补全和重构)和企业版(可集成企业代码库和 DevOps 流程)。
Jules自治编程代理
个人比较关注的 Jules 也终于公测了。
- 云端独立运行:在 Google Cloud 虚拟机中克隆代码库,后台执行任务(如修复 Bug、更新依赖、生成测试),开发者可同时处理其他工作。
- 无缝 GitHub 协作:任务完成后自动提交拉取请求(PR),支持通过 assign-to-jules 标签直接从问题页面分配任务,简化流程。
现在的 AI IDE,比如 Cursor、Winsurf、Trae等主要是作为编程辅助存在的,大大提高了编程效率,但是并没有从根本上优化开发流程。
个人一直在团队内容推进 AI 协同编程新范式,想要 AI 作为一个独立的团队成员,承担一部分工作,感觉 Jules 的设计思路还是很符合的。
它会自主规划、后台实现或者修复,并在最后给出变更方案及代码 Diff 方便我们审查。整个过程中开发者无需盯着,在云端自动完成,并支持同时处理多个任务。
这和 CI/CD 流程一结合,再加上 Git,完美~
结语
这就是本次 Goole I/O 大会的主要发布内容,希望可以方便大家快速了解哈~