juejin.cn/aicoding AI编程板块了解更多AI编程干货
在2025年5月的Google I/O大会上,谷歌发布了一系列令人瞩目的AI技术更新,涵盖了搜索功能的重构、多模态模型的突破以及全新的创作工具。这些更新不仅展示了谷歌在AI领域的深厚实力,也为用户和开发者带来了更多可能性。以下是对本次发布内容的详细整理,基于X用户@op7418的帖子(x.com/op7418/thre…
1. 谷歌搜索AI模式:重塑搜索体验
谷歌搜索引入了全新的“AI模式”,计划面向美国所有用户推出。这一模式对搜索功能进行了彻底的重构,允许用户提出更长、更复杂的查询,并通过更先进的推理能力提供精准的回答。AI模式不仅能回答问题,还能像智能助手一样处理复杂任务,例如自动化购票或虚拟试衣等。这标志着谷歌搜索从传统的关键词匹配向智能化、交互式体验的重大转变。
2. Gemini 2.5 Pro Deep Think模式:推理能力再突破
Gemini 2.5 Pro推出了全新的“Deep Think”模式,这是一种增强型推理模式,专为处理复杂的数学和编程问题设计。在生成回答前,Deep Think会探索多种假设,从而提供更准确、深入的解决方案。在2025年美国数学奥林匹克竞赛(USAMO)和LiveCodeBench(一项竞赛级编程高难度基准测试)中,Gemini 2.5 Pro Deep Think模式均取得了领先成绩,展现了其在学术和专业领域的强大潜力。
目前,该模式仅对一小部分安全专家开放测试,未来几周将通过Gemini API向更多受信任的测试者提供。这表明谷歌在稳步推进技术落地的同时,仍在确保其安全性和稳定性。
3. Imagen 4图像模型:细节与创意兼得
Imagen 4是谷歌最新一代图像生成模型,以其卓越的细节表现力而备受关注。无论是复杂织物的纹理、水滴的真实感,还是动物毛发的细腻质感,Imagen 4都能呈现出惊艳的效果。同时,它在写实与抽象风格之间切换自如,支持多种宽高比和高达2K分辨率的图像生成,特别适合用于印刷、海报、贺卡甚至漫画创作。
此外,Imagen 4在拼写和排版能力上也有显著提升,用户可以更轻松地创作文本内容丰富的图像。目前,Imagen 4已集成到Gemini应用和Google Labs的Whisk实验中,供用户试用。
4. Veo 3视频模型:视听一体,唇形同步
Veo 3是谷歌视频生成技术的又一里程碑,不仅在视频质量上大幅提升,还新增了音效和语音生成功能。更令人惊叹的是,Veo 3默认支持唇形同步,用户只需输入一个简短的故事提示,模型就能生成一段生动呈现故事的视频片段,其理解能力令人印象深刻。
目前,Veo 3已面向美国地区的Ultra订阅用户开放。这一功能的推出无疑为内容创作者提供了强大的工具,尤其是在短视频和影视制作领域。
5. FLOW AI剪辑工具:创作新利器
FLOW AI是谷歌基于Veo 3、Imagen 4和Gemini模型打造的视频剪辑工具,集视频、图像和音频生成于一体。它为用户提供了从创意构思到成品输出的完整流程支持,尤其适合有志于电影制作或短视频创作的用户。FLOW AI的推出进一步降低了专业内容创作的门槛,展现了AI在多模态内容生成中的无限可能。
6.Chrome 现在内置了 Gemini
7.Gemini diffusion
Gemini diffusion 使用扩散模型的LLM,Gemini diffusion 在编码方面表现尤为出色。模型能以每秒 2000 个 token 的速度生成代码
8.Gemini APP 更新
iOS 和 Android 用户都可以使用 Gemini Live 读取相机和屏幕的功能 Canvas 和 Deep Research都进行了很多能力迭代 Agent 模式即将推出
9.Google Meet 现在支持近乎实时的语音翻译功能
推出 Google AI Ultra 一站式订阅所有谷歌 AI 服务
这不比Open AI 的 Pro 值多了! 每月 249.99 美元(新用户可享前三个月五折优惠) Gemni:提供 Deep Research 领域的最高使用限额,优先获得突破性的 Veo 3 模型使用权。 Flow:Google AI Ultra 订阅方案将 Flow 的性能上限提升至 1080p 视频生成、高级摄像机控制及优先体验 Veo 3。 Whisk: Google AI Ultra可获得 Whisk Animate 的最高使用权限,该功能通过 Veo 2 将图像转化为八秒视频 NotebookLM:能获得最高使用限制和增强的模型功能。 Chrome 中的 Gemini:从明天开始,直接在 Chrome 浏览器中抢先体验 Gemini。该功能利用当前页面的上下文。 Project Mariner:这款智能研究原型可通过单一仪表板同时管理多达 10 项任务——从研究到预订和采购。 YouTube Premium:个人版 YouTube Premium 套餐可无广告观看 YouTube 视频、离线收听 YouTube Music 30 TB 存储空间:在 Google Photos、Drive 和 Gmail 中提供海量存储容量
11.Stitch 这个新产品能通过AI生成UI设计稿!
Stitch 这个新产品能通过AI生成UI设计稿! 而且支持导出到Figma
12.NotebookLM 发布视频概览,从包括 PDF、照片等来源创建简短的视频摘要
13.Labs 换衣功能
Google 现在支持在 Labs 体验虚拟试衣