Google I/O 第一天看完,感觉 Google 在消费者 AI 这件事上,开始打到自己的主场了。
Google 展示的 Hypothesis Generation,有点像给科学家配了一个很强的研究搭子:
它可以帮你围绕一个问题发散想法、查相关文献、提出假设,再让多个 agent 互相辩论、挑毛病、排序。
它不是直接替科学家“发现真理”,但能大幅加快一个很关键的过程:想方向、排除烂方向、找到真正值得试的方向。
另一个 Computational Discovery,更像是科研里的高速实验台。
你定义目标和评价指标,它可以自动生成大量代码和模型变体,并行测试、打分,还能追踪哪一次改动带来了性能跃迁。
这个对科学研究很关键,因为很多突破不是想出来就结束了,而是要快速验证:这个方向到底有没有戏。
但最贴近消费者爆发点的,还是视频。
消费者其实天然热爱视频。文字再强,也没有视频直观;图片再好,也没有视频有传播力。
Google 这次把 Gemini Omni 放进 Gemini App、Google Flow 和 YouTube Shorts,开始进入“普通人创作视频”的主战场。
Gemini Omni Flash 现在生成的是 10 秒级别的视频片段,但真正重要的不是“10 秒”,而是 Google 把它放进了 Flow 这个创作工作流里。
你不是只输入一句话,然后等一个视频结果;你可以在 Flow 里搭角色、搭场景、改镜头、续情节,用文字、图片、视频、音频不断给它参考,再一步步把一个想法发展成一个有故事的视频项目。
再加上之前 Googlebook 里的 Magic Pointer,AI 开始进入你每天最自然的动作里:
鼠标指到哪里,AI 就理解你在看什么、想做什么。
比如指向邮件里的日期,它可以建议你建日程;选中两张图,它可以帮你把它们组合成一个新场景。
Google 的消费者 AI 战略,不只是“模型追上来了”,而是产品入口开始变得很强:
视频创作用 Flow 接住,日常操作用 Magic Pointer 接住,搜索、YouTube、Gemini App 又都是高频入口。
它正在把 AI 放进普通人每天真的会用、真的会传播、真的会形成习惯的地方。