智能体元年”开启!一文看懂2026年谷歌I/O大会所有炸场发布

0 阅读10分钟

北京时间5月20日凌晨,美国加州山景城,谷歌CEO桑达尔·皮查伊(Sundar Pichai)又一次站上了Google I/O的舞台。

跟往年不太一样,这次他没有上来就亮新模型,而是先秀了一波肌肉:Gemini App月活9亿,AI Mode月活10亿,每月处理的Token数量达到了3.2千万亿,同比增长7倍。

过去三年,谷歌的I/O大会,核心就一件事——追。

从Bard的仓促出场,到Gemini的反复改名,再到去年的全面追赶,谷歌始终在向世界证明:我没被甩下。

今年,画风变了。谷歌的叙事方式也终于变了。

今年的主题,不再是一个模型或一个功能,而是一次系统性的转向——谷歌正把AI智能体(AI Agent)全面“塞进”所有核心入口。

从搜索框到Chrome浏览器,从Android手机到智能眼镜,Gemini不再只是一个对话助手,而是一个可以持续运行、跨应用执行任务的AI代理。

它能替你追踪信息、生成内容、调用工具,甚至直接帮你下单。

一句话总结就是:模型不再是主角,智能体(Agent)才是

一、主角登场:三个模型,一场算计

虽然模型不再是全场焦点,但谷歌依然拿出了三款有分量的新家伙。

不过,你仔细看,就会发现谷歌的“算盘”打得啪啪响。

1. Gemini 3.5 Flash:性价比之王,专为“省钱”而生

这哥们儿是当天就上线的主角。

定位很明确:性能接近旗舰,但速度和成本炸裂。

数据上,它几乎全面超越了几个月前还是谷歌顶级旗舰的Gemini 3.1 Pro。

在编码、Agent任务、工具调用等多个测试中,表现都相当抢眼。输出速度更是其他同级模型的4倍,在Antigravity平台上甚至能快到12倍。

但最让人心动的,是它的价格。输入每百万Token只要1.5美元,输出9美元,比Gemini 3.1 Pro便宜了40-50%。

皮查伊甚至在现场算了一笔账:如果你是一家每天处理1万亿Token的头部客户,把80%的工作负载从其他前沿模型切换到3.5 Flash上,一年能省超过10亿美元。

当同行还在卷“谁更聪明”时,谷歌直接告诉你: “我的模型够聪明,而且便宜到让你挪不开眼。”

这招确实高明,把模型从皇冠上的明珠,直接变成了AI基础设施的“水电煤”。

2. Gemini Omni:世界模型来了,视频版“Nano Banana”

DeepMind CEO Demis Hassabis亲自登台介绍的产品,规格拉满。

谷歌将其定位为“世界模型”——一个“任何输入到任何输出”的全能多模态模型。

图片、音频、视频、文字的任意组合丢进去,它能给你生成一段质量不错的视频。

而且最重要的,它支持用自然语言进行对话式视频编辑。

你上传一段骑行视频,说“把背景换成雪地”,它就真给你换了。

更关键的是,Omni试图去理解物理世界。

重力、动力学、流体力学这些让AI视频生成模型经常翻车的地方,Omni有了一次阶跃性的进步。

现在Flash 版本已经开放,大家可以去体验。

不过据已经用过的小伙伴反馈。

还不如Seedance 2.0。

等等Omni Pro吧!

3. Gemini 3.5 Pro:来了,但没完全来

这场大会唯一的“预告片”,Gemini 3.5 Pro只是轻描淡写地说了一句:“下个月见。”

我猜测谷歌可能觉得,在当前阶段,Gemini 3.5 Flash已经够用,没必要急着把最硬核的王牌打出来。

留一手,才能在下个月继续抢头条。

二、核心革命:“AI智能体全家桶”集体亮相

如果模型是子弹,那么接下来出场的,就是谷歌精心打造的“枪”。

1. Gemini Spark:你的7x24小时全天候私人AI管家

这可能是整场发布会最“有远见”的产品。

Gemini Spark被定义为一款运行在Google Cloud专属虚拟机上的个人AI Agent,即使你合上电脑,它也能在后台继续干活。

现场有个非常生活化的演示:用户要办一场街区派对。

Spark自动从Gmail提取邻居回复,在Sheets里生成实时RSVP追踪表;从Drive里找出小区章程,提醒你下午5点前不能放充气城堡;最后,还在Slides里生成了一份派对宣传册。

整个过程,Spark就像电影《Her》里的Samantha,不声不响地就把活干了。

它直接打通了Google全家桶,并通过MCP协议接入了Canva、OpenTable等第三方工具。

这不再是“我问你答”,而是“我交给你,你帮我办完”。

当然,好用的功能都不便宜。

Spark下周先对美国Google AI Ultra订阅用户开放测试。

好消息是,谷歌把原本250刀一个月的套餐降到了200刀,还新增了一个100刀/月的Ultra套餐。

2. Antigravity 2.0:从IDE升级为Agent开发平台

如果你是个开发者,这个更新可能会让你真正兴奋起来。

Antigravity从一个简单的编码环境,直接进化成了一个“开发和管理自主AI智能体团队”的平台。

现场演示了一个非常“牛”的操作:用93个子Agent并行跑了12个小时,处理了26亿个Token,总成本不到1000美元,最终从零构建了一个可运行的操作系统。

这个系统能跑命令行,能玩Doom游戏。

这意味着,未来开发一个大型系统,人类可能只需要提供思路,剩下的繁琐工作,都交给一群AI Agent去办。

3. Android Halo:手机上的“智能体状态栏”

有了Spark和Antigravity这些后台运行的Agent,你怎么知道它们在干啥?

谷歌的回答是Android Halo。

这是Android系统上一个全新的UI层级,专门用来显示Agent的运行状态和任务进展。

你可以随时看到Spark正在做什么、做到哪一步了、是否需要你确认。

这是一个非常重要的信号:过去的Android UI是为App设计的,而Halo预示着,未来的Android UI,将是为Agent设计的。

三、生态重塑:核心产品线,全面注入AI

当模型和Agent准备好之后,谷歌准备始把它们塞进自己最核心的“赚钱机器”里。

1. 搜索:25年来最大的变革

搜索是谷歌的命脉,这次变化堪称激进。

全新的AI搜索框,不仅能打字,还能直接丢图片、文件、视频进去,搜索会跨模态理解。

它甚至能帮你把没问清楚的问题,用AI自动补全。

更厉害的是,搜索里可以直接创建“信息代理”(Information Agents)。

你可以让它7x24小时在后台帮你盯着股市动态、追踪特定新闻、监控商品价格变化。

以前需要反复搜索的事,现在让搜索帮你盯。

最炸裂的是“生成式UI”。

比如你问一个关于“黑洞如何影响时空”的问题,搜索结果不再是十条蓝色链接,而是直接生成一个你可以拖拽参数的交互式3D可视化页面。

这背后是Gemini 3.5 Flash和Antigravity的能力。

2. 视频与地图:从“搜”到“问”

YouTube推出了 “Ask YouTube” ,你不需要再自己翻视频,直接问“怎么教三岁小孩骑自行车”,它会给你精准的摘要、小贴士,甚至直接跳到视频里最对口的那一段。

Google Maps也获得了 “Ask Maps” 功能,这是地图10年来最大的升级。

你甚至能问这种奇葩问题:“我家孩子刚掉进鸭子池塘,婚礼30分钟后开始,我能走着去哪里给她买条新裙子?”

3. Android XR智能眼镜:AI的终极入口

硬件方面,谷歌没有发布新手机,而是把重注压在了智能眼镜上。

这次谷歌联合了Gentle Monster、Warby Parker和三星,准备推出两种形态的眼镜:一种是主打语音交互的音频眼镜,另一种是带显示屏幕的显示眼镜。

现场的演示非常魔幻:一个女生戴着眼镜,跟Gemini说“带我去上周跟朋友见面的那个地方”,Gemini直接设好导航,然后主动说“要不要顺路买你常喝的那杯冷萃咖啡?”

话音未落,它已经自动打开手机上的外卖App,找到了那杯咖啡的订单,只等她最终确认。

整个过程中,手机一直安安稳稳地躺在口袋里。

这种“无感”的AI体验,可能就是下一代的交互范式。

四、商业化闭环:让AI自己“赚钱”

AI搞这么好,最终要变现。

谷歌这次给出了一个非常完整的商业化闭环。

1. Universal Cart:跨平台智能购物车

一个“所见即所得”的智能购物车。

你在搜索里看到加进去,跟Gemini聊天时看到加进去,看YouTube视频、读Gmail时都能加进去。

加进去后,购物车自动帮你找折扣、查价格历史、监控补货,甚至检查兼容性。

比如你买电脑配件,发现CPU和主板不匹配,它还会主动提醒你。

2. UCP & AP2:定义Agent时代的交易规则

谷歌在推两个协议:

  • UCP(通用商务协议):可以理解为“Agent电商时代的HTTP”。

它给AI智能体提供一套统一的购物语言。

这个协议已经拉到了Amazon、Meta、Microsoft、Salesforce、Stripe这些巨头一起玩。

  • AP2(智能体支付协议):解决“AI怎么乱花钱”的问题。

你给Agent设置好支付边界:只能在某几个品牌消费,上限不超过多少钱。所有交易都有加密的数字授权书,可追溯。

如果这两个协议都成了事实标准,那谷歌在AI电商时代的地位,就约等于 Visa + Shopify + Google Pay 的合体。

五、最后说几句

这场I/O看下来,我个人一个感觉非常强烈是,2025年是AI大模型的“军备竞赛”,而2026年,我们正式进入了“智能体时代”。

卷大模型的收益越来越低,真正能定价的,是模型之上的东西——智能体、订阅、企业服务、协议层。

所以谷歌这次用规模、它的全栈能力,和它覆盖10亿、甚至40亿用户的生态,告诉你一件事:“AI智能体时代,我可以带你们所有人上船,但舵,必须在我手里。”

对于创业者而言,这个信号也足够清晰:模型层的窗口正在关闭,通用智能体入口的机会也在收窄。

接下来的机会,藏在那些巨头尚未渗透的、对场景理解足够深的垂直领域里。

毕竟,创新探索新大陆的可能是小公司,但能把大部分人摆渡到新大陆的,大概率还是巨头。