Google I/O 2026看完,我最大的感受就一个:google 在把所有东西往一个方向靠——Agent。
Gemini Spark、搜索Agent化、93个子Agent协同构建操作系统、3.5 Flash的agent benchmark全线领先。Sundar Pichai在台上原话:"We are firmly in our agentic Gemini era"——我们已经坚定地进入了Agent化的Gemini时代。WIRED的总结更直接:Google 2026年的目标,是把AI Agent推到它所有核心服务的最前线。
这些发布放在一起看,更像是同一个人在不同场合反复说同一句话。
Spark:Google亮出底牌
Gemini Spark是旗舰产品。24/7全天候运行在Google Cloud虚拟机上,你关掉电脑它还在。给它一个复杂任务,它拆解、规划、调用工具、执行、反馈结果。Spark背后是Google的全部家当——搜索、Gmail、日历、Docs、Maps,二十亿安卓用户的行为数据。Agent的护城河在于它能调动多少真实世界的接口。 这一局,Google的牌面比谁都大。
3.5 Flash的数据也很直接。Terminal-Bench 2.1得分76.2%,MCP Atlas 83.6%,超过前代Pro。Google以前推模型喜欢讲安全、讲负责任,这次直接上跑分、上demo、上真实场景。
Google现在月处理3.2 quadrillion tokens(Google官方数据),同比去年增长7倍。Gemini app月活超过9亿,AI Mode in Search月活冲到10亿。这些数字是Agent的基础。
还有一个一般人不注意的信号:第8代TPU分了两条线——TPU 8t专门训练,TPU 8i专门推理。因为Agent时代的成本结构和过去不一样了。过去用户偶尔问一句,推理成本可控。未来是大量Agent 24/7在后台执行、检索、跑代码、调工具,推理量会爆炸。Google在为"更多Agent同时跑"造芯片。
搜索:从给答案到替你跑腿
Business Insider的原话:Google搜索正在经历"biggest-ever AI makeover"——史上最大规模的AI改造。
你说"帮我策划一个东京五日游",以前的Google给你十条链接、几个广告、一个摘要卡片。现在的搜索Agent直接出一份完整行程——机票比完价,酒店订好,日历事件建好,地图路线标好,最后问你一句"这样可以吗"。众所周知,规划和规划不一样,看起来像和实际能不能用是两回事。
但Search信息代理背后更值得看的是三层架构:世界信息 + 个人上下文 + 行动。 搜索从"索引全网给你看",变成了懂你的邮件、日历、照片,理解你的偏好和上下文,然后替你执行。Google官方说AI Mode一年内月活冲到10亿,Search正在从查询结果页变成任务入口。Google的搜索护城河正在从索引网页转向"理解世界 + 理解你 + 替你行动"。这个变化如果成立,Google保住的不只是搜索业务,而是下一代互联网的起点。
从"给答案"到"替你干活",中间的跨越比从PC到移动还大。
不只是产品,是在定规则
Google在做的另一件事,比单个产品影响大得多。
Chrome发布了WebMCP——一个提议中的开放Web标准,让网站可以把结构化工具直接暴露给浏览器Agent。未来Agent访问网页不再是"模拟点击",而是像调API一样精准可靠。Chrome Agentic Web可能是这次I/O最被低估的东西。大家都在想怎么把应用通过Web连接起来,Google直接想把"网站适配AI Agent"变成新的Web标准。未来竞争的是谁定义Agent怎么操作网页。
购物这边出了Universal Cart——跨搜索、Gemini、YouTube、Gmail的统一购物车,后台自动比价、查历史、提醒补货。同时推了Agent Payments Protocol(AP2),让Agent可以在用户设定的边界内完成安全支付,可追踪、可审计。
WebMCP管Agent怎么读网页,UCP管Agent怎么买东西,AP2管Agent怎么付钱。三件事串在一起:Google在定义Agent时代的互联网协议。谁定义了Agent怎么访问、怎么交易、怎么支付,谁就可能掌握下一代互联网的入口规则。
Android这边,Gemini Intelligence直接把Agent能力嵌进系统层——跨应用多步任务、Chrome自动填表、智能摘要、语音润色。
Google说:Android正在从operating system变成intelligence system。加上智能眼镜、车机、Googlebook笔记本,Google在把手机、手表、眼镜、车、电脑串成一个Gemini设备网络——让设备本身变成Agent的运行环境和上下文入口。Apple的优势是硬件闭环,Meta的优势是眼镜社交,Google是唯一同时覆盖手机、眼镜、车机、笔记本的厂商。
Antigravity 2.0也值得关注。93个子Agent在12小时内构建了一个可运行的操作系统核心框架——后台拉起一支Agent军团,每个子Agent负责一小块,互相协调,最后把结果合在一起交给你。这叫组织。但说实话,Antigravity早期问题不少,基础登录bug都没修利索,节奏慢了,结果Codex趁机占了上风。这次I/O Google重新推Antigravity接入企业Agent Platform,如果稳定性和迭代速度能跟上,依然是个好方向。关键是别再只画饼了——开发者会用脚投票。
设计方向的Stitch也提一嘴——实时设计Agent,用文字、语音、设计文件协作,导出到AI Studio或Antigravity,对标Figma AI和v0。做设计的人可以关注。
从TPU推理芯片到Web协议到支付标准到手机OS,从底层基础设施到上层协议到终端设备,全在为Agent时代重新造一遍。
还有一些普通人马上能用的:Ask YouTube用自然语言搜视频内容直接跳片段,Daily Brief每天自动整理日程和邮件摘要,Google Pics做图改图嵌在Docs和Slides里。单看是小功能,串起来就是一条线——Google在把Agent能力塞进你每天都在用的东西里,不需要你"切换到AI模式"。
DAA:百度点了一把火,Google在浇油
百度李彦宏在Create 2026上提了一个概念,我觉得比任何单个产品都重要——DAA,Daily Active Agents,每日活跃智能体数。他的原话:"Token只代表成本不代表收益","未来全球日活智能体数可能会超过100亿"。
DAU大家熟——日活,互联网时代衡量产品的金标准。但到了Agent时代,DAU会变得很尴尬。用户不需要"打开"你的产品了,Agent在后台替他跑着,他甚至不感知你的存在。你每天有100万人在用你的Agent,但DAU可能只有10万——因为90万人的任务都是Agent自动完成的。
DAA会取代DAU,成为AI产品的核心指标。 "今天有多少人来了"变成"今天有多少Agent在替你的用户干活"。
DAU时代追求停留时长、点击率——让人多看一会儿。DAA时代追求Agent完成率、任务覆盖度——让人少操心一会儿。上一次MAU切到DAU,移动互联网从此和PC互联网走上了两条不同的路。李彦宏在百度提出DAA,Google在I/O上用全线Agent化来验证它。中外两个AI大国,从不同方向指向同一个结论。
Agent的一天:我的真实体验
说了这么多Agent时代,我自己的工作流是什么样?
每天醒来第一件事是看微信推送。几个新闻源Agent凌晨就在跑了,各自抓各自领域的动态,合并、去重、打分,最后把一份"今天值得写什么"的清单推到我微信上。我扫一眼评分,挑两三个选题,丢给Agent开始跑。多层写作Agent按需加载——基础信息整理、结构框架、角度分析、风格校准、事实核查层层叠加,它自己判断该加载哪些,我只需要在最后接住。
之后判断——这个角度是不是我想说的?这句话是不是空话?这个结论有没有证据?说到底,我每天真正在做的事只有一件:判断。
判断完了,自动排版转微信格式,直接进草稿箱。整个流程里最反直觉的一点:我花时间最少的部分恰恰是"写"。Agent把搜集、整理、初稿、排版全做了,我坐到电脑前的时候,东西已经候在那儿了。
写代码的时候我主要在三个agent之间切换:Claude Code处理复杂重构,Codex用code editor模式跑批量任务,ChatGLM的agent模式做一些稍微增长的调研。打开chatbot的次数越来越少——但凡涉及"帮我做完一件事",我第一个反应都是拉一个agent。
Agent取代的是创作里那些从来不该由人干的事。 苦力被接走之后,人反而可以聚焦在创作的核心上。
不看嘴上,看脚下
24篇官方公告,从TPU芯片到Web标准到支付协议到手机OS,没有一篇和Agent无关。Google自己给这场大会的标题就一个词:agentic Gemini era。
Google、百度、Meta都在往同一个方向走——构建Agent的基础设施。区别只是谁的动作大、谁的手牌多。留给产品人一句话:别光盯着谁家模型又涨了几分,去看谁在造Agent时代的路和桥。