Google I/O 2026 的总结已经铺天盖地了,从模型到搜索,从 Antigravity 到购物车,大家该列的功能基本都列完了。
今天这篇我本来不太想写,而且说实话,这场发布会的评价也不算特别高。
至少不是那种一看就让人眼前一亮,觉得“完了,行业又被改写了”的东西。
所以老金今天不做发布会清单,也不打分。
我只想讲一个我看完以后越想越明显的点。
Google 也在做 Agent。
表面看,跟 ChatGPT、Claude 好像都在做差不多的事。
但我越看越觉得,这事不能只按“谁又抄谁”去理解。
OpenAI 更像在把 ChatGPT 做成一个通用智能体入口。
它先有一个超级强的聊天入口,再通过 agent、Codex 往外接各种任务。
Anthropic 最清楚的方向,是 Claude Code 这种开发智能体。
它抓的是开发者工作流,终端、代码库、任务拆分、代码修改和验收。
Google 这次的怪地方在这。
它更像是在把 Agent 往自己原来那套产品和入口里塞。
搜索、YouTube、Gmail、Docs、Android、Shopping,这些门本来就在那儿。
说到这,我脑子里反而蹦出来一个国内参照物。
豆包。
豆包为什么在国内跑得这么快,不只是因为模型多强。
QuestMobile 2026 年一季度的数据里,豆包 3 月月活已经到 3.45 亿,排在中国 AI 原生 App 第一。
这个数据本身就说明一件事。
大众场景比极客场景大太多了。
所以我说 Google 这次有点像豆包,不是说产品长得像,也不是说它俩能力一样。
我说的是路线。
它们都在把 AI 往普通人每天会碰到的地方推。
你想一下,平时一个普通人会主动打开几个 AI Agent 工具?
可能不多。
但他会搜索,会看 YouTube,会用地图,会收 Gmail,会写 Docs,会在 Android 手机上切来切去,也会在购物里比价格。
这些都不是新玩具。
很多人每天已经从这里路过了。
这就是 Google 的位置。
它没必要再造一个一模一样的 ChatGPT 或 Claude Code。
它更顺手的打法,是在这些门背后,慢慢塞进一个会替你干活的东西。
看到这里,我才有那种“哦,原来如此”的感觉。
真正值得看的,不是某个功能有多炸。
是 Agent 开始被放回普通人本来就会经过的地方。
搜索框开始变得不像搜索框
Google 这次 Search 的变化,我反而比 Antigravity 更在意。
它说 AI Mode 要从“找信息”往“帮你完成事”走。
Search 里会有 Information agents,也会有更强的多模态理解。
以前搜索框干的事很简单。
你输入关键词,它给你一堆结果。
后来 AI Overview 出来,它开始帮你总结。
现在的问题变了。
如果搜索框里能启动 Agent,它就会从告诉你答案,慢慢变成替你盯事情、拆问题、生成界面、推动下一步。
搜索是普通人最熟的入口。
你不会为了一个小问题专门打开某个 Agent 平台,但你会顺手搜一下。
一旦搜索框里长出 Agent,它就不需要教育用户。
用户已经在那里了。
这就是 Google 和很多 AI 创业公司的差别。
创业公司要让用户形成新习惯,Google 很多时候只要在老习惯里多塞一层。
地图和YouTube这两个例子很说明问题
Ask Maps 和 Ask YouTube 的例子很接地气。
比如 Maps 里那个场景,一个孩子掉进鸭子池塘,婚礼 30 分钟后开始,家长问哪里能走着去买一条新裙子。
这已经超出传统地图搜索了。
你要找的也不只是“服装店”三个字。
你是在一个很狼狈、很具体、还带时间压力的生活场景里找解决办法。
YouTube 也一样。
你问怎么教三岁小孩骑自行车,它会先整理概览和小贴士,再跳到相关片段。
这就有点不像搜索结果页了。
它更像一个懂你当前麻烦的人,先把信息切成能用的形状。
这时候再回头看豆包,就更容易理解。
大众入口的价值,不是把功能堆满。
而是让人少想一步。
查路的时候顺手帮你解决现实麻烦。
看视频的时候顺手帮你找到最有用的片段。
写文档的时候顺手把你嘴里乱七八糟的话整理成段落。
这些功能单个看都不算新。
连起来看,就有点不一样了。
Spark和Halo,不要吹成独家
Gemini Spark 更像 Google 想象里的个人 Agent。
它跑在 Google Cloud 的虚拟机上,可以 24 小时继续干活。
你电脑关了,它还在云端处理任务。
这块我不想吹成 Google 独有。
云端 Agent、手机端 Agent、后台持续干活,OpenClaw、Hermes、ChatGPT、Claude 都有相近方向。
真正的区别还是入口。
Google 做 Spark 的时候,起点就是 Gmail、Docs、Sheets、Slides、Drive、Calendar 这些自家东西。
它少了一层“先把外部工具接进来”的绕路。
比如办一个街区派对。
Spark 可以在 Sheets 里做 RSVP 表,邻居回邮件说自己要来,表格自动更新。
没回的人,它帮你起草提醒邮件。
它还能去 Drive 里翻小区章程,提醒你周五下午之前不能布置充气城堡。
这个例子不高大上。
但我反而觉得它比很多技术演示更有用。
因为真实生活里的任务,很少长成“帮我写一篇宏大文章”这种样子。
更多时候,是一堆碎事互相牵着。
邮件在 Gmail。
表格在 Sheets。
规则在 Drive。
日程在 Calendar。
通知可能在手机上。
Google 如果能把这些入口串起来,Agent 就不只是一个聪明聊天框。
它会变成一个在你生活缝隙里跑来跑去的办事员。
Android Halo 也是这个味道。
它会在 Android 顶部状态栏里显示 Agent 正在做什么,做到哪一步,要不要你确认。
这听起来像一个小 UI。
但我觉得它可能比很多跑分更值得看。
过去手机系统的底层对象是 App。
你打开 App,然后在 App 里操作。
如果 Halo 这种东西成熟,手机里可能会多出一层东西。
你看的会从某个 App,变成一组 Agent 正在替你跑哪些事。
这个变化不会一天发生。
但方向很清楚。
购物车这段,味儿更浓
这次还有一个我一开始差点跳过去的东西。
Universal Cart。
Google 官方把它放在 Shopping 里讲。
看上去像购物车升级,其实更像 Agent 电商的入口。
你在 Search、Gemini、YouTube、Gmail 里看到一个东西,都可以加进去。
加进去以后,它会帮你找折扣、查价格历史、对比支付卡权益、提醒缺货补货,还能检查兼容性。
比如你买电脑配件,主板和你之前买过的 CPU 不匹配,它会提醒你换。
这个东西没有“模型世界第一”那种刺激感。
但它特别接近 Google 的老生意。
Google 过去二十多年,最值钱的能力就是理解人的意图,然后把人导向信息、商品和服务。
Agent 电商只是把这件事往后推了一步。
以前是你搜、你点、你买。
以后可能是你授权,Agent 替你盯、替你比、替你在下单前做最后确认。
这时候 UCP 和 AP2 这类协议就有意义了。
一个管 Agent 怎么购物,一个管 Agent 怎么拿到付款授权。
如果没有这些底座,Agent 买东西就是一句漂亮演示。
有了这些规则,它才有机会进入真实交易。
当然,这里我也不想吹太满。
Agent 一旦碰钱,问题会比写代码复杂得多。
权限、误买、退款、商家责任、广告排序、平台偏向,每一个都不好处理。
但也正因为碰钱,这块才值得看。
开发者这边,我认为只能算样板间
Antigravity 2.0 和 Gemini API 的 Managed Agents 也值得看。
但在这篇文章里,我不想把它们写成主角。
Google 官方说 Antigravity 是 agent-first 的开发平台,可以编排多个 Agent,还支持动态子 Agent、计划任务和后台自动化。
这个方向我挺熟,因为我一直在折腾多 Agent 编排。
说实话,让几个 Agent 一起跑不难。
难的是别让它们各干各的,最后拼出一堆没人敢合的东西。
一个改前端,一个改接口,一个跑测试,一个看文档。
听起来很美。
真落到项目里,第一个问题通常是,谁知道最终目标是什么。
第二个问题是,谁来验收。
Google 的 Managed Agents 也是类似逻辑。
你可以用一个 API 调用拉起一个 Agent,让它推理、调用工具、执行代码,而且跑在隔离的 Linux 环境里。
它解决的不是“模型会不会写代码”,而是环境、状态、权限、工具调用这些脏活。
做过项目的人都知道,这些东西才最容易卡住。
还有一个点。
Google Developers Blog 写得很清楚,Antigravity CLI 从 2026 年 5 月 19 日开始可用。
Gemini CLI 和 Gemini Code Assist IDE 扩展面向 Google AI Pro、Ultra 和个人免费用户时,会在 2026 年 6 月 18 日停止服务请求。
企业用户另算,但普通用户这条迁移线已经摆在那了。
这说明 Google 不是随便发个开发者玩具。
它在把开发者也迁到同一套 Agent 工作环境里。
开发者入口只是样板间。
真正大的东西,还是普通人的入口。
看到这里,我觉得普通人要补的东西,先别放在工具名上。
你今天把 Antigravity、Spark、Universal Cart、Managed Agents 全背下来,意义也不大。
过几个月名字可能又换。
真正该练的,是把自己的工作讲清楚。
你想让 Agent 帮你做什么。
哪些资料可以看。
哪些东西不能碰。
做到什么程度算合格。
什么时候必须回来问你。
出了错能不能回滚。
这些听起来很土。
但真到 Agent 干活时,最值钱的就是这些土东西。
以前大家学提示词,核心是怎么让模型回答得更好。
接下来会慢慢变成,怎么让 Agent 在真实边界里做事。
这俩差别很大。
回答错了,你可以重新问。
事做错了,可能会改坏文件、发错邮件、买错东西、泄露资料。
所以我越来越不喜欢那种“不会代码也能做产品”的轻飘飘说法。
不会代码当然可以开始。
这是一件好事。
但开始以后,你还是要知道怎么验收。
页面有没有漏状态,数据会不会丢,权限是不是给大了,错误提示是不是像人话,用户点错以后有没有退路。
AI 可以帮你把第一版搭出来。
可第一版到能用,中间那段路,还是要有人盯。
Google这次更像在铺路
所以回到开头。
Google 这次不惊艳吗。
我觉得很多单点确实不惊艳。
甚至有些地方会让人觉得,怎么又是这些东西。
但如果只看单点,容易看偏。
Google 真正的动作,是把 Agent 往自己的入口里铺。
搜索、地图、YouTube、Docs、Gmail、Android、购物、支付、开发工具、云环境。
这些入口单独拿出来,不一定每个都赢。
可它们一旦接起来,就会变成一张很密的网。
这张网里的 Agent,不需要每天提醒你打开它。
你本来就在里面。
我现在对 Google 的判断大概就是这样。
模型可能还会拉胯,产品名可能还是乱,很多功能也可能做得不够顺。
但它手里有太多生活入口。
只要模型能力没有被 OpenAI 和 Anthropic 拉开到完全不可用,Google 就有机会靠入口把 Agent 慢慢塞进普通人的日常。
很多真正改变习惯的东西,一开始靠的都不是惊艳。
它们只是慢慢出现在你每天必经的地方。
等你反应过来的时候,你已经开始用了。
飞书****开源知识库(实时更新 交流群):
https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFf
Claude Code & Openclaw 双顶流全中文从零开始的教程:不懂代码照样造网站,老金15万字Claude Code+OpenClaw教程免费开源
每次我都想提醒一下,这不是凡尔赛,是希望有想法的人勇敢冲。
我不会代码,我英语也不好,但是我做出来了很多东西。
我真心希望能影响更多的人来尝试新的技巧,迎接新的时代。
谢谢你读我的文章。
如果觉得不错,随手点个赞、在看、转发三连吧🙂
如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。