第一次,我觉得手机像个“活物”了

1 阅读5分钟

前两天看到一个演示视频,让我愣了很久。

有人对着手机说:“帮我找下周去杭州的高铁,顺便订个离西湖近点的酒店,预算六百以内。”

然后手机自己打开了12306,查了车次,又跳转到携程,筛选了酒店,最后把两个选项并排摆在屏幕上,问:“你看这样可以吗?”

整个过程,没有一次手动点击。

手机这玩意儿,终于开始懂人话了。

你知道吗,这种感觉让我想起2007年第一次看到iPhone发布会。乔布斯用手指在屏幕上滑动,那个浏览器页面跟着手指流畅移动的时候,全场起立鼓掌。那时候所有人都知道——键盘手机要死了,一个新时代来了。

而现在,类似的事情正在发生。只不过这次,死掉的可能不是硬件,而是“App”这个概念本身。

我们过去十几年,其实一直在做“翻译”工作

仔细想想,我们这代人跟手机的关系,其实挺荒诞的。

我们想查天气,得先找到“天气”那个图标点进去。想订外卖,得先找到美团或饿了么,打开,选店,选菜,一步步点下去。想设置闹钟,得找到“时钟”,点进去,找到闹钟标签,再设置时间。

每一步,都是把“我想做什么”翻译成“我该怎么点”

这正常吗?当然不正常。但我们习惯了,习惯了十几年,以至于觉得理所当然。

就像塞班时代用九宫格打字,觉得挺快。直到全键盘触摸屏出来,才发现原来打字可以这么自然。现在回头看九宫格,简直反人类。

当“App”不再是入口,整个手机都在重新设计

你现在打开手机,满屏幕都是App图标。应用商店里有几百万个App,每个App都是一个孤岛。你想用它的功能,就得先“登陆”这个岛。

但Agent时代的逻辑完全不一样了。

用户不再关心服务来自哪个App,只关心意图能不能被满足。

你想听歌,不用先打开网易云或QQ音乐,直接说“放点适合工作的音乐”。Agent自己决定用哪个平台、播什么歌。

你想打车,不用比较滴滴还是高德,说一句“去机场”就够了。Agent帮你比价、叫车、甚至通知对方你几点到。

到那时候,App是什么?它变成了后台的服务提供方,不再是你交互的前端界面。你在前面看到的,只有一个越来越聪明的“助手”。

这就好比你去餐厅吃饭,你不用自己去厨房挑食材、选厨师。你只要跟服务员说“我想吃辣的”,后厨自然会安排好一切。

但这条路,比想象中要复杂得多

激动归激动,现实没那么简单。

现在做手机Agent的,基本分两派。

一派是“API派” ,以苹果为代表。他们让App开发者主动开放接口,声明自己能干什么,Agent通过调用这些接口来执行任务。

好处是精准、安全,每一步都可控。坏处是慢——得求着几百万个App开发者配合你,这像跟几百个国家签贸易协定,十年都谈不完。

另一派是“GUI派” ,以智谱AutoGLM、字节豆包为代表。他们不让App配合,直接让AI像人一样看屏幕、模拟手指点按。App长什么样,AI就怎么操作。

好处是通吃,什么App都能用,不用等任何人点头。坏处是——细想一下有点吓人

AI能看到你的屏幕,能模拟你的操作。这意味着它也能看到你的微信聊天记录、银行验证码、甚至密码输入框里的星号。隐私问题像一把悬在头顶的剑,谁也不敢说“绝对安全”。

所以,未来的手机Agent,大概率会是 “API为主、GUI为辅”的混合体。核心操作走安全通道,长尾需求靠视觉兜底。

真正的变革,是手机在重新定义自己

你知道吗,这件事最让我激动的,不是技术本身。

而是手机这个设备,正在重新定义自己

过去十几年,手机是什么?是“App的容器”。你买一部手机,本质上是在购买一个能运行App的硬件平台。

而未来,手机可能变成“智能体的载体”。它的核心价值不再是能装多少App、跑多快的芯片,而是它背后的Agent有多懂你、多靠谱、多能帮你把事情办好

三星在推“AI手机”的概念,谷歌在把Gemini嵌入Android底层,苹果在给Siri换脑。所有巨头都在押注同一个方向:AI就是下一代操作系统

如果这个判断成立,那我们现在正在经历的这种“不知道点哪里”的困惑,很快就会变得和当年“不知道按哪个键”一样可笑。

最后

说实话,我不确定这个未来是三年还是五年会到来。

但每次看到那些演示视频,看到手机真的像个人一样回应你,那种感觉特别像小时候第一次看《哆啦A梦》——口袋里有个能听懂你说话的机器猫,你说什么,它都能帮你搞定。

小时候觉得那是童话。

现在觉得,童话可能真的不远了。