AI 助手入口之争:从 App 走向系统和硬件

0 阅读9分钟

最近几条关于苹果和 OpenAI 的消息,单独看都像普通行业动态:

  • 据 TechCrunch 援引 Bloomberg 报道,负责 Vision Pro 头显的苹果副总裁 Paul Meade 将离开苹果,加入 OpenAI 硬件团队。报道称,Meade 还参与过苹果 AI 智能眼镜相关开发。
  • OpenAI 此前已与苹果前首席设计官 Jony Ive 合作开发 AI 设备。
  • AIbase 日报称,Xcode 26.6 新增 Google Gemini 编程助手支持,并涉及 Claude Agents、OpenAI Codex 等 AI 辅助选项。
  • 另有报道称,iOS 27 中 Siri 将进行架构升级,并支持在 Siri AI 与 ChatGPT 之间切换。

把这些信息放在一起看,指向的是同一个问题:AI 助手的入口,正在从独立 App 向系统层、硬件层迁移。

过去一年,AI 行业最常见的竞争叙事是模型能力:推理、多模态、上下文长度、价格、代码能力。但随着模型能力持续提升,另一个问题变得更重要:

用户到底从哪里调用 AI?

app_system_hardware_shift_20260628.png

如果 AI 只是一个聊天 App,用户需要主动打开、输入问题、等待回答。这个模式适合问答和内容生成,但很难成为真正意义上的“助手”。

因为助手不只是回答问题,还需要理解用户所处的环境,知道日程、文件、照片、位置、设备状态,并在合适的时候完成任务。

这也是为什么手机系统、开发工具、头显、智能眼镜这些看似不同的方向,会同时进入 AI 公司的视野。

模型决定上限,入口决定频率

大模型公司拥有模型能力,但在用户触达上仍然依赖手机、浏览器、应用商店和操作系统。

这是一个现实约束。再强的 AI,如果只能待在独立 App 里,也很难天然获得系统级上下文。

比如:

  • 摄像头
  • 麦克风
  • 通知
  • 文件
  • 日程
  • 位置
  • 相册
  • 应用之间的调用权限

这些能力通常掌握在操作系统和设备厂商手里。

真正的 AI 助手至少需要三个条件:

  1. 随时可用;
  2. 理解环境;
  3. 能执行任务。

只靠一个聊天框,很难同时满足这三点。

所以,大模型公司做硬件,不一定只是为了卖设备。更重要的是,它们在争夺一种新的交互入口。

手机是最成熟的入口。用户使用频率高,习惯稳定,几乎连接了个人数字生活的核心场景。

眼镜和可穿戴设备则代表更长期的想象:AI 不再等待用户打开屏幕,而是通过摄像头、麦克风和传感器理解环境,成为一种更“在场”的助手。

从这个角度看,OpenAI 吸纳 Vision Pro、智能眼镜相关经验的人才,并不只是一次人事变化。它更像是在补齐硬件、交互和可穿戴经验。

AI 助手如果只能等用户打开 App,就很难成为真正的助手。

苹果引入外部模型,不等于放弃控制权

苹果的变化同样值得关注。

过去,苹果更强调软硬件一体和相对封闭的体验。但在大模型时代,单靠自研模型追赶所有能力并不现实。

更可行的方式是:

保留系统入口,引入外部模型,让模型成为可以切换、调用、调度的能力层。

报道称,iOS 27 中 Siri 将进行架构升级,并支持在 Siri AI 与 ChatGPT 之间切换。如果这个方向持续推进,意味着外部大模型可能进入手机的系统级入口,而不只是以独立 App 的方式存在。

Xcode 的变化也说明,外部模型正在进入开发者工作流。

AIbase 日报称,Xcode 26.6 在 Claude Agents、OpenAI Codex 等之外,新增 Gemini 编程助手支持,并覆盖苹果多个平台 SDK。

这意味着苹果生态内的 AI 能力,不只发生在普通用户侧的 Siri 上,也会进入开发工具、应用构建和平台生态之中。

但这不代表苹果放弃控制权。

恰恰相反,苹果的核心利益并没有变:

  • 控制系统体验;
  • 控制权限边界;
  • 控制默认入口;
  • 控制开发者生态。

苹果不一定要拥有最强模型,但它必须拥有最重要的入口。

在 AI 时代,操作系统可能从应用的管理者,变成模型的调度者。

AI 入口正在形成三层结构

ai_entry_three_layers_20260628.png

理解这轮变化,可以用一个三层结构来看:

  1. 模型层;
  2. 系统层;
  3. 硬件层。

1. 模型层:决定能力上限

模型层决定 AI 的理解、生成、推理、多模态、代码和操作任务能力。

OpenAI、Gemini、Claude 等模型之间的竞争,仍然是 AI 能力提升的核心。

但模型本身并不直接等于用户入口。模型越强,越需要找到合适的调用方式和使用场景。

2. 系统层:决定能否进入工作流

系统层决定 AI 能不能调用文件、日程、通知、相册、应用和权限。

Siri、iOS、Xcode 这类系统级工具,比单个 AI App 的更新更值得关注。因为它们决定 AI 能否进入用户和开发者的日常工作流。

对普通用户来说,系统级 AI 可能意味着不需要单独打开一个 App。

对开发者来说,系统级 AI 可能意味着开发工具、SDK、平台能力本身开始被 AI 改造。

3. 硬件层:决定能否理解环境

硬件层决定 AI 能否获得摄像头、麦克风、传感器、空间计算和可穿戴形态。

Vision Pro 虽然没有成为大众爆款,但它背后的空间交互、视觉感知和头显经验,仍然对 AI 硬件有参考价值。

可以简单理解为:

模型是大脑,系统是神经网络,硬件是感官和身体。

谁能同时接近用户、理解环境、调用工具,谁就更接近真正的 AI 助手。

为什么手机和眼镜会成为关键战场?

phone_vs_glasses_entry_20260628.png

手机是 AI 助手最现实的入口。

它掌握通讯、支付、照片、文件、位置和应用生态。用户每天高频使用,系统权限集中,开发者生态成熟。

AI 如果要真正帮用户做事,就必须靠近手机系统,而不是停留在另一个需要单独打开的 App 里。

这也是为什么 Siri 的变化重要。它不是一次普通语音助手更新,而是苹果是否会把 AI 变成系统级交互入口的问题。

眼镜则是更长期的入口实验。

相比手机,眼镜更自然地承载视觉输入和语音交互。它适合实时理解环境,例如识别物体、辅助导航、会议记录、即时翻译、空间提示等。

AI 进入手机,是从 App 走向系统。

AI 进入眼镜,是从屏幕走向环境。

当然,眼镜要成为大众入口,还取决于价格、佩戴体验、续航、隐私规则和应用场景成熟度。但方向很清楚:它比手机更接近“随身 AI”的长期想象。

OpenAI 和苹果的位置也因此不同:

  • OpenAI 模型强,但缺少硬件入口和系统控制权,所以要向设备延伸;
  • 苹果硬件和系统强,但需要更强的模型生态,所以开始引入外部模型。

双方不是简单替代关系,而是在不同层面争夺 AI 助手的主导权。

对开发者和 AI 产品公司的启发

developer_opportunity_layers_20260628.png

当平台把 AI 能力做成默认功能,创业公司和开发者就不能再只卖一个入口。

未来,一些通用能力会更容易被系统吸收,例如:

  • 通用聊天入口;
  • 简单文档问答;
  • 基础代码补全;
  • 轻量级日程助手;
  • 邮件摘要;
  • 翻译;
  • 内容总结。

单纯依赖“套壳模型 + 聊天界面”的产品,差异化会越来越弱。

但这不意味着 AI 产品机会减少,而是机会重新分层。

更有价值的方向,可能会集中在深度行业场景和具体工作流里。

例如:

  • 法律、医疗、金融、教育、制造、跨境电商等行业应用;
  • 企业内部审批、数据分析、知识库、业务系统连接的 Agent;
  • 开发者工具链中的测试、代码审查、部署、监控和文档生成;
  • 结合图片、视频、空间和设备传感器的多模态应用。

对开发者来说,关键不是把 AI 当成一个外接聊天窗口,而是关注:

  1. 系统权限;
  2. 工作流位置;
  3. 数据闭环;
  4. 场景深度。

当平台开放多模型后,产品差异化不能只靠“接了哪个模型”,而要靠“解决了哪个具体问题”。

越通用的 AI 功能,越容易被系统吸收;越贴近业务流程的 AI 产品,越有机会留下来。

小结

这轮变化可以概括为三句话:

  • 模型层:大模型继续提升能力;
  • 系统层:手机操作系统和开发工具开始接入外部模型;
  • 硬件层:大模型公司开始探索自有设备和可穿戴入口。

手机会先成为 AI 助手最现实的主战场。眼镜和可穿戴设备会成为更长期的入口实验。

真正的变化不是某个设备立刻取代手机,而是 AI 助手正在寻找比 App 更自然、更高频、更贴近环境的存在方式。

对普通用户来说,未来 AI 不一定需要单独打开,它可能会嵌入系统。

对开发者来说,系统级 AI 会改变应用设计方式。

对创业者来说,入口红利会减少,场景深度会变得更重要。

AI 助手的下一站,未必马上是眼镜,但大概率不会只停留在聊天框里。


作者长期关注 AI 产品、大模型应用和 Agent 落地,相关内容也会同步更新在公众号「AI 趋势局」。

参考来源