智谱重磅开源AutoGLM,让“豆包手机”人人可造!

293 阅读3分钟

关于智谱开源AutoGLM的消息,其核心在于通过开源其“会操作手机”的AI模型,为整个行业提供打造“豆包手机”类似功能的技术底座。

下面为你梳理了AutoGLM的核心信息、两种技术路径的对比以及开源策略带来的影响。

🔍 AutoGLM是什么?

AutoGLM是智谱AI开源的AI Agent模型,其核心突破是让AI具备 “Phone Use” 能力。它通过视觉理解屏幕,将一句自然语言指令(如“点一份外卖”)拆解为一系列点击、滑动等操作步骤,并稳定执行。目前已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景。

🆚 开源路径 vs. 豆包路径

智谱的开源策略,与近期引发热议的“豆包手机”采取了不同的技术实现和商业路径。

特性维度智谱 AutoGLM (开源路径)豆包手机助手 (系统集成路径)
技术架构视觉模型 + 模拟操作。通过“看懂”屏幕并模拟点击来操作应用,不依赖深度系统权限。深度系统集成。需要手机厂商授权,获取系统级权限,以实现跨应用的直接调度。
商业模式开放生态。将核心模型开源,任何硬件厂商、手机厂商或开发者均可免费使用和二次开发。生态合作。作为第三方AI助手,需要与手机厂商(如中兴)深度合作,嵌入其操作系统。
行业定位技术底座与赋能者。目标是成为行业公共基础设施,降低AI手机技术门槛。超级入口/新生态。旨在打造一个能接管手机操作、聚合服务的AI新入口。
数据与隐私支持本地与云端部署,企业和开发者可完全掌控数据与隐私。深度集成于合作厂商的系统框架中,数据处理依赖于该框架的隐私策略。

💡 开源策略的影响与挑战

智谱的开源决策可能带来广泛影响,但同时也面临现实挑战。

  • 潜在影响

    • 降低技术门槛:让中小厂商甚至个人开发者都能快速获得AI手机的核心能力。
    • 推动生态开放:打破“AI手机能力仅掌握在少数巨头手中”的局面,将技术选择权交给市场。
    • 加速行业创新:可能催生出更多样化的AI原生设备和应用形态。
  • 主要挑战

    • 应用生态的兼容性:“豆包手机”已遇到部分超级应用(如微信、淘宝)因安全和商业考虑限制其自动操作的情况。采用类似技术路线的AutoGLM也可能面临相同的适配阻力。
    • 技术实现的稳定性:在复杂的安卓定制系统和非标准UI下,保证模拟点击操作的稳定性和效率是一大工程挑战。
    • 商业模式的可持续性:作为开源项目,其自身如何实现长期可持续的运营和发展仍需探索。

总而言之,智谱开源AutoGLM,为AI手机的普及提供了一条开放的技术路径。它是否能成功推动生态变革,关键在于开发者社区的参与度、与现有应用生态的磨合,以及项目自身的持续活力。

【智答专家】您身边免费的GPT4.1人工智能AI助手,免翻!!!无套路!国内直连,支持文本生成,问答,多语言支持,个性化建议,图片生成,代码纠正等等。扫码关注智达专家,欢迎体验。

图片1.png