获得徽章 0
#挑战每日一条沸点# 【屏幕理解+自动执行!智谱 AI 开源 Open-AutoGLM,打造人人可用的手机智能体】
「豆包手机」尚在讨论风口时,智谱 AI 宣布开源其手机端智能助理框架 Open-AutoGLM,实现了对屏幕内容的多模态理解与自动化操作。
与传统手机自动化工具不同,Phone Agent 采用视觉语言模型进行屏幕感知,结合智能规划能力自动生成并执行操作流程。系统通过 ADB(Android Debug Bridge)控制设备,用户只需用自然语言描述需求,Phone Agent 即可自动解析意图、理解当前界面、规划下一步动作并完成整个流程。
系统还内置敏感操作确认机制,并支持在登录或验证码场景下进行人工接管。同时,它提供远程 ADB 调试能力,可通过 WiFi 或网络连接设备,实现灵活的远程控制与开发。
目前,「Open-AutoGLM:手机端智能助理」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验!
在线教程:
go.hyper.ai
「豆包手机」尚在讨论风口时,智谱 AI 宣布开源其手机端智能助理框架 Open-AutoGLM,实现了对屏幕内容的多模态理解与自动化操作。
与传统手机自动化工具不同,Phone Agent 采用视觉语言模型进行屏幕感知,结合智能规划能力自动生成并执行操作流程。系统通过 ADB(Android Debug Bridge)控制设备,用户只需用自然语言描述需求,Phone Agent 即可自动解析意图、理解当前界面、规划下一步动作并完成整个流程。
系统还内置敏感操作确认机制,并支持在登录或验证码场景下进行人工接管。同时,它提供远程 ADB 调试能力,可通过 WiFi 或网络连接设备,实现灵活的远程控制与开发。
目前,「Open-AutoGLM:手机端智能助理」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验!
在线教程:
展开
评论
点赞
#挑战每日一条沸点# 【开源性价比最优选!Mistral AI 发布 Ministral 3 系列模型,具备视觉理解与智能体功能,开源性能媲美闭源】
近日,Mistral AI 团队开源高效模型系列 Ministral 3,提供三种模型参数:3B、8B 和 14B,每个参数都包含基础版、指令版和推理版三个版本,均采用 Apache 2.0 许可证。
Ministral-3-14B 作为该系列的参数最大的模型,提供了同系列中最先进的性能,其能力可对标参数更大的 Mistral Small 3.2-24B 模型。它专为本地部署优化,可在资源有限的小型设备上保持高性能运行。
Ministral-3-14B 集成了多模态理解与智能执行能力:在视觉方面能够直接分析图像内容,并基于视觉信息生成文本内容;同时,其多语言支持覆盖数十种主流语言,包括英语、中文、日语等。模型依托于其强大的 256K 上下文窗口,为处理复杂、长序列任务提供了坚实支撑。
目前,「一键部署 Ministral-3-14B-Instruct」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验!
在线教程:
go.hyper.ai
近日,Mistral AI 团队开源高效模型系列 Ministral 3,提供三种模型参数:3B、8B 和 14B,每个参数都包含基础版、指令版和推理版三个版本,均采用 Apache 2.0 许可证。
Ministral-3-14B 作为该系列的参数最大的模型,提供了同系列中最先进的性能,其能力可对标参数更大的 Mistral Small 3.2-24B 模型。它专为本地部署优化,可在资源有限的小型设备上保持高性能运行。
Ministral-3-14B 集成了多模态理解与智能执行能力:在视觉方面能够直接分析图像内容,并基于视觉信息生成文本内容;同时,其多语言支持覆盖数十种主流语言,包括英语、中文、日语等。模型依托于其强大的 256K 上下文窗口,为处理复杂、长序列任务提供了坚实支撑。
目前,「一键部署 Ministral-3-14B-Instruct」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验!
在线教程:
展开
评论
点赞