6.4 万 Star 开源智能体框架迎史诗级重构!OpenHands V1 横空出世,叫板巨头

107 阅读7分钟

6.4 万 Star 开源智能体框架迎史诗级重构!OpenHands V1 横空出世,叫板巨头

大家好,我是AI算法工程师七月,曾在华为、阿里任职,技术栈广泛,爱好广泛,喜欢摄影、羽毛球。目前个人在烟台有一家企业星瀚科技。

  • 关注公众号:量子基态,获取最新观察、思考和文章推送。
  • 关注知乎:量子基态,获取最新观察、思考和文章推送。
  • 关注CSDN:量子基态,获取最新观察、思考和文章推送。
  • 关注稀土掘金:量子基态,获取最新观察、思考和文章推送。
  • 网站1 :七月
  • 网站2:zerodesk

我会在这里分享关于 编程技术、独立开发、行业资讯,思考感悟 等内容。爱好交友,想加群滴滴我,wx:swk15688532358,交流分享

如果本文能给你提供启发或帮助,欢迎动动小手指,一键三连 (点赞、评论、转发),给我一些支持和鼓励,谢谢。

作者:七月 链接:www.xinghehuimeng.com.cn 来源:七月 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

传送门

开源智能体框架 OpenHands升级

刚刚,GitHub 星标突破 6.4 万的开源智能体框架 OpenHands 开发团队,通过一篇新论文正式官宣核心升级:智能体组件完成架构级重构,OpenHands Software Agent SDK 重磅发布,标志着框架从 V0 时代全面迈入功能更完善、架构更稳健的 V1 阶段。这场跨越性革新不仅解决了初代版本的核心痛点,更凭借差异化特性矩阵,为开源智能体的生产级落地提供了全新解决方案。

这一重大升级标志着OpenHands从V0版本迈向了V1版本,带来了诸多令人振奋的改进。

img

添加图片注释,不超过 140 字(可选)

OpenHands V0 最初以 "快速原型验证" 为核心目标,采用智能体逻辑、评估体系与应用层深度耦合的单体架构设计。但随着项目星标突破 6.4 万、全球开发者广泛参与,这一架构的局限性日益凸显:沙盒环境缺乏弹性适配能力、可变配置随功能迭代愈发繁杂、研究场景与生产部署过度绑定导致迭代效率低下。为满足从原型设计到大规模落地的全流程需求,架构级重构成为必然选择。

sdk的架构重构

OpenHands团队在新版本中进行了一系列深思熟虑的架构重构,旨在提升框架的灵活性、安全性和可靠性。新的设计允许开发者在默认情况下,仅需几行代码即可实现智能体的构建,同时也支持扩展为功能齐全的复杂智能体,具备自定义工具和内存管理等功能。

这一次的改进设计官方根据四个原则进行的:

  • 灵活性方面,他们设计了一个简洁的接口,在默认情况下仅需几行代码即可实现智能体,但又易于扩展为具有自定义工具、内存管理等功能的、功能齐全的复杂智能体。
  • 在安全性和可靠性方面,它提供了无缝的本地到远程执行可移植性、集成的 REST/WebSocket 服务。
  • 为了与人类用户交互,它可以直接连接到各种界面,如可视化工作区(VS Code、VNC、浏览器)、命令行界面和 API。
  • 与现有的 OpenAI、Claude 和 Google 的 SDK 相比,OpenHands 独特地集成了原生沙盒化执行、生命周期控制、模型无关 (model-agnostic) 的多 LLM 路由以及内置的安全分析。

下面分别展开说说这四个点。

img

添加图片注释,不超过 140 字(可选)

img

添加图片注释,不超过 140 字(可选)

架构重塑:更灵活、更安全

OpenHands V1版本在架构上进行了深度优化。其核心设计理念是提供一个简洁的接口,开发者仅需几行代码即可构建智能体,同时又能灵活扩展,满足自定义工具、内存管理等复杂需求。

在安全性方面,OpenHandsSoftwareAgentSDK提供了无缝的本地到远程执行可移植性,并集成了REST/WebSocket服务,增强了智能体的部署灵活性。为了方便与人类用户交互,V1版本可以直接连接到各种界面,如可视化工作区(VSCode、VNC、浏览器)、命令行界面和API。

可自由选择的沙盒

默认采用单进程统一执行智能体与工具,与 MCP 架构假设保持一致;当需要隔离防护时,可将同一执行栈透明容器化,让沙盒化从 "强制要求" 变为 "可选功能",在保障安全性的同时大幅提升部署灵活性。

与现有的OpenAI、Claude和Google的SDK相比,OpenHandsSoftwareAgentSDK展现出独特的优势。

组件的可变性等

智能体及工具、LLM 等所有组件均定义为不可变 Pydantic 模型,构建时即完成验证且支持序列化;仅会话状态为可变实体,作为唯一真值来源跟踪执行过程,实现确定性重放、强一致性与稳定恢复能力。

img

添加图片注释,不超过 140 字(可选)

它独特地集成了原生沙盒化执行、生命周期控制、模型无关(model-agnostic)的多LLM路由以及内置的安全分析。

这使得OpenHandsSoftwareAgentSDK能够为原型设计、解锁新型自定义应用以及大规模可靠部署智能体提供一个实用的基础。团队还对OpenHands V1的设计原则进行了详细阐述,包括沙盒化可选、默认无状态、严格的相关项分离以及可组合且可安全扩展。

万物皆可扩展

部署层支持 SDK、Tools、Workspace、Agent Server 四大模块自由组合,适配本地、托管、容器化等多元部署场景;能力层提供类型化组件模型,开发者可通过声明式方式扩展功能,无需修改核心代码。

出此之外,还有几个点进行了升级。

  • V1 采用分层接口设计,新手开发者仅凭数行代码即可搭建基础智能体,快速验证想法;同时支持自定义工具开发、内存管理优化等高级需求。
  • 具备本地 - 远程执行无缝迁移能力,内置 REST/WebSocket 服务,可直接对接 VS Code、VNC 桌面、浏览器等多种交互终端,覆盖可视化工作区、命令行、API 调用等全场景使用需求。
  • 内置智能体操作安全分析器,支持暂停 / 恢复、子智能体委托、历史恢复等全生命周期控制;嵌入单元测试、LLM 集成测试等 QA 插桩机制。
  • 创新实现模型无关的多 LLM 路由机制,兼容超 100 家供应商的主流模型,包括 GPT-5 Mini、Claude Sonnet 4.5、Qwen3 Coder 等。

效果

官方进行了再软件工程权威基准 SWE-Bench Verified 中进行了测试实验,结果OpenHands V1 联合 Claude Sonnet 4.5 并启用扩展思维机制,达成 72% 的任务解决率。

img

添加图片注释,不超过 140 字(可选)

还进行了再GAIA 基准中,达到了 67.9% 的准确率。

并且开源的 Qwen3 Coder 480B 在该框架下也实现 41.21% 的优异成绩。

img

添加图片注释,不超过 140 字(可选)

可以看出该次升级的飞跃。

并且,被刺升级,OpenHands还是维持原来的及其宽松的使用协议。

基于 MIT 许可完全开源,提供 GitHub 开源版与 SaaS 在线服务双选项,支持本地部署、托管运行、容器化执行等多样化部署方案。目前项目已汇聚全球 150 + 贡献者,构建起包含 CLI 命令行工具、GUI 可视化界面的完整生态,所有应用均基于统一 SDK 开发,形成从开发、测试到部署的全链路支撑体系。