OpenAI Operator 的开源替代方案:Nanobrowser

34 阅读1分钟

Nanobrowser:OpenAI Operator 的开源替代方案

1.gif

Nanobrowser[1] 是一款开源的 AI 网页自动化工具,官方号称是 OpenAI Operator 的开源替代品。

采用浏览器扩展方式,可以使用自己的 LLM(大语言模型)API。基于多智能体架构,包括 Planner(规划者)、Navigator(导航者)和 Validator(验证者)。

这些智能体协同工作,能够理解并执行复杂的网页任务。例如,Planner 负责制定策略,Navigator 执行网页导航和操作,Validator 则验证任务是否成功完成。

目前该项目还在积极开发中,有兴趣的佬可以看看。

OpenAI 推出 Responses API 和 Agents SDK

OpenAI 推出了 Responses API 和 Agents SDK[2],这两项新技术旨在提升开发者的工作效率和应用的智能化水平。

Responses API 结合了现有 Chat Completions API 的简洁性和 Assistants API 的工具调用能力,主要提供了三个内置工具:Web Search(网络搜索)、File Search(文件搜索)和 Computer Use(计算机使用)。需要注意的是,这些工具都是付费服务。

Agents SDK 是基于去年的实验项目 Swarm[3] 开发的智能体框架,它兼容任何符合 Chat Completions 标准的模型。目前,Agents SDK 仅支持 Python,但 Node.js 版本即将推出。

哦对了,原来的 Assistants API 将于 2026 年弃用,所以有用的佬早点迁移吧。