OpenCLI|把全网+桌面App变成命令行,AI Agent的“万能手脚”

11 阅读7分钟

OpenCLI|把全网+桌面App变成命令行,AI Agent的“万能手脚”

作为程序员/效率党,你有没有过这些痛点?

想查B站热榜、知乎热搜,得切换浏览器开N个标签;想操控Notion、豆包桌面端,得鼠标点点点打断终端工作流;想让AI帮你自动爬取数据、操作网页,要么要写复杂爬虫,要么受限于官方API,还容易触发风控……

今天给大家推荐一个开源神器——OpenCLI,一款能把“网页、Electron桌面App、本地工具”全部变成命令行接口的工具,既能提升我们日常开发效率,更是AI Agent的“万能执行手脚”,通俗说就是:万物皆可CLI,AI能直接调用

先放核心信息,方便大家快速get:

✅ 开源地址:github.com/jackwener/O…(15.6k+ Star,Apache-2.0协议)

✅ 核心定位:将网站、浏览器会话、Electron应用、本地工具,转化为标准化、确定性的CLI接口,同时服务于人类和AI Agent。

✅ 核心优势:零API依赖、零LLM运行成本、复用Chrome登录态(安全无风控)、全场景覆盖。

一、先搞懂:OpenCLI到底能帮我们做什么?(通俗版)

不用复杂术语,一句话总结:用终端命令,操控一切你能在电脑上操作的内容

比如:

  • 不用打开浏览器,终端输入 opencli bilibili hot --limit 5,直接看B站前5热榜;
  • 不用点击豆包App,输入 opencli doubao ask "什么是OpenCLI?",终端直接获取回答;
  • 不用切换到Docker桌面端,输入 opencli docker ps,直接查看容器状态;
  • 让AI Agent帮你自动爬取小红书笔记、导出知乎文章,全程不用你写一行爬虫代码。

它就像一个“万能遥控器”,把网页、App、本地工具的功能,全部浓缩成简单的终端命令,不管是我们自己用,还是让AI Agent调用,都高效又稳定。

二、专业解析:OpenCLI的核心能力(开发者视角)

抛开通俗理解,从技术层面看,OpenCLI的核心价值是解决了“AI与数字世界交互”的核心痛点——传统方案要么依赖API(权限有限、接入复杂),要么依赖UI自动化(不稳定、耗Token),而OpenCLI给出了第三条路径。

1. 三大核心能力,覆盖全场景

OpenCLI的核心是“三化”,把零散的操作全部标准化、CLI化,兼顾易用性和扩展性:

  • 网页CLI化:内置100+主流站点适配器(B站、知乎、小红书、Twitter、GitHub等),无需开发,开箱即用。支持动态网页、登录后页面,甚至能自动抓取页面数据、下载图文视频,复用Chrome登录态,不用手动输入账号密码,极大降低风控风险。
  • 桌面App CLI化:通过Chrome DevTools Protocol(CDP),直接操控所有Electron桌面应用,比如Cursor、Notion、ChatGPT、豆包等,实现“终端控制App”,打通Web与桌面应用的壁垒。
  • 本地工具枢纽化:统一管理gh、docker、obsidian等本地CLI工具,支持自动发现、自动安装、透传执行,一个入口就能调用所有本地工具,不用切换终端或记复杂命令。

2. AI Agent专属:零成本、高稳定的执行层

OpenCLI最亮眼的能力,是为AI Agent量身打造的“执行手脚”,解决了传统AI操作网页的两大痛点:

  • 零LLM运行成本:传统AI操作网页,每次都要分析DOM、决策操作,消耗大量Token;而OpenCLI只需一次生成适配规则(Adapter),后续执行完全不消耗Token,跑1万次也不花一分钱。
  • 确定性输出:同一条命令,每次执行的输出格式完全一致(支持JSON、YAML、CSV、Markdown),AI Agent能直接解析、二次处理,不用处理随机的页面变化,稳定性拉满。
  • 自动适配与修复:AI遇到新网站,可通过opencli explore <url> 自动分析页面结构、发现接口,自动生成适配器;若适配器失效,opencli autofix能自动修复,不用人工干预。

简单说:OpenCLI让AI Agent从“只会思考”变成“会动手”,不用懂页面结构、不用写爬虫,只需调用终端命令,就能完成网页操作、App控制、本地工具调用。

3. 安全与便捷:复用Chrome登录态,零配置上手

很多自动化工具的痛点是“登录复杂、有风控”,而OpenCLI完美解决了这一点:

  • 安全层面:完全复用Chrome/Chromium的登录态,Cookie、账号凭证从不离开浏览器,不存储任何敏感信息,降低账号封禁风险,比传统爬虫安全得多。
  • 便捷层面:零配置上手,安装后只需装一个Chrome扩展,执行 opencli doctor 就能完成自检,不用配置API Key、不用手动管理进程,小白也能快速上手。

三、实操指南:5分钟上手OpenCLI(新手友好)

不用复杂配置,跟着步骤来,5分钟就能用起来,全程复制命令即可:

1. 前置准备

  • Node.js ≥ 21.0.0(必装,执行 node --version 检查版本);
  • Chrome/Chromium浏览器(已登录常用网站,如B站、知乎、豆包)。

2. 安装步骤

# 1. 全局安装OpenCLI
npm install -g @jackwener/opencli

# 2. 安装Chrome扩展(二选一)
# 方式1:Chrome网上应用店搜索「OpenCLI」安装(推荐)
# 方式2:GitHub Releases下载离线包,解压后在chrome://extensions开启开发者模式,加载已解压的扩展

# 3. 自检,确认扩展与浏览器连接正常
opencli doctor

3. 常用命令(直接复制使用)

# 查看所有支持的命令(100+站点+工具)
opencli list

# 1. 网页操作示例
opencli bilibili hot --limit 5  # 查看B站前5热榜
opencli zhihu hot -f json       # 知乎热榜,JSON格式输出(可管道给jq处理)
opencli xiaohongshu search "前端面试"  # 小红书搜索

# 2. 豆包/AI应用操作示例
opencli doubao ask "写一个Python批量重命名脚本"  # 调用豆包提问
opencli claude ask "解释RESTful API"           # 调用Claude提问

# 3. 本地工具调用示例
opencli docker ps               # 查看Docker容器
opencli gh pr list --limit 5    # 查看GitHub PR

# 4. 下载功能示例
opencli bilibili download BV1xxx --output ./bilibili  # 下载B站视频(需装yt-dlp)
opencli zhihu download <文章链接> --output ./zhihu    # 导出知乎文章为Markdown

4. AI Agent调用(进阶)

# 安装AI Agent所需技能(适配Claude Code、Cursor等)
npx skills add jackwener/opencli --skill opencli-adapter-author

# 之后让AI Agent执行任务即可,示例提示词:
# "用OpenCLI调用豆包,写一个批量下载B站视频的脚本,输出JSON格式结果"

四、适用人群与场景

不管你是前端、后端、AI开发者,还是效率党,都能用到OpenCLI:

  • 程序员:终端控福音,不用切换浏览器/App,用命令行完成日常操作,提升开发效率;可编写脚本,实现自动化部署、数据采集。
  • AI开发者:为AI Agent提供稳定的执行层,快速实现“AI思考+操作”闭环,比如自动爬取数据、批量处理内容、操控桌面应用。
  • 效率党/运营者:批量下载图文视频、汇总多平台热榜、自动发布内容,不用手动重复操作,节省时间。
  • 运维/数据从业者:将网页数据采集、本地工具操作串联成工作流,实现无人值守的监控、数据同步。

五、总结:为什么值得推荐?

在AI Agent飞速发展的今天,OpenCLI的核心价值的是“打通AI与数字世界的交互壁垒”——它不只是一个效率工具,更是AI Agent的“基础设施”。

对比传统方案,它的优势很明显:

  • 比爬虫简单:不用写代码,开箱即用100+站点适配器;
  • 比API灵活:无API限制,有网页就能用,覆盖未开放API的平台;
  • 比UI自动化稳定:确定性输出,零Token消耗,不易触发风控;
  • 比单一工具全面:网页、App、本地工具全覆盖,一个入口搞定所有。

如果你经常用终端、想提升效率,或者在做AI Agent相关开发,一定要试试OpenCLI——它能让你和你的AI Agent,拥有“操控全网”的能力。

💡 小贴士:如果遇到扩展连接问题,执行 opencli doctor 自检;若命令无响应,更新OpenCLI到最新版即可(npm update -g @jackwener/opencli)。