deepx-code(github.com/itmisx/deepx-code),这是一个 Go 写的、单二进制、在终端里跑的 AI 编程 Agent。
做它的起因很简单——我自己用各家 Coding Agent 时,有几个别扭一直没被很好地解决:简单活也烧贵模型、让 AI 自动跑命令心里发虚、过程像黑箱。这些是我在设计 deepx 时最想啃下来的几块。分享几个我自己比较满意的取舍。
一、让它自己判断”这活值不值得用贵模型”
deepx 是双模型:便宜快的 flash + 强的 pro。但用哪个不是固定的——我做了一个纯本地、零 token 的关键词路由,每轮判断这活是简单还是复杂:简单走 flash,复杂才升 pro。判断本身不花钱(不会再调一次模型去问”这难不难”)。
对用 DeepSeek / 小米 MiMo 的人,这是实打实省钱。觉得不够保守?/model flash 一锁全程便宜模型,而且我把这个选择做成了按对话各自持久化、重启也保持,免得你一不留神又把 pro 烧上。
二、让 AI 跑命令,但把它关进 OS 级沙箱
这是我最在意的一块。deepx 的沙箱不是黑名单拦关键词的假隔离,而是用操作系统机制真隔离:
- macOS:Seatbelt(sandbox-exec)
- Linux:bubblewrap
效果:命令在隔离环境跑,写操作锁死在 workspace 内、host 其余只读,进程也隔离;读和网络不限(go mod/npm 照常)。要更彻底还能切 docker 整个跑容器。
我自己”放手让 Agent 自动干活”的底气,很大一部分来自这层。
三、把”方法论”做成可切换的工作模式
这个是我比较得意的设计。内置三种工作模式,对应三套做事方法论:
- karpathy:务实工匠,想清楚再写、最小改动;
- openspec:规格驱动,先写/改 spec 对齐再实现;
- superpowers:全流程严谨,brainstorm→计划→TDD→子 agent→review→收尾。
/working-mode 弹窗一切,之后每轮自动把对应方法论注入,而且三种互斥(选一个就禁掉另两个的 skill,不让方法论打架)。搭原型用 karpathy、做正经模块切 superpowers,差别很明显。
四、终端 Agent,我给它配了手机/平板遥控
deepx 自带一个本地 Web 面板,把终端里正在跑的会话实时双向镜像到浏览器:网页里能新建/切会话、切权限/沙箱/工作模式、审批工具调用,状态跟终端完全同步。
配一行 web_host: 0.0.0.0 就能让同一局域网的手机/平板访问——躺着用 iPad 盯 Agent、顺手点”批准”,体验挺好。安全上我做得很克制:默认只绑本机,要对外必须你显式开,还会弹安全警告,不会偷偷暴露你的会话。
五、查符号用代码图谱,不靠 grep
为了让 AI 更准地理解代码,我内置了 CodeGraph:Go 走 go/types 精确解析,其它语言走 tree-sitter,查定义/调用/实现关系不会被注释和字符串里的同名词带偏,改了文件还能自动重建索引。
六、直接兼容 Claude Code 的 skills 生态
如果你已经在 Claude Code / opencode 攒了 skill,deepx 直接复用(从 /.claude/skills/、/.agents/skills/ 等目录发现),不用重搭;MCP 也支持。
七、截图直接粘进去,Agent 能看懂(哪怕模型不带视觉)
调试时最常见的场景:报错弹窗、一段日志截图、一张 UI 设计图——以前要么手敲、要么没法用。deepx 里直接 Ctrl+V 把截图粘进对话框就行,我在底层按”当前模型支不支持视觉”自动分流:
- 视觉模型:图片直接内联喂给模型,它自己看;
- 非视觉模型(比如 DeepSeek 这类纯文本):自动调 OCR 把图里的文字/内容识别出来再喂进去。
关键是这个切换是自动的,你不用关心手上的模型带不带眼睛——粘进去就能用。对国内大量用 DeepSeek 的人,这点很实在:就算模型没有视觉能力,截个报错图、贴张接口文档图,照样能让 Agent 读懂、接着干活。中途从视觉切到非视觉,它也会自己把图改成 OCR 路径,不会因为带着图片被接口拒掉。
一些”细节控”的东西
- 前缀缓存友好:提示词组装做了缓存优化(摘要垫尾、按消息打模式标签),多轮对话能实打实命中缓存、少花钱;
- 审核模式:review(写操作要确认)/ auto / plan(只读)一键切;
- 两套规划:连贯任务用顺序待办清单,真正可并行的才拆并发子 agent;
- 非交互:deepx exec "分析下这段报错",能进脚本/CI/管道;
- 跨平台:macOS / Linux / Windows / WSL2;DeepSeek、小米 MiMo 开箱即用,1M 上下文。
上手
deepx # 首次启动弹配置向导,选供应商填 Key 即可
仓库:github.com/itmisx/deepx-code,开源。
最后说句实在的:它还远谈不上完美,很多地方在持续打磨(最近也在跟着 issue 一个个修)。但上面这几个点——省 token 的双模型路由 + OS 级沙箱 + 可切换方法论 + 手机遥控 + 截图即用(OCR 兜底)——是我自己每天在用、也觉得对国内开发者真有用的设计。欢迎来试、来提 issue、来拍砖,有想法的也欢迎一起共建。就一个二进制,试错成本极低。