Doubao-Seed-2.0 放进 OpenClaw 用了一周,说说我的真实感受
字节把 Doubao-Seed-2.0 悄悄发出来了,公告里说对标 GPT-5.2 和 Gemini 3 Pro,还有专门的编程版 Seed-2.0-Code。
我第一反应不是去跑 benchmark,而是直接配进 OpenClaw 试了一周。benchmark 是 benchmark,日常开发里好不好用才算数。
顺便对比了 GPT-5.4-mini 和 Claude Sonnet 4.6。
为什么选这三个对比
不选旗舰对旗舰,原因很实际。
Doubao-Seed-2.0-Code 是字节主推的编程模型,国内直连,理论上延迟低。GPT-5.4-mini 是 OpenAI 的性价比款,很多人日常主力。Claude Sonnet 4.6 是 OpenClaw 官方默认推荐,Anthropic 的中档机。
旗舰当然好用,但价格也是真的贵。日常随手问问、改改小功能,大多数人用不着每次都上旗舰。
第一印象:速度
配进去之后,第一个感受就是响应速度。
Doubao-Seed-2.0-Code 国内直连这个优势是真实的。我这边(上海)首字节出来的时间明显比 GPT-5.4-mini 快,Claude Sonnet 4.6 有时候也会卡一下。
不是说 GPT 和 Claude 慢,只是 Doubao 在国内网络环境下赢了一截。
编程能力
我拿了几个场景测了一下。
第一个:给一个乱的 Python 脚本加错误处理。三个模型都能搞定,区别在细节——GPT-5.4-mini 会顺手帮你重构,有点超纲但不一定是坏事;Claude Sonnet 4.6 最保守,基本只动你让它动的地方;Doubao-Seed-2.0-Code 介于两者之间,加了 try-except,也顺手把变量命名改得更规范。
第二个:帮我写一个 OpenClaw skill 的 YAML 骨架。这个稍微刁一点,OpenClaw skill 格式比较特定,不是通用知识。Claude Sonnet 4.6 表现最好,几乎零错误,格式完全正确。GPT-5.4-mini 有细节出入,Doubao 输出基本正确但有两处注释位置不对,需要手动改一下。
第三个:解释一段 TypeScript 异步代码为什么有 race condition。三个模型都说清楚了。Claude Sonnet 4.6 的解释最清晰,Doubao 够用但绕了一点,GPT-5.4-mini 给了个挺好的类比,比较容易懂。
Doubao-Seed-2.0-Code 的编程能力跟 GPT-5.4-mini 基本同档,但没到 Claude Sonnet 4.6 的水平。特别是 OpenClaw 生态相关的任务,Claude 的优势比较明显——毕竟 OpenClaw 本身就是 Anthropic 体系下的东西,模型对自家格式和工具更熟。
中文表达
如果用 OpenClaw 处理中文需求比较多——写文案、整理文档、处理中文日志——Doubao 的中文输出读起来更自然。GPT-5.4-mini 的中文有时候有点机翻感,Claude Sonnet 4.6 中文质量也不错,但 Doubao 在「像人说话」这件事上确实有优势。
这一点对我来说挺重要。我平时用 OpenClaw 处理飞书消息和中文日报比较多,Doubao 生成的内容基本不用改就能发出去。
价格
通过 ofox.ai 接入这三个模型时,我对比了一下实际花费。
Doubao-Seed-2.0-Code 的 token 单价比 GPT-5.4-mini 便宜不少,Claude Sonnet 4.6 居中。如果工作流是大量中文内容处理加中等复杂度的代码任务,Doubao 是性价比最高的选项。但如果 skill 或者工作流深度依赖 OpenClaw 的特性,Claude 系列的准确率优势值得多付那点价格。
我现在的配置
现在我的 OpenClaw 里同时配了三个模型,默认中文内容用 Doubao-Seed-2.0-Code,快、便宜、中文好;复杂 skill 开发切 Claude Sonnet 4.6;需要英文受众或者创意类任务换 GPT-5.4-mini。
通过 ofox.ai 接入的好处是不用管各家的 API key 和计费,用统一的 OpenAI 兼容接口,在 OpenClaw 的 api_base 里填一个地址就全搞定了,切换模型就改个模型名。
最后
Doubao-Seed-2.0-Code 值得试,特别是国内网络加中文内容多的场景。不是说它超过了 Claude,而是在很多「够用就行」的任务上,速度加价格的组合很有竞争力。
用了一周之后,它已经是我日常中文任务的默认选项了。复杂的还是换 Claude。
两个都配上,不用二选一。