数据说话,不吹不黑。
背景
最近 GPT-5 发布了,很多人问我:该用 GPT-5 还是 DeepSeek?
我做了详细测试,结论可能会让你惊讶。
定价对比(官方数据)
| 模型 | 输入价格 | 输出价格 | 每万 tokens 成本 |
|---|---|---|---|
| GPT-5.4 | $2.50 | $15.00 | ¥1.40-1.75 |
| GPT-5 mini | $0.25 | $2.00 | ¥0.18 |
| DeepSeek-V3 | ¥0.27 | ¥1.08 | ¥0.014 |
| Claude Opus | $5.00 | $25.00 | ¥1.75-2.10 |
| Claude Sonnet | $3.00 | $15.00 | ¥0.99-1.26 |
最大差价:DeepSeek vs Claude Opus = 150 倍
测试方法
我用同样的 10 个任务,分别测试 5 个模型:
- 代码生成(3 题)
- 文章写作(3 题)
- 逻辑推理(2 题)
- 创意设计(2 题)
每题满分 10 分,总分 100 分。
结果
| 模型 | 代码 | 写作 | 推理 | 创意 | 总分 | 成本/百万 tokens |
|---|---|---|---|---|---|---|
| GPT-5.4 | 28 | 27 | 19 | 17 | 91 | $17.50 |
| Claude Opus | 27 | 28 | 18 | 18 | 91 | $30.00 |
| DeepSeek-V3 | 26 | 26 | 17 | 16 | 85 | ¥1.35 |
| Claude Sonnet | 25 | 26 | 17 | 16 | 84 | $18.00 |
| GPT-5 mini | 22 | 23 | 15 | 14 | 74 | $2.25 |
关键发现
1. GPT-5.4 和 Claude Opus 打平
两个最贵模型得分都是 91 分,但 GPT-5.4 便宜一半。
2. DeepSeek 是性价比之王
得分 85 分(差距仅 6 分),但价格便宜 20 倍。
3. GPT-5 mini 适合简单任务
如果你的任务不需要复杂推理,mini 够用。
实战建议
| 场景 | 推荐模型 | 原因 |
|---|---|---|
| 简单对话/改写 | GPT-5 mini | 最便宜 |
| 日常任务 | DeepSeek-V3 | 性价比最高 |
| 复杂推理 | GPT-5.4 | 效果最好 |
| 代码生成 | Claude Opus | 上下文长 |
在 OpenClaw 中配置
{
"providers": {
"deepseek": {
"apiKey": "sk-xxx",
"baseURL": "https://api.deepseek.com/v1"
}
},
"defaultProvider": "deepseek"
}
总结
如果你是个人用户,DeepSeek 是最佳选择:
- 效果差距小(6 分)
- 价格便宜 20 倍
- 国内访问快
如果你是企业用户,可以组合使用:
- 日常任务用 DeepSeek
- 复杂任务用 GPT-5.4
怎么选,看你预算。
如果你需要帮助配置 OpenClaw,联系我:Telegram @ClawMartCN