- 概述
Deepseek中期版本升级,升级到了V3.1,这次的升级主要有六个点
1. 上下文提升到128K
2. 编程智能体和搜索智能体能力上升
3. 同样性能输出token降低,变向成本降低
4. API格式兼容Anthropic API,可以接入Claude Code
5. deepseek-v3和deepseek-r1,合并为deepseek-v3.1
6. 价格调整
-
上下文
上下文长度由64K提升到128K,与其说是提升不如说是恢复,最早deepseek-chat就是支持128K,不声不响砍到了64K。现在没有128K确实不够用,64K在所有SOTA模型中垫底的。
编程智能体相比之前版本有巨大提升,但是如果对比其他厂家SOTA模型,发现并不占优势,相比其他国内品牌甚至还有性能比不过价格还贵的情况。但从指标上来说确实也达到第一梯队。
搜索智能体这里有很大程度的提升,但由于缺乏其他模型指标对比,也不知道具体什么情况。
-
同性能Token输出降低
在一些常用的推理,代码和数学指标方面,V3.1相比R1做到了性能相当,但是输出token减少了20%~50%的情况。这意味着,成本和响应时间得到了对应的优化。
-
API格式兼容Anthropic API
这意味着可以接入Claude Code框架,也是最近比较火的智能体编程框架,对于喜欢用AI编程的工程师来说也是必玩的工具之一了。而这个框架有意思的地方是,并不兼容OpenAI格式,所以很多OpenAI兼容模型并不能在这个框架上使用。
-
DeepSeek模型合并
Deepseek-V3和Deepseek-R1合并为Deepseek-V3.1。现在V3.1分为思考模式和非思考模式,非思考模式对应原来的deepseek-chat,思考模式对应原来的deepseek-reasoner。
- 价格调整
2025年9月6日开始执行新的价格。这次价格调整我感觉有点迷,非思考模式价格提起来了,从原来的输入2输出8,变成输入4输出12,这意味着deepseek的低价产品完全消失。而思考模式的输出价格从原来的16变成了12,有所降低。这个就算降低了,其实价格也不便宜。谁能想到这是曾经的行业价格卷王。
-
总结
这次Deepseek-V3.1在智能体能力算是勉强跟上SOTA模型大队伍,价格调整也没很大优势,并且仍然不支持图片识别。更像是一次防守型更新。希望后续的大版本更新会有更强的竞争力。