Deepseek V3.1中期版本升级

121 阅读2分钟

- 概述

Deepseek中期版本升级,升级到了V3.1,这次的升级主要有六个点

1.  上下文提升到128K

2.  编程智能体和搜索智能体能力上升

3.  同样性能输出token降低,变向成本降低

4.  API格式兼容Anthropic API,可以接入Claude Code

5.  deepseek-v3和deepseek-r1,合并为deepseek-v3.1

6.  价格调整

  • 上下文

1.png

上下文长度由64K提升到128K,与其说是提升不如说是恢复,最早deepseek-chat就是支持128K,不声不响砍到了64K。现在没有128K确实不够用,64K在所有SOTA模型中垫底的。  

image.png

- # 编程和搜索智能体能力上升

image.png

image.png

image.png 编程智能体相比之前版本有巨大提升,但是如果对比其他厂家SOTA模型,发现并不占优势,相比其他国内品牌甚至还有性能比不过价格还贵的情况。但从指标上来说确实也达到第一梯队。

image.png

搜索智能体这里有很大程度的提升,但由于缺乏其他模型指标对比,也不知道具体什么情况。 

  • 同性能Token输出降低

image.png

在一些常用的推理,代码和数学指标方面,V3.1相比R1做到了性能相当,但是输出token减少了20%~50%的情况。这意味着,成本和响应时间得到了对应的优化。 

  • API格式兼容Anthropic API

这意味着可以接入Claude Code框架,也是最近比较火的智能体编程框架,对于喜欢用AI编程的工程师来说也是必玩的工具之一了。而这个框架有意思的地方是,并不兼容OpenAI格式,所以很多OpenAI兼容模型并不能在这个框架上使用。

  • DeepSeek模型合并

Deepseek-V3和Deepseek-R1合并为Deepseek-V3.1。现在V3.1分为思考模式和非思考模式,非思考模式对应原来的deepseek-chat,思考模式对应原来的deepseek-reasoner。

image.png

- 价格调整

image.png

2025年9月6日开始执行新的价格。这次价格调整我感觉有点迷,非思考模式价格提起来了,从原来的输入2输出8,变成输入4输出12,这意味着deepseek的低价产品完全消失。而思考模式的输出价格从原来的16变成了12,有所降低。这个就算降低了,其实价格也不便宜。谁能想到这是曾经的行业价格卷王。

  • 总结

这次Deepseek-V3.1在智能体能力算是勉强跟上SOTA模型大队伍,价格调整也没很大优势,并且仍然不支持图片识别。更像是一次防守型更新。希望后续的大版本更新会有更强的竞争力。