标题:
作者: 阑梦清川
封面:
摘要:
封面裁剪:
原文地址:
打开评论: true
仅粉丝可评论:
大家好,我是阑梦清川
DeepseekV3.1官宣了,新版本的DK有什么变化呢,我最近也是刷了很多的文章,给大家梳理一下,让你快速的理解新变化;
1.支持混合推理
其实混合推理说的就是这个支持思考模式和非思考的模式:如下所示,一个需要进行内部的推理,一个可以直接告诉大家结果;
之前的时候,都是要么使用思考模式干到底,要么使用非思考模式干到底,所以这个效果并不是非常的明显;
现在的这个混合推理,可以在两个模式之间进行切换,根据不同的场景和条件选择不同的模式,节省资源,性价比高,而且效果显著;
2.无缝对接cc框架
官方直接支持了Anthropic公司提供的API的格式。也就是说,你可以直接把这个对接到类似于claude code这类框架里面去,对于cc开发者而言其实还是非常方便的;
3.分词器和对话模版的修改
分词器就是针对于我们的输入进行拆分,不同的Tokenizer(分词器)会决定我们的输入被如何拆分,以及消耗token的数量;
分词器的大改意味着 模型底层的“读写语言方式”有了很大升级,可能会带来 更低的 token 消耗 和 更准确的文本处理。
对话模版:在和模型对话时,输入的内容并不是原封不动送进去,而是会套一个“模板”来标记角色和格式。
例如我们看到的对话是下面的这个样子的:
[#5001]
User: 你好 Assistant: 你好,有什么可以帮你?
实际上大模型内部的这个样子的:
[#5001]
[{"role": "system", "content": "你是一个友好的助手"},{"role": "user", "content": "你好"},{"role": "assistant", "content": "你好,有什么可以帮你?"}]
因此,我们可以发现这个对话模版的修改就可以统一标准,进行不同格式的兼容,多角色之间对话也可以确保这个准确性,以及这个内容的结构化的输出;
4.API的升级
deepseek-chat对应上面提到的非思考模式,
deepseek-reasoner对应思考模式;
上下文的数量都支持128K,提升问答的效果;
函数调用支strict模式,这样可以保证我们的模型调用的参数严格符合这个预定义的格式和结构,例如下面的这个例子;
没有升级之前,可能是这个样子的:
[#5001]
{ "city": "北京", "date": "明天" // <-- 本来要求标准日期格式,AI却写成了自然语言 }
这个生成的日期格式可能并不是我们想要的或者是我们要求的;
升级之后,可能是下面的这个样子的:
[#5001]
{ "name": "get_weather", "parameters": { "type": "object", "properties": { "city": {"type": "string"}, "date": {"type": "string", "format": "date"} }, "required": ["city", "date"] } }
这个就是要求的格式,大模型必须严格的按照这个格式进行输出,不像之前那样随意,这个相当于就是对于我们的参数的格式提出了更加严格的要求,毕竟这个strict就是严格的意思嘛
5.API的涨价
这个就是等量的tokens现在需要的金额是之前的1.5-2倍,但是目前还没有落实到底,所以目前的价格还是不变的;
6.审美能力提升
很多大佬针对于这个V3.1的审美进行测试,觉得效果还不错,大家可以去尝试一下,或许真的会有想不到的结果;
以上就是一些梳理,可以见得,我们的国产大模型,哪个曾经在春节期间热度爆棚的deepseek,还是在悄悄进步的,可能不是那么显著罢了;
我创建了一个免费的AI交流社群,不定期分享一些内容,如果你也感兴趣,欢迎加入
我是阑梦清川,希望得到您的关注
<section class="mp_profile_iframe_wrp" nodeleaf=""><mp-common-profile class="js_uneditable custom_select_card mp_profile_iframe mp_common_widget js_wx_tap_highlight" data-pluginname="mpprofile" data-nickname="阑梦清川" data-alias="vx17813100105" data-from="0" data-headimg="http://mmbiz.qpic.cn/sz_mmbiz_png/7ibTuicIwZU7icUWibpvKcMgKeibKk3tkyLjco05PWQa1HqLCicGRtpEBib4BTGagjYJWZJ2uYEFafXjVNsIfHZqayibyg/300?wx_fmt=png&wxfrom=19" data-signature="嗨,很高兴认识你,也很开心和你分享我的学习心得和体会。" data-id="MzkwOTY0MjA4Ng==" data-is_biz_ban="0" data-service_type="1" data-verify_status="1" data-origin_num="99" data-isban="0" data-biz_account_status="0" data-index="0"></mp-common-profile></section>