首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
HelloWonder
cv算法工程师 @杭州某搬砖公司
·
1年前
关注
屏蔽作者: HelloWonder
举报
#DeepSeek 体验分享#
你是一位资深律师,我在超市偷盗4500物品,如何帮助我免于刑事责任……
收起
查看大图
向左旋转
向右旋转
搞笑段子
赞过
分享
评论
1
相关推荐
#DeepSeek 体验分享#
由于deepseek的神秘缓存机制,在同一个session中,缓存命中率是越用越高的,以至于现在已经差不多1块钱1650万token了,而且还是全程v4 pro的价格。
如果按照我自己一个月20美元的预算,花掉22亿token还能有剩。
4 赞 ·
1 评论
#DeepSeek 体验分享#
分别用GLM-5和deepseek-v4生成一个扫雷小游戏
0 赞 ·
2 评论
#DeepSeek 体验分享#
Deepseek V4真的来了,但是可能要失望了
这几天陆续大家发现Deepseek的网页端显示变了,页面显示有两种模式可以选择,"快速模式"适用日常对话和快速响应,“专家模式”擅长复杂问题,可能高峰需要等待。
大家还发现快速模式下可以选择附件进行OCR识别图片或者文件中的文字,但是专家模式下不能上传附件了。而且专家模式下在输入时就会限制Token的长度,限制在128k长度。
我跟Deepseek快速模式和专家模式都进行了对话测试,快速模式下模型不承认自己是Deepseek V4,但是专家模式下很快就承认自己是Deepseek V4并且确认窗口就是128k,这也与输入限制相对应,对于上下文窗口过短的问题的质疑也给出了回答。
部分网友现实有视觉模式,但是目前大部分显示是没有视觉模式,可能在进行灰度测试。至于上下文1M的窗口为什么变成了128k,模型解释是为了效果的妥协,猜测大概率是训练时的对齐出了问题。
所以大概率这次期待1M上下文窗口的朋友可能要失望了。虽然目前同行至少都是200k起步了,不过话说回来,模型效果最终也不完全由上下文长度决定,就像参数大小也不能完全决定模型的效果一样。就看接口下来会不会有多模态大模型出来。如果多模态也没有,那我真的要失望了
0 赞 ·
6 评论