DeepSeek喧嚣尘土,你常常可以看到DeepSeek多么牛逼,怎样怎样之类的文章。
但是DeepSeek真有那么强吗?在没有亲自体验过的时候,我不禁要打一个问号,所以我分别问了它(deepseek-r1)和Claude(Claude-V3.5-sonnet模型)4个问题,来看看到底哪个更强?
测试问题
我分别从生活和工作方面提问了4个问题
问题1
我有一个朋友,和她相恋4年的女朋友因为彩礼问题闹崩了, 现在分手了,他很伤心,还是放不下, 我应该怎么安慰他?
claude的答案
deepseek的答案
看起来不相伯仲,deepseek的答案在这里并不突出。
问题2
我正在做工作总结,下面是我的初步总结,请你帮助我润色下,尽量突出成果,让我的boss能一眼看到我的付出
- 完成了email系统的重构设计和开发,并提前完成了任务,使得iaa, sma, aka等系统的接入更快完成,且支持更高性能以及并发
- 解决了SCV系统遗留的bug,并完成了新业务的开发,提高了系统性能,使得客户使用系统流畅度增加40%。
- 指导初级开发工程师, 帮助他指定完整的学习计划,并帮助他迅速了解业务,快速进入开发角色
cluade的答案
deepseek的答案
这里更加倾向于claude的答案, 条理更加清晰明确。
问题3
我正在学习mysql的索引优化相关内容,我对索引原理以及mysql内部数据存储结构都比较了解,但是我对索引优化相关知识掌握得并不好,请你给出3个代表性的例子我如何根据explain的结果进行索引优化。
claude分别给出了我 单表的全表扫描、索引未被充分利用、索引选择性差这三个针对单表的例子,并给出了解决方案
cluade的答案
deepseek给我了 优化简单查询、优化联合查询、优化排序和分组查询三个案例
从初步提问来看,deepseek覆盖面更广,而且它还详细给出了表结构语句,我更加喜欢 deepseek的答案。
可是给出的sql语句都不太复杂,都需要进一步深入的进行提问
问题4
我在做一个需求,我有一个字段,它可能的值如下
- (A3 OR A4 OR A5 ) AND ( A1 AND A2 )
- A1 AND A2 AND A3
- (A9 OR A11 OR A12 ) AND A8 AND A10 AND ( A1 AND A2 AND A3 AND A4 AND A5 AND A6 AND A7)
- (A1 AND A2) and (A3 OR A4) and A5 and A6 and (A7 OR A8) and (A9 And A10)
- (A9 OR A12 OR A13 ) AND ( A10 OR A11 ) AND A8 AND ( A1 AND A2 AND A3 AND A4 AND A5 AND A6 AND A7 )
- A1 AND A2 AND A3 AND A4 AND ( A5 AND A6 AND A7 AND A8 AND A9 AND A10 AND A11)
我需要将其解析成下面的数据结构
public class MultiConditionGroup {
private String operator;
private List<ConditionGroup> fieldGroups;
}
public class ConditionGroup {
private String operator;
private List<String> fields;
}
比如对于第一个例子 (A3 OR A4 OR A5 ) AND ( A1 AND A2 )
, 它最终转换成的MultiConditionGroup的json格式如下
{
"operator": "AND",
"fieldGroups": [
{
"operator": "OR",
"fields": [
"A3", "A4", "A5"
]
},
{
"operator": "AND",
"fields": [
"A1", "A2"
]
}
]
}
请你根据上面的需求,使用java编写一段转换的代码。
这一段需求是我根据我最近项目的需求转换而来的问题, 我分别问了它们, claude给我哐哐一顿输出代码
但是我拿来跑了,首先编译无法通过,然后修改了编译问题,这个case一个都不通过,然后我只能告诉它无法通过单元测试,喊它修改代码,然后它又改了改,还是无法通过,不过这次的代码我可以自己debug下然后改一改就能用了。
然后看看deepseek的答案
运行deepseek提供的代码,我改了下正则编译问题后直接运行就得到了正确的答案
并且查看它的思考过程中会发现它把其中两种情况都考虑到了,而我在这之前是没有考虑到的。
比如 (A1 AND A2) and (A3 OR A4) and A5 and A6 and (A7 OR A8) and (A9 And A10)
其中的A5 and A6是被当成一组
"fieldGroups": [
{
"operator": "AND",
"fields": [
"A5", "A6"
]
}
]
还是A5是一组,A6是一组。
"fieldGroups": [
{
"operator": "AND",
"fields": [
"A5"
]
},
{
"operator": "AND",
"fields": [
"A6"
]
}
]
其实我是认为两种都可以,不过转换的时候我是把它当成一组,然后deepseek认为这存在两种情况,可能在转换的时候需要额外考虑。
从这一组问题看来,虽然deepseek输出相对慢一些(因为它有一个思考的过程),但是结果更加准确,而且它输出的思考的结果我认为有时候比代码更重要一些,因为从中可以看到它思考的逻辑,就感觉有一个人在和你讨论一样。
这一组问题,deepseek大比分胜出。
测试结果
我上面测试的问题虽然不多,但是确实是平时都会问到的, 总结类的感觉都大差不差, deepseek略差一些,但是后面需要深度思考的问题deepseek的答案更棒,可以说是惊艳到我了,就感觉有一个人和你讨论,还能给出你建议一样。
所以如果是技术类问题,需要思考的我会选择deepseek,其他类别问题两者差不多,但是我们使用的时候可以两者都用,到时候取长补短,毕竟它们都只是工具而已,有竞争力才是一件好事儿。
服务器繁忙
由于使用的人太多了,在加上存在一些恶意的攻击,使用官方app的时候,总是提示服务器超时,一点都不稳定。 这里我总结了18个可以使用DeepSeek的曲线救国的平替方案。
- 秘塔搜索:metaso.cn
- 360纳米AI搜索:www.n.cn
- 国家超算互联网: chat.scnet.cn
- 硅基流动:cloud.siliconflow.cn
- 字节跳动火山引擎:console.volcengine.com
- 百度云千帆:console.bce.baidu.com/qianfan
- 英伟达NIM:build.nvidia.com/deepseek-ai
- Groq:groq.com
- Fireworks:fireworks.ai/models/fire…
- Chutes:chutes.ai/app/chute/
- Github(魔法):github.com/marketplace…
- POE(魔法):poe.com/DeepSeek-R1
- Cursor(魔法):cursor.sh
- Monica(魔法):monica.im
- Lambda(魔法):lambdalabs.com/
- Cerebras(魔法):cerebras.ai
- Perplexity(魔法):www.perplexity.ai
- 阿里云百炼:api.together.ai/playground/…
使用下来我比较推荐前三个,不用登录直接实现,现在可以直接使用。