deepseek究竟处于一个什么水平?

232 阅读6分钟

DeepSeek 的水平放大肯定是被放大了,但想一想在国内大厂纷纷放弃做那个0到1的AI创新,都转向做AI应用。这么个大环境下DeepSeek一个无国际名校背景才100来号人的小公司能坚守初心,生产出媲美好几千号人并且大多数都是哈佛、麻省等国际名校班底、还有马斯克等大佬的GPT,同时还比较彻底的开源,还是值得吹捧一下的。

如果说国内的媒体有点放大,对deepseek的评价不真实的话,其实国外的一些网站数据也是可以看出deepseek的确很不错。

  • 如国外Aider发布的AI编程能力的排行榜

deepseek-r1在编码能力方面已经和gpt-o1比肩

  • 国外visualcapitalist网站发布的统计数据

中国公司DeepSeek的网站访问量在其推理模型于1月份开源发布后增长了2,026%

我们可以具体看看deepseek的一些能力:

在网上有不少网友整理了很多问题来测试大模型能力

如果感兴趣的可以试试,比如这个推理保险箱密码的问题,大多数模型都算不出来。由于deepseek连续提问就会报服务器繁忙,所以使用腾讯元宝的DeepSeek-R1来测试,第5次得到正确的答案,当然在这个问题上和国外的AI还是一有定差距。

但在中国处理及各方面已经表现的非常的好了。

编码能力

DeepSeek 在多种编程语言和各种基准测试的开源代码模型中实现了最先进的性能。

下面这个是来自Aider的一个排行榜

可以看到DeepSeek的编码能力非常的强,相信不少程序员已经在使用它。

数学能力

在竞赛级 MATH 基准测试中取得了 51.7%,接近 Gemini-Ultra 和 GPT-4 的性能水平。

综合能力

DeepSeek的发布一直以来都在媲美openai与claude

特点是在中文处理的能力

到2025年初就有人提出DeepSeek是国运级成果。就是冯骥在自己的微博上发文,建议大家都可以去使用DeepSeek,他也说了DeepSeek的很多优点。

正如大佬所说,让AI工具尽快融入我们日常工作和生活,赶快用起DeepSeek。

然后就是DeepSeek登顶全球苹果免费下载排行榜榜首。在国内很多人使用或者说是知道DeepSeek是在DeepSeek r1发布后并登顶后被大多数人知道了。

再来看看deepseek的企业与团队:

深度求索 vs OpenAI

DeepSeek是一家2023年成立的企业,2023年7月的注册资金是100万人民币,2023年8月是1000万人民币,而头部企业无不是几十亿的注册资本。

openai公司注册资本60多个亿美元,最新的消息它融资后可达到上千亿美元,这是DeepSeek的10来万倍。当然有消息说DeepSeek了在融资。另外openai更是背靠着星际之门计划,远在2016年黄仁勋就将全球首台装备了8块英伟达P100芯片的超级计算机DGX-1送到了OpenAI。它在2018年就已经发布了GPT-1的版本。

DeepSeek团队 vs GPT团队

DeepSeek团队大概100多人,其中80%为研发人员其余的为市场和运营人员,平均年龄28岁,成员85%以上拥有硕士学位,40%以上有博士学位,大多毕业于清、北等国内院校都没有国外名校背景。

而开发出ChatGPT的OpenAI公司近2000人的大公司,还有像马斯克、奥特曼这些重量级大佬人物。团队成绝大多数拥有名校学历,且具有全球知名企业工作经历,如谷歌、微软、Facebook等等,并且成员大多数毕业于全球著名高校如斯坦福大学、加州大学、麻省理工、剑桥、哈佛等。

DeepSeek技术创新

据说DeepSeek梁文峰在公司尽量让员工保留自己的个性,如果员工有什么想法会调动公司资源支撑他。或许这也是他们保持创造力的初心所在。

在技术上DeepSeek使用了混合专家模型(MoE) ,这使得AI使用的训练成本大大的降低了。原本需要调动所有的专家网络,而DeepSeek只需要调动部分专家子网络。

另一个比较大的技术创新点就是绕过了英伟达的CUDA生态限制,在AI爆发的时代最大的赢家肯定就是英伟达的黄仁勋,而DeepSeek的兴起让英伟达的股票大跌。DeepSeek让国产芯片在AI领域也占有一席之地。

DeepSeek开源

说到开源AI模型,其实DeepSeek并不是第一个,哪么为什么其它开源没DeepSeek火呢?

在国内最早阿里的通义千问、清华的智谱清言等都是开源AI模型,它们为什么没有像DeepSeek这样让很多大厂直使用开源的DeepSeek。主要还是在于DeepSeek的开放度更高,虽然都是开源但开源的程度还是会有所不同的。另外一个原因就是DeepSeek的确是在训练算法上有技术上的创新,节省芯片资源、提高训练效率。

如果你对使用的deepseek并不要求必须是官方的。那么除了深度求索公司官方的chat.deepseek.com还有很多第三方公司提供的DeepSeek服务给我们使用。也就是我们所看到的满血版DeepSeek,如知乎直答DeepSeek、腾讯元宝DeepSeek、百度AI DeepSeek、360纳米DeepSeek

这些满血版DeepSeek和官方的还是有些细微的区别,算是“魔改”的DeepSeek版本。主要还是蒸馏、量化、微调过的DeepSeek版本,当然大致的DeepSeek的能力还是有的,所以大家在官方的DeepSeek不能使用时,可以试试这些DeepSeek。

我之前用逻辑推理问题、几何问题、不等式问题、排列问题分别对比过。目前来说还是知乎直答与腾讯元宝的DeepSeek性能和能力上比较优秀,大家可以试试。