大家好,我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也是一名 AIGC 爱好者,持续分享前沿的「AI工具」和「AI 副业玩法」,期待和大家一起交流~
国产大模型杀疯了!当所有人还在讨论“算力霸权”时,一家中国公司用实力宣告:
堆显卡、拼硬件的时代,结束了!
最近,各大热搜榜几乎被 DeepSeek 屠榜,连央视也接连报道 DeepSeek。
《黑神话》创始人更是感叹道:“DeepSeek 可能是个国运级别的科技成功! ”
DeepSeek,一个被西方称为「神秘东方力量」的国产大模型,在 2025 年年初,来了一个炸裂的开端。
- DeepSeek 在苹果 App Store 中国区和美区免费榜登顶,美区甚至超过了 ChatGPT 的下载量。
- 马斯克、扎克伯格等硅谷顶级大佬公开称赞 DeepSeek,并连夜注册账号研究。
- 英伟达暴跌,DeepSeek 在技术上的创新突破,直接干掉了美股 1.2 万亿的市值。
- ...
而搞出这款国产大模型的,并非互联网大厂,而是一家来自杭州的名为深度求索的「非典型」团队——其母公司是国内顶级量化私募幻方量化。
一、DeepSeek 有何亮点
DeepSeek 这款国产大模型,有哪些值得关注的亮点和突破,让硅谷科技公司集体沉默?
1、以极低的训练成本,达到了和 OpenAI o1 不相上下的能力
DeepSeek 的出现,让一个靠堆叠显卡竞赛的时代结束了!
DeepSeek V3 的训练成本为 2000 张显卡 + 不到 600 美刀,远远低于同性能的大模型。
被网友称是「AI 界的拼多多」。
红衣大叔周鸿祎用的一个比喻我觉得非常形象:
DeepSeek 用小米加步枪,打出了核弹级的效果!
以前普遍认为,AI 大模型训练需要拼高端芯片 + 算力,而 DeepSeek 改变了人们的这一认知。
并不是说芯片不重要了,依然很重要,但创新和算法,也同样重要。
或许人们对高端芯片的需求,可以重新评估了。以前被显卡卡脖子的中小型公司,或许也可以搞起来了。
2、目前唯一一个可以联网的推理大模型
ps:OpenAI 的 o1 目前是不能联网的。
3、开源
DeepSeek 遵循 MIT License,完全开源,不限制商用。
任何人都可以下载部署、通过蒸馏技术训练自己的模型。
在 DeepSeek 官网上,我看到了一句话:
“以开源精神和长期主义追求普惠 AGI”, 是 DeepSeek 一直以来的坚定信念。
而 DeepSeek 也正是这么践行的。因为真正的技术,不需要封锁!
4、对 C 端用户完全免费使用
DeepSeek-R1 性能对标 OpenAI o1 正式版,OpenAI o1 正式版每月 200 美刀,而 DeepSeek 完全免费。
二、DeepSeek 入门级使用教程
DeepSeek 在电脑和手机端都可以「免费」使用。
手机端:
手机应用商店搜「DeepSeek」下载。
电脑端:
浏览器中输入 DeepSeek 网址就可以使用:www.deepseek.com/
DeepSeek 用户界面非常简洁,使用也非常简单。
下面以电脑端操作来简单说明一下。
打开 DeepSeek 后,点「开始对话」:
就能看到下面这个界面:
1、输入需求描述
就是用大白话描述清楚「背景」以及「你想让 DeepSeek 帮你做什么」。
和之前其他大模型不同的是,DeepSeek 对提示词的要求大大降低了。
之前和大模型对话,要把提示词的各个要素描述清楚,或者使用结构化的提示词。
而现在,你可以抛掉之前的那些规则。
把 DeepSeek 当做某个领域的专家,甚至是你某个牛掰的朋友,只需要把问题描述清楚,尽管问他就好了。
2、深度思考(R1)
使用 DeepSeek-R1 模型,解决推理问题。
可以用来做数学、代码、自然语言推理等任务。
性能和 OpenAI o1 正式版不相上下。
3、联网搜索
联网来获取最新数据。
DeepSeek 的训练数据,截止至 2024 年 7 月。也就是说,2024 年 7 月之后发生的事情,DeepSeek 是不知道的。(非联网状态下)
比如问 DeepSeek:“2025年蛇年春晚,最受欢迎的语言类节目是哪个?”
因为训练数据还没到 2025 年,所以 DeepSeek 回答说“2025 年的春晚还没有举办”。但今天已经是大年初三了。
这时开启「联网搜索」,它就能获取到最新的数据了。
ps:联网搜索模式下,不支持上传文件。
4、文件、图片上传
支持上传多个文件和图片。(最多 50 个,每个不超过 100 MB)
比如在 DeepSeek 官网上的这张图标:
很多人看到这些数据,可能一脸懵。那么就可以直接让 DeepSeek 来帮忙解读:
然后 DeepSeek 在短暂思考后,就开始解读了。
它会把每一个字段的含义解释得明明白白,就算是门外汉也能听得懂,最后 DeepSeek 还会给出归纳总结。
上面是以图片来举例,当然你也可以上传文档,让它帮忙解读和归纳整理。
ps:目前 DeepSeek 仅支持识别文件和图片中的文字。
DeepSeek 其他功能和设置:
左侧的侧边栏,可以显示对话记录、开启新对话。
在「个人信息」里,还可以设置语言、主题、删除所有对话记录。
三、DeepSeek 能做什么
最后来说说 DeepSeek 能做什么?
- 辅导作业:比如将数学题拍照上传后,DeepSeek 不仅会给出答案,在深度思考(DeepSeek-R1)模式下,还会给出自己的思考过程。
- 编程开发
- 文档翻译、整理、提炼
- 写作
- 推理
- ...
更多的应用场景,后面再慢慢介绍吧。
总之,生活、学习、工作中,你有任何问题,都可以来问 DeepSeek。
多问几次,你就会发现他的强大。也能理解,为什么 DeepSeek 一发布,便引起了全球轰动。
然而 DeepSeek 轰动世界的那一刻,也是争议和挑战的开端。
由于最近 DeepSeek 遭受了大规模、持续的恶意攻击,导致 DeepSeek 的服务器很不稳定。
有可能会出现注册不了的情况。在和 AI 对话时,也可能会出现类似下面这样「服务器繁忙」的情况。
相信后面都会解决的。也相信 DeepSeek 可以扛住所有打击。
四、结束语
从量化私募的隐秘实验室到登顶全球应用商店,从「小米加步枪」的草根逆袭到撼动万亿市值的黑天鹅事件。
DeepSeek 用开源代码撕开了科技霸权的铁幕——这不是一场简单的技术竞赛,而是一场重新定义游戏规则的革命。
真正的颠覆,从来不是算力的对轰,而是靠创新重新定义规则的勇气。
国产 AI 正在崛起,已是不争的事实!
推荐阅读: