笑死!DeepSeek-R1数学考97分,说话却像中二病晚期...

456 阅读3分钟

最近的 AI 圈,真是比《甄嬛传》还刺激!

OpenAI 前不久刚发布 o3 模型,秀完肌肉,国内反手就甩出一张「王炸」——DeepSeek-R1,直接把全网 AI 博主炸到集体失眠!

“中国版 o1 开源了!性能对标 OpenA I,代码干翻人类!”

“这才是真正的 OpenAI 啊!”

一觉醒来,朋友圈被这条消息刷爆。

图片

好家伙,这可不是什么小打小闹——DeepSeek-R1 在数学题上拳打 GPT-4o,代码能力碾压 96%程序员,甚至自己琢磨出了“啊哈”解题时刻,活脱脱一个 AI 界的“AlphaGo 重生记”!

更狠的是,这玩意儿没靠人工微调,全靠强化学习“自学成才”。

先给还没摸过 R1 的朋友简单科普一下:

DeepSeek-R1 是国产 AI 大厂 DeepSeek 推出的全新推理模型,性能直接对标 OpenAI 的 o1,甚至在数学题和代码任务上还略胜一筹。

  • • 数学题:AIME 2024 测试中,R1 拿了 79.8%的分数,比 o1 还高。
  • • 写代码:Codeforces 竞赛里,R1 的 Elo 评分高达 2029,干翻了 96%的人类程序员。
  • • 推理能力:它甚至自己琢磨出了“啊哈”解题时刻,完全靠强化学习“自学成才”,连研究人员都惊了。

图片

更离谱的是,这玩意儿完全开源

英伟达大佬都忍不住调侃:“开源?我们玩真的,代码和曲线直接甩脸上!

使用方法很简单,首先打开 DeepSeek-R1 的官网:

然后选上「深度思考」模式,然后直接对话即可。

图片

虽然 DeepSeek-R1 的能力确实强,但我实际用起来总有一种“被 AI 教育”的感觉。

比如,我让它帮我优化晨间流程,结果它给我整出一堆“神经调节分层处理”“数字隔断”“弹性缓冲带”之类的术语。

图片

我:???

“大哥,我只是想早起不赖床,不是要搞科研啊!”

更离谱的是,它还会自创一些听起来很高级但完全没听过的概念,比如“虾行防守睡姿”“脑波重置术”。

“这 AI 怕不是个民科大师吧?”

经过几天的摸索,我终于找到了一个简单的解决方案,分享给大家:

第一步:先别开“深度思考”模式

R1 默认的“深度思考”模式确实容易放飞自我,动不动就拽出一堆专业术语。

所以,先用普通模式(DeepSeek-V3)跟它聊几轮,让它“学会”用正常语言交流。

图片

图片

第二步:再切回“深度思考”模式

等上下文里有了正常对话的基础,再切换到 R1 的“深度思考”模式。 这时候,R1 就会收敛很多,既能发挥它的推理能力,又不会满嘴跑火车

图片

第三步:直接告诉它“说人话”

如果 R1 还是忍不住装 X,那就直接在提示词里加一句:  “请用朴实直白的语言,不要过度发挥或创造新名词,避免使用过于专业的术语或自创概念。”

图片

DeepSeek-R1 的出现,让我们看到了 AI 从“工具”到“伙伴”的进化。

它不再只是被动响应指令,而是能主动思考、规划,甚至提出创新方案。

但与此同时,我们也需要学会如何与 AI 更好地协作

R1 的“装 X 病”背后,其实是 AI 在尝试用更高维度的方式理解人类需求。

而我们能做的,就是通过提示词、上下文引导,让 AI 的输出更贴近我们的实际需求。

未来,AI 或许会成为我们生活中不可或缺的“智能伙伴”,但前提是——它得学会说人话。

 

以上,我写完了,记得 点赞、在看、转发, 因为我需要你的反馈。