DeepSeek-R1 震撼升级!最强开源模型0528版直逼OpenAI o3,代码能力飙升

183 阅读3分钟

今天凌晨,中国AI公司DeepSeek在HuggingFace平台悄然开源了新版DeepSeek-R1-0528推理模型,引发全球开发者社区轰动。此次虽被官方称为“小版本试升级”,但实测性能提升巨大,尤其在编程和复杂推理领域表现直逼OpenAI顶级闭源模型o3,被网友誉为“开源的又一次胜利”。


🔥 一、性能飞跃:代码能力比肩顶级闭源模型

新版R1最惊艳的提升在于编程实力。在编程能力基准测试平台LiveCodeBench中,其得分已接近OpenAI的o3-high版本,甚至超越Claude 4 Sonnet与Gemini 2.5 Flash。开发者实测显示,R1可快速生成结构完整、逻辑严谨的代码文件,并在首次运行即通过测试——这种“一次编写,完美运行”的能力,此前仅有o3等少数顶尖模型能做到。

知名博主@karminski-牙医用物理模拟任务对比测试:无论是小球撞墙的运动轨迹模拟,还是光线漫反射效果渲染,R1的代码质量均优于Claude 4 Sonnet。


🧠 二、深度思考:推理能力跨越式进化

R1-0528展现出超长连续思考能力,单任务处理时长可达30至60分钟,支持用户进行复杂问题拆解和多轮深度探讨。在数学与逻辑测试中表现尤为突出,例如它成为当前唯一能稳定正确回答“9.9 – 9.11等于多少” 的模型,突显其严谨的数值推理能力。

同时,模型在128K上下文窗口内实现了更强的语义理解与信息提取能力,尤其在32K长度内的文本召回准确率显著提升,使其在长文档分析、多轮知识对话中表现更出色。


✨ 三、体验优化:文本自然,幻觉减少

除硬核能力外,新版本在用户体验上也实现优化:

  • 文本生成更自然流畅,格式规范增强
  • 大幅减少“幻觉式回答”(如有用户反馈:“不再满口量子力学了”)
  • 响应延迟降低,处理千行代码文档速度快一倍

🌐 四、免费开放:开源生态再添利器

本次更新模型参数达6850亿,虽需较强算力支持,但DeepSeek仍坚持免费开源策略,权重已在HuggingFace发布(MIT许可证,可商用)。同时,其免费API服务已在OpenRouter上线,为全球开发者提供零门槛接入。


结语:小版本大能量,R2更值期待

一次版本号仅小幅迭代的更新,竟在关键性能上逼近国际顶级模型,DeepSeek的技术实力与工程效率令人惊叹。网友在欢呼“DeepSeek is so back”之余,更喊话团队:“R1尚且如此,R2还等什么?”。中国开源模型,正以扎实的进步重新定义全球AI竞争格局。

DeepSeek-R1-0528 体验地址:
官网:deepseek.com
开源权重:huggingface.co/deepseek-ai…