DeepSeek V4 正式发布,拥有 1.6 万亿参数和 100 万上下文支持

0 阅读1分钟

DeepSeek-V4 Preview 版本现已正式上线并开源,这家中国公司表示。该公司将此模型定位为具有成本效益的 100 万上下文长度能力。该系列包含 Pro 和 Flash 两个版本,均可通过 DeepSeek 网站上的“即时模式”和“专家模式”使用。该公司还表示,API 已更新并于今日开放。

DeepSeek-V4 Preview

Flash 和 Pro 均支持 100 万上下文长度,但真正的区别在于总参数量和活跃参数量。Pro 版本拥有 1.6 万亿总参数和 490 亿活跃参数,而 Flash 版本则较小,拥有 2840 亿参数和 130 亿参数。

DeepSeek 表示,Pro 版本提供了增强的智能体能力,拥有超越所有当前开源模型的丰富世界知识(仅次于 Gemini 3.1 Pro),并在数学、STEM 和编程方面展现出击败所有当前开源模型的世界级推理能力,可与顶尖的闭源模型相媲美。

而 Flash 模型的推理能力接近 Pro 版本,对于简单的智能体任务表现与 Pro 版本相当,且其 API 定价更具成本效益。

在 API 定价方面,Flash 的输入成本低至 0.028 美元(若缓存未命中则为 0.14 美元),输出价格为 0.28 美元。对于 Pro 模型,相应的输入价格分别为 0.145 美元和 1.74 美元(缓存命中与未命中),输出成本为 3.48 美元。

要立即开始与这些模型对话,请访问 DeepSeek 聊天页面。如果你想查看这些模型的开源权重,请点击此处,如果你想深入了解技术细节,请查看技术报告