无问芯穹大模型服务平台正式上线 DeepSeek-R1-0528 推理加速版,新用户注册即可免费使用,也可通过 deepseek-r1 免费调用API,为您的任务提供高性能支持。本次升级带来以下变化:
-
自动升级:现有用户无需任何操作,系统已默认通过 deepseek-r1 模型名称自动升级至0528版本。
-
旧版支持:如需继续使用原开源版本,请将模型名称切换至 deepseek-r1-0120 调用。原0120版本将保留至6月14日。
本次发布的DeepSeek-R1-0528版本,以去年12月发布的DeepSeek V3 Base为基座,在后训练过程中增加算力投入,显著提升了模型的思维深度与推理能力,该模型参数达685B(其中 14B 为 MTP 层)。此外,官方数据显示,新模型幻觉率降低了45~50%左右,能够提供更为准确、可靠的结果,同时在前端代码生成、角色扮演等领域的能力均有更新和提升。
cloud.infini-ai.com/genstudio/m…
无问芯穹推理加速版DeepSeek-R1-0528表现
1. 代码能力测试
使用 HTML/CSS/JavaScript 开发的一个现代简约风格的单词卡片应用
单次卡片应用网页展示
- 创意写作测试
端午节到了,以弘扬中国文化为主题,写一篇叙事文章
API调用示例
此次更新,新版本DeepSeek-R1按模型名称「deepseek-r1」进行调用,旧版本按模型名称「deepseek-r1-0120」进行调用。
import requests
url = "https://cloud.infini-ai.com/maas/v1/chat/completions"
payload = { "model": "deepseek-r1", "messages": [ { "role": "user", "content": "你是谁" } ]}headers = { "Content-Type": "application/json", "Authorization": "Bearer $API_KEY"}
response = requests.post(url, json=payload, headers=headers)
print(response.json())
无问芯穹大模型服务平台提供大模型推理加速高性能API,资源充足,保障AI应用服务的稳定性。支持文本、图像、视频等多种模态,包括最新开源Qwen2.5 VL等系列多模态模型,DeepSeek(R1/V3)/Qwen3等系列LLM模型,以及Jina/bge等sota嵌入、重排模型等。