2025年2月19日AI日报
- 英伟达发布了一款名为 Magic1-For-1的视频生成模型,能够在一分钟之内, 生成长达一分钟的完整视频内容.
项目网址:magic-141.github.io/Magic-141/- 昆仑万维开源首个面向AI短剧创作的视频生成模型SkyReels-V1。
项目网址:github.com/SkyworkAI/S…- 阶跃(Step Audio)最近开源了一款1300亿参数的实时对话、情感克隆语音模型。
项目网址:github.com/stepfun-ai/…- 阶跃星辰开源Step-Video-T2V 300亿参数视频生成模型。
项目网址:github.com/stepfun-ai/…- Kimi发布了新模型 kimi-latest,该模型具有 128k 的上下文长度,支持图片理解及自动上下文缓存,适用于多种应用场景。
马斯克xAI发布Grok 3 性能超越gpt4o
AI届的翘楚-OpenAI最近越来越难了,2024年末DeepSeek的横空出世,使得开源模型在性能和成本上实现对闭源模型的赶超。如今马斯克也来搞事情了,在前段时间传出想要收购OpenAI的讯息后,于北京时间2025年2月18日12点发布**「Grok 3」**模型,马斯克将Grok 3标榜为“地球上最聪明的人工智能”。
概述
Grok 3 是由 Elon Musk 的 「xAI」 公司开发的最新一代人工智能模型,旨在与 OpenAI 的 ChatGPT、Google 的 Gemini 以及中国的 DeepSeek 等竞争。目前发布两款模型。「Grok 3」 标准版和 「Grok 3 mini」。
产品
-
Grok 3
-
「参数量」:据称Grok-3的参数量达到了1.8万亿(1.8 trillion),使用了混合专家(MoE, Mixture of Experts)架构。这一参数量远超其前代模型,显示出其在计算能力上的显著提升。
-
「上下文长度」:Grok-3的上下文长度并没有在公开资料中明确提及,但根据其性能表现和基准测试,可以推测其支持较长的上下文长度,适用于复杂的推理任务。
-
「架构」:
- 「MoE架构」:Grok-3采用了256个专家模型动态路由的MoE架构。这种设计允许模型根据输入的具体任务选择最合适的专家来处理,从而提高了效率和准确性。
- 「动态激活参数」:在处理任务时,模型会动态激活部分参数,而不是全部参数,从而可以在高参数量的基础上保持计算效率。
-
-
Grok-3 mini
-
「参数量」:Grok-3 mini的具体参数量在现有资料中没有明确数据,但可以推测其参数量相对Grok-3较少,可能是为了在资源受限的环境下仍能提供高效的推理能力。
-
「上下文长度」:同理,Grok-3 mini的上下文长度也未明确公布,但预计其上下文处理能力会相对Grok-3有所调整,以匹配其参数规模和应用场景。
-
「架构」:
- 「MoE架构」:虽然是mini版本,但仍采用了MoE架构,可能是使用少量的专家模型,以保持模型的灵活性和高效推理能力。
- 「推理增强」:Grok-3 mini设计上强调了推理能力的增强,可能是通过精简参数和优化专家模型的选择来实现。
-
计算能力和训练:
- 「计算能力」:Grok 3 在训练时使用了超过 200,000 个 Nvidia H100 GPUs,计算能力是 Grok 2 的10倍甚至更多。这使得其处理能力和学习速度显著提升。
- 「训练过程」:据报告,Grok 3 的训练过程花费了214天完成,这包括了从数据中心建设到模型训练的全部过程。
性能和特点:
- 「推理能力」:Grok 3 被描述为具有“非常强大的推理能力”,在数学、科学和编程等领域的基准测试中超越了包括 OpenAI 的 GPT-4o、Google 的 Gemini、DeepSeek 的 V3 和 Anthropic 的 Claude 在内的多个竞争对手。
- 「多模态能力」:它不仅能处理文本,还具备图像理解能力,增强了其应用范围。
- 「DeepSearch」:这是一项新的功能,类似于一个基于 AI 的搜索引擎,它可以浏览网络和 X(前 Twitter)的内容,生成详细的回答。
- 「Big Brain 模式」:利用额外的计算资源来解决特别复杂的问题,尤其是数学、科学和编程方面的查询。
可用性:
- 「订阅服务」:Grok 3 首先向 X 的 Premium+ 用户开放,同时 xAI 推出了一个名为 SuperGrok 的新订阅计划,提供更多高级功能,包括更多 DeepSearch 查询和无限的图像生成,普通用户目前只能继续使用其Grok2模型。
- 「应用和 API」:除了在 X 上的使用,Grok 3 还可以通过 xAI 的独立应用和企业 API 访问。
其他信息:
- 「未来发展」:xAI 计划继续更新 Grok 3,并在不久的将来增加语音模式和其他高级功能。
- 「开源计划」:xAI 计划在推出Grok 4模型后,将Grok 3模型进行开源。