#每日快讯# 阿里巴巴推出更高效的Qwen3-Next人工智能模型:
阿里巴巴旗下通义千问发布了下一代基础模型架构Qwen3-Next,并开源了基于该架构的Qwen3-Next-80B-A3B系列模型。该结构相比Qwen3的MoE模型结构,进行了以下核心改进:混合注意力机制、高稀疏度MoE结构、一系列训练稳定友好的优化,以及提升推理效率的多token预测机制。基于Qwen3-Next的模型结构,阿里训练了Qwen3-Next-80B-A3B-Base模型,该模型拥有800亿参数仅激活30亿参数。该Base模型实现了与Qwen3-32B dense模型相近甚至略好的性能,而它的训练成本仅为Qwen3-32B的十分之一不到,在32k以上的上下文下的推理吞吐则是Qwen3-32B的十倍以上,实现了极致的训练和推理性价比。

英伟达发布新芯片系统,助力AI视频与软件生成:
英伟达表示计划推出一款旨在处理视频生成和软件开发等复杂任务的新产品,眼下该公司的芯片和系统正处于人工智能计算热潮的核心。英伟达称,这款名为Rubin CPX的产品将于2026年底上市。它将采取卡片形式,可嵌入现有的服务器电脑设计中,或用于能够在数据中心与其他硬件并行运行的独立计算机。

甲骨文即将推出全新云基础设施服务:
甲骨文公司计划在下个月的甲骨文人工智能世界大会上发布一项名为“甲骨文人工智能数据库”的全新云基础设施服务。这项服务旨在为人工智能应用提供强大的支持,是甲骨文在云基础设施领域的最新投入。

预计2030年全球AI资本支出将达8000亿美元:
美银全球研究部中国研究部联席主管、亚太区基础材料及能源主管赵彦琳在研讨会中表示,人工智能资本支出将带动上游资源、电力、冷却、智能制造等领域发展。并预计中国今年人工智能资本开支将达7000亿元人民币。而至2030年,全球人工智能资本支出将达8000亿美元。

微软签署高达194亿美元协议,向Nebius购买云计算能力
人工智能基础设施公司Nebius与微软签署了一项商业协议。根据协议,Nebius将在5年内为向微软提供其在新泽西州文兰德数据中心的专用GPU基础设施容量。GPU服务将在2025年和2026年分多批次部署。在满足部署和GPU服务可用性的前提下,截至2031年,合同总价值约为174亿美元。
展开
评论