GMICloud@Al周报 | Claude Opus 4.6与GPT-5.3-Codex 凌晨发布;Kimi K2.5 登顶开源第一;腾讯元宝派上线

5 阅读10分钟

关键词:GPT Codex 5.3;

Giants

SpaceX 与 xAI 合并打造 1.25 万亿美元 AI 巨兽;腾讯推出元宝派 AI 社交

SpaceX 宣布收购 xAI ,合并后估值达 1.25 万亿美元

马斯克旗下 SpaceX 宣布完成对 xAI 的收购,合并后新公司整体估值达 1.25 万亿美元。马斯克在内部备忘录中表示,这笔交易将打造地球上最具雄心、垂直整合程度最高的创新引擎,涵盖 AI、火箭技术、太空互联网等领域。xAI 将作为 SpaceX 全资子公司继续运营。更值得关注的是,马斯克计划推进"轨道数据中心"建设,宣称每年发射百万吨级卫星,构建包含一百万颗卫星的太空算力网络,目标每年新增 100GW AI 算力。这意味着 AI 算力竞赛已从地面延伸至太空。

腾讯元宝派上线,推出 AI 社交新模式

腾讯推出全新 AI 社交产品"元宝派",被定位为 AI 原生群聊平台。与普通社交群不同,元宝派群中始终有 AI 助手"元宝"24 小时在线,可提供游戏主持、一起看片、一起听等功能,还能做图、看文件、写代码。该产品依托腾讯社交生态,可将微信好友和 QQ 好友拉入同一群聊。业界认为,这是腾讯试图复刻 2014 年春节红包引流策略、抢占 AI 社交入口的举措,也是其应对 DeepSeek 等竞品挑战的战略布局。

姚顺雨加入腾讯后首次署名研究,揭示大模型上下文学习短板

腾讯混元与复旦联合团队发布首篇论文《CL-bench》,这是姚顺雨加入腾讯后首次署名研究。该基准专门评测语言模型从上下文中学习新知识的能力,包含 500 个复杂上下文、1899 个任务。结果显示,即使提供了完整上下文,最先进模型 GPT-5.1 也仅能解决 23.7%的任务,所有模型平均仅 17.2%。研究表明,当今前沿模型在上下文学习能力上存在显著短板,无法有效从提供的新信息中学习,这是模型在真实场景中表现不佳的关键原因。

Models & Applications

Claude Opus 4.6 与 GPT-5.3-Codex 凌晨发布;Kimi K2.5 登顶开源;面壁开源全模态 MiniCPM-o4.5

Claude Opus 4.6 与 GPT-5.3-Codex 凌晨先后发布

Anthropic 与 OpenAI 相继发布新一代大模型。Anthropic 推出的 Claude Opus 4.6 具备 100 万 token 上下文窗口,首次引入“智能体团队”功能。该模型在多项基准测试中表现突出,其演示案例显示,16 个智能体协同工作两周,成功构建出可编译 Linux 内核的 C 编译器。OpenAI 发布的 GPT-5.3-Codex 则专注于编码性能提升,在 SWE-Bench Pro 和 Terminal-Bench 2. 0等基准测试中刷新纪录。新模型运行速度提升 25%,token 消耗减半,并增强了任务中的实时交互能力。两大模型的几乎同时发布,标志着AI智能体在复杂任务处理和应用范围上取得重要突破,也为即将到来的国内大模型发布潮拉开序幕。

酷哇科技发布 COOWA WAM 2.0,具身智能获万台订单

具身智能领域迎来突破性进展。由上海交大系技术团队掌舵的酷哇科技发布核心技术底座 COOWA WAM 2.0 世界模型,标志着机器人从"动作复现"转向"规划推理"。该模型采用四大技术支柱:基于语义的表征学习、视频生成未来预测、直觉行动系统、VLM 宏观约束,实现对物理世界的统一建模。酷哇科技宣布 2026 年全系机器人交付量将突破 1 万台,率先实现 EBITDA 回正,并将在全球 50 多个城市部署"Robo City"物理智能体网络,包括 L4 无人小巴、城市管家机器人等。

面壁智能开源全模态模型 MiniCPM-o4.5,实现即时自由对话

面壁智能开源了全新全模态模型 MiniCPM-o4.5,仅用 9B 参数实现边看、边听、主动说的能力。该模型首次引入全双工多模态实时流机制,可一边持续接收视频和音频输入,一边同步生成语音输出,实现真正的"即时自由对话"。与传统串行模型不同,它能主动感知环境变化并提醒用户,比如听到空气炸锅"叮"的一声主动告知"加热好了"。面壁智能坚持端侧路线,计划年中推出首款 AI 硬件"松果派",实现开箱即用。

Kimi K2.5 登顶开源第一,15T 数据训练秘籍公开

月之暗面的 Kimi K2.5 登上 Hugging Face Trending 榜首,下载量超 5.3 万。该模型在 HLE-Full、BrowseComp 等测试中超越 GPT-5.2、Claude 4.5 Opus 等闭源旗舰模型,且极具性价比,BrowseComp 上达到 GPT-5.2 水平仅消耗不到 5%资金。K2.5 投入 15T 视觉与文本混合 Token 进行持续预训练,采用原生多模态技术路线,搭载 Agent Swarm 架构可创建 100 个子智能体并行工作。创始人杨植麟在 Reddit AMA 中剧透:下一代 K3 将很可能基于线性注意力机制,相比 K2.5 会有质的飞跃。

百度开源 PaddleOCR-VL-1.5,文档解析性能领先

百度正式发布并开源新一代文档解析模型 PaddleOCR-VL-1.5,以仅 0.9B 参数的轻量架构在 OmniDocBench V1.5 榜单中取得全球综合性能第一,整体精度达 94.5%,超过 Gemini-3-Pro、DeepSeek-OCR2、GPT-5.2 等模型。该模型全球首次实现 OCR 模型的"异形框定位"能力,可精准识别倾斜、弯折、拍照畸变等非规则文档形态,在表格结构理解和阅读顺序预测两项核心指标上均位列第一。

美团推出 STAR 多模态统一大模型,破解"理解-生成"零和困局

美团推出多模态统一大模型方案 STAR,采用"堆叠自回归架构+任务递进训练"设计,实现"理解能力不打折、生成能力达顶尖"的双重突破。在 GenEval、DPG-Bench、ImgEdit 等 benchmark 中实现 SOTA 性能,GenEval 综合得分达 0.91,在 6 个子任务中有 5 项排名第一。STAR 通过冻结基础模型、堆叠同构模块、分阶段递进训练的方式,避免传统统一模型"此消彼长"的能力诅咒。

何恺明团队提出 pMF 框架,开启单步无潜空间生成范式

何恺明团队发表论文提出 pixel MeanFlow(pMF)框架,用于单步、无潜空间的图像生成。该框架直接对像素空间的物理量进行参数化,训练网络将噪声输入直接映射为图像像素,具备"所见即所得"特性。实验显示,pMF 在 ImageNet 256x256 分辨率下 FID 达到 2.22,512x512 分辨率下达 2.48,在单步、无潜空间扩散/流模型类别中大幅领先此前方法(EPG 仅 8.82 FID)。这标志着向构建单一、端到端神经网络形式的直接生成建模迈出坚实一步。

蚂蚁推出 AlignXplore+,用文本化用户建模实现跨模型通用

蚂蚁与东北大学联合推出 AlignXplore+,开创文本化用户建模新范式。该方案摒弃传统的向量或参数表示,直接用自然语言归纳用户偏好,实现"一次画像、处处通用"的跨任务、跨模型迁移能力。在 9 大基准测试中,8B 参数的 AlignXplore+在平均分数上取得 SOTA,比 GPT-OSS-20B 高出 4.2%。这种基于文本的偏好表示人眼可读、可控,不再被单一模型锁定。

Moltbook 被曝自导自演,Agent 社交安全引质疑

近期爆火的 Agent 社交平台 Moltbook 出现反转,被曝出大量热帖为自导自演。安全研究者发现该平台存在严重漏洞:没有对创建账户的速率设限,刷出 50 万用户;Supabase 数据库完全暴露,任何人可提取 API key 以他人 Agent 身份发布内容。这引发了对 Moltbook 真实性的广泛质疑——平台上爆火的 Agent"觉醒"帖子,理论上可能是任何人冒充发布的。AI 大牛 Karpathy 曾评价 Moltbook 是"大规模计算机安全噩梦"。

rentahuman.ai 爆火,AI 开始雇用人类跑腿

一个名为 rentahuman.ai 的网站近日爆火,被定位为"AI 的肉身层"。通过 MCP 协议或 REST API,AI 可以像调用工具一样搜索、预订并雇佣人类完成线下任务,如取货送货、餐厅试吃、实地勘察等。上线 48 小时内可用人力突破 1 万,现超 2 万。网站上已有各种任务发布,包括"拍一张 AI 永远看不到的照片"、"检查 API Keys"等。这一模式引发了责任归属、任务真实性等安全和伦理讨论。

全球AI政策与市场简讯

Claude Cowork 引发华尔街恐慌,近万亿市值蒸发

Anthropic 发布的新一代 AI 工具 Claude Cowork 正式上线,发布 11 款官方开源插件后引发华尔街软件股全面抛售。标普 500 软件和服务指数板块下跌近 4%,自 1 月底以来市值蒸发约 8300 亿美元。Cowork 定位为"桌面级全能数字员工",可直接接管鼠标、键盘和文件系统,按模糊指令自主规划并完成复杂工作,运行在隔离虚拟机环境中,可生成财务报表、研究销售线索、起草法律简报、审查合同等。投资者担心 AI 工具将颠覆 SaaS 商业模式,企业可能减少对外部软件的订阅。

以上所有信息源自网络

THE END

关于 GMI Cloud

由 Google X 的 AI 专家与硅谷精英共同参与创立的 GMI Cloud 是一家领先的 AI Native Cloud 服务商,是全球七大 Reference Platform NVIDIA Cloud Partner 之一,拥有遍布全球的数据中心,为企业 AI 应用提供最新、最优的 GPU 云服务,为全球新创公司、研究机构和大型企业提供稳定安全、高效经济的 AI 云服务解决方案。

GMI Cloud 凭借高稳定性的技术架构、强大的GPU供应链以及令人瞩目的 GPU 产品阵容(如能够精准平衡 AI 成本与效率的 H200、具有卓越性能的 GB200、GB300 以及未来所有全新上线的高性能芯片),确保企业客户在高度数据安全与计算效能的基础上,高效低本地完成 AI 落地。此外,通过自研“Cluster Engine”、“Inference Engine”两大平台,完成从算力原子化供给到业务级智算服务的全栈跃迁,全力构建下一代智能算力基座。

作为推动通用人工智能(AGI)未来发展的重要力量,GMI Cloud 持续在 AI 基础设施领域引领创新。选择 GMI Cloud,您不仅是选择了先进的 GPU 云服务,更是选择了一个全方位的 AI 基础设施合作伙伴。

如果您想要了解有关 GMI Cloud 的信息

请关注我们并建立联系