AI 每日新闻精选 — 2026年6月2日

0 阅读8分钟

1. 英伟达 GTC Taipei 2026:黄仁勋宣告"Agent AI 时代已来",Vera Rubin 全面量产 + RTX Spark 正式进军 PC 芯片市场

事件:6月1日,英伟达 CEO 黄仁勋在台北 GTC 2026 发表主题演讲,面向全球 70 多个国家和地区直播。核心发布包括:(1) Vera Rubin AI 系统宣布全面量产;(2) 自研 CPU Vera 面向 AI 时代设计;(3) 与微软、联发科合作推出 RTX Spark 超级芯片,正式进军 Windows PC 芯片市场,搭载 Blackwell GPU + 20 核 Arm CPU,将于今年秋季由戴尔、联想等厂商推出;(4) Nemotron 3 Ultra 开源模型(100B Dense 参数,MMLU-Pro 89.5、LiveCodeBench 92.4 超越 GPT-4o);(5) Isaac GROOT 人形机器人开发平台;(6) DSX AI 工厂数字仿真平台。黄仁勋明确断言:"Agent AI 已经到来",AI 浪潮正从生成式 AI 转向代理式 AI。

为什么值得关注:这是英伟达从"芯片制造商"向"AI 基础架构架构师"转型的标志性宣言。RTX Spark 进军 PC 芯片市场直接挑战英特尔 x86 垄断地位,意味着 AI 能力将从数据中心下放到个人电脑——Agent 将本地运行。Vera Rubin 全面量产和 Nemotron 3 Ultra 的开源则补齐了"芯片-系统-模型"的垂直整合闭环。黄仁勋提出的"Token 即资产"商业观点也值得关注——Token 正在成为 AI 公司核心营收单位,这对理解 AI 产业的经济模型有重要参考价值。


2. 宇树科技科创板 IPO 成功过会,A 股即将迎来"具身智能第一股"

事件:6月1日,上交所上市审核委员会审议通过宇树科技科创板 IPO 申请,符合发行条件、上市条件和信息披露要求。从 3 月 20 日获受理到过会仅 70 余天。公司计划募资 42.02 亿元,其中约 48%(20.2 亿元)投向智能机器人模型研发("机器人大脑"),其余用于机器人本体研发和智能制造基地建设。宇树科技坚持全栈自研的"本体+小脑+大脑"一体化技术体系。财务表现突出:2025 年营收 17.08 亿元、净利润 2.88 亿元、毛利率 60.27%,是全球少数实现规模化盈利的机器人公司。

为什么值得关注:宇树科技将成为首家以人形机器人整机为主营业务登陆 A 股的公司,其 IPO 过会为整个具身智能行业树立了估值"锚点"。特别值得关注的是募资重心的偏移——近一半资金投向"机器人大脑"而非硬件本体,表明行业估值重心正从"肢体能力"转向"智能能力"。这与大模型+具身智能融合的趋势高度吻合:未来的机器人竞争不仅是运动控制的竞争,更是世界模型和推理能力的竞争。


3. 国产大模型"四小虎"财务数据首次集中曝光:分化格局正式形成

事件:据 36 氪报道,国产大模型头部四家公司核心财务数据首次集中曝光:(1) 智谱:市值超 7000 亿元,但年亏损 47 亿元,同比扩大 59.5%;(2) MiniMax:最早实现自负盈亏,海外收入占比超 70%,毛利率从 12.2% 提升至 25.4%;(3) 月之暗面:K2.5 模型发布后 ARR 迅速突破 2 亿美元,增速最快;(4) 阶跃星辰:获得莲花控股投资。与此同时,百川智能创始人王小川坦言公司曾"陷入迷茫",宣布战略收缩,全面聚焦医疗垂直赛道。

为什么值得关注:这是国产大模型行业进入"洗牌期"的明确信号。四小虎的分化揭示了大模型商业化的三条路径:智谱走"高举高打"路线,靠高估值撑起融资循环;MiniMax 靠海外市场和 ToB SaaS 实现正向现金流,证明大模型可以不靠烧钱存活;月之暗面靠技术差异化(K2.5 长程 Agent 能力)快速拉动 ARR。百川智能的收缩则是通用大模型赛道残酷性的又一例证——当资金和注意力向头部集中,腰部玩家必须找到垂直场景才能存活。


4. 百度提出 DAA 新指标:从"日活用户"到"日活智能体"的战略转向

事件:百度 CEO 在近期 AI 开发者大会上提出新指标 DAA(Daily Active Agents,日活智能体数),标志着 AI 领域的竞争焦点从"模型参数比拼"转向"应用生态繁荣程度"。这一举措呼应了整个行业的趋势——2026 年 Gartner 预测 40% 的企业应用将嵌入任务型 AI 智能体,中国企业级 AI 智能体市场规模已突破 480 亿元。

为什么值得关注:DAA 指标的出现标志着大模型竞争进入"落地为王"的新阶段。如果说 2024-2025 年的竞争主线是"谁的模型更强大",那么 2026 年的主线正在变成"谁的智能体用得更多"。这对国内大模型厂商有直接启示:单纯追求基准测试分数的边际价值正在递减,构建开发者生态和降低 Agent 构建门槛才是长期壁垒。百度选择率先定义这个指标,也反映出其在智能体赛道上的战略野心。


5. 英伟达发布 Nemotron 3 Ultra 开源大模型:千亿参数可在单张消费级 GPU 运行

事件:在 GTC Taipei 2026 上,英伟达发布 Nemotron 3 Ultra 开源大模型。核心参数:1000 亿参数(Dense 架构非 MoE),128 层 Transformer,支持 GQA + SWA 混合注意力机制,8K 上下文窗口。关键能力:在 MMLU-Pro(89.5 vs GPT-4o 的 88.7)、LiveCodeBench(92.4 vs 90.1)上超越 GPT-4o,在 CUDA-Bench GPU 编程测试中大幅领先(87% vs 52%)。更重要的是,该模型支持在消费级 RTX 5090(24GB 显存)上通过 INT4 量化实现实时对话,首 Token 延迟最低 180ms。

为什么值得关注:千亿参数 Dense 模型首次在消费级显卡上实现可用级推理,这意味着端侧 AI 部署从"能不能跑"迈入"能不能用"的质变阶段。对企业而言,Nemotron 3 Ultra 提供了一个完全开源、可商用、支持气隙部署的 GPT-4o 级替代方案,数据主权完全自控。对国内大模型开发者来说,英伟达通过"芯片架构知识反哺模型训练"构建竞争壁垒的策略也值得研究——模型的竞争力不再只取决于数据和算法,还取决于对底层硬件的深度优化。


6. 华为 KADC2026:昇腾 950 芯片 + CANN 全面开源,为 Agentic AI 提供国产算力系统性解法

事件:5月22日-23日,华为举办鲲鹏昇腾开发者大会 2026(KADC2026),针对 Agentic AI 时代给出系统性算力方案。硬件层:昇腾 950 芯片通过互联能力构建超节点,坚持"芯片架构→系统架构→集群架构→软件架构"四层深度协同。软件层:CANN(昇腾软件底座)实现全面开源,Triton 和 TileLang 接口 100% 兼容,已支持超 600 个 Triton 算子和 300 个 TileLang 算子,全面支持 DeepSeek V4 推理。通用算力层:鲲鹏构建三层智能体系,沙箱基础设施使 Agent 任务回滚性能达十毫秒级,Agent 任务成功率提升 10% 以上,业务 Token 开销降低 50%。

为什么值得关注:当英伟达用"芯片-系统-模型"三位一体战略构建全球 AI 基础架构时,华为正在做同样的事——只不过面向的是国产算力替代需求。CANN 全面开源和 Triton 100% 兼容是关键信号:华为正在通过生态兼容性策略降低开发者迁移门槛。鲲鹏面向 Agent 负载的优化(沙箱回滚、通信加速、Token 开销降低)也说明国产算力厂商已经从"追模型"进入"追场景"阶段。对于负责大模型部署和调优的技术团队来说,昇腾 950 + DeepSeek V4 的适配进展具有直接的工程参考价值。


7. OpenAI GPT-5.6 泄露:150 万 Token 上下文窗口 + "超级智能体"蓄势待发

事件:多名开发者在 OpenAI Codex 后端日志中发现未官宣模型 GPT-5.6,内部代号为 iris-alpha,将支持 150 万上下文窗口。日志中还发现 ember-alpha 与 beacon-alpha 等相关版本。消息显示 OpenAI 正在密集准备 6 月的大版本发布,距离 GPT-5.5 发布仅三周。同时,Claude-Mythos-1、Gemini 3.5 Pro 等竞争对手的新版本也各有泄露线索指向 6 月。

为什么值得关注:150 万 Token 上下文窗口意味着 GPT-5.6 将能一次性处理约 100 万字以上的文档,这对 Agent 处理长程复杂任务(代码仓库理解、大规模文档分析、多步骤项目执行)有质变意义。三家头部厂商同时在 6 月密集准备新模型发布,说明 AI 大模型的迭代节奏正在进一步加快——从季度发布转向月度发布。这对国内大模型的迭代节奏构成持续压力,也意味着模型能力的"窗口期"越来越短。


信息来源:36氪、量子位、IT之家、央视新闻、经济参考网、财联社、新京报、凤凰网科技、新浪财经等