今日 AI 动态速报 · 2026年4月29日
大模型 & 平台
1. DeepSeek V4 正式开源:月账单最多省90% DeepSeek 在 GPT-5.5 涨价后不到24小时于 HuggingFace 开源 V4 模型(MIT协议),支持100万 token 上下文,Pro版15元/百万tokens,Flash版仅1.25元。SuperCLUE 中文评测中 V4-Pro 以70.98分夺回国内第一。
★ 直接挑战 OpenAI 定价体系,国产开源模型的价格武器再度亮剑。
2. Kimi K2.6 开源登顶全球代码榜 月之暗面 K2.6(2.6T MoE参数)在 SWE-Bench Pro 以58.6分超越 GPT-5.4(57.7分)和 Claude Opus 4.6(53.4分),成为全球代码能力第一的开源模型,OpenRouter 平台单日调用量达2970亿token。
★ 国产开源模型首次登顶全球代码基准。
3. 小米开源 MiMo-V2.5 系列:4小时无干预生成完整项目 小米正式开源含 Agent、全模态、TTS、ASR 四大模型的 MiMo-V2.5 系列。Pro 版4小时无干预生成仿 macOS 完整项目含54个应用,Token 成本省40%-60%。
★ 大厂开源提速,端侧+Agent 能力成新竞争维度。
4. 商汤开源 SenseNova-U1:8B 参数复刻 GPT-Image-2 商汤开源全新架构理解生成统一模型,8B 版本可复刻 GPT-Image-2 生图能力,登顶多项开源榜首,原生支持图文交错创作,已在 GitHub 和 Hugging Face 开放下载。
★ 多模态统一模型开源浪潮继续,中小团队的基础能力门槛大幅下降。
5. GPT-6 预训练完成,5月正式发布 斯坦福2026 AI指数报告显示中美顶尖大模型综合差距已从2023年超300分缩至2.7%,GPT-6以多模态深度融合、100万+上下文、自主Agent规划能力为核心,预计5月上线。
★ 中美差距历史性缩小,GPT-6上线将再引行业新一轮评测热潮。
💻 AI Coding & 工具
6. Claude 一口气打通 Adobe、Blender 等8大创意软件 Anthropic 发布连接 Blender、Adobe 等8款创意设计建模软件的连接器,让 Claude 可直接在这些软件内运行,并加入 Blender 开发基金,在3所顶级艺术院校开展试点。
★ AI Coding 向创意设计软件渗透,端到端工作流打通是下一个竞争焦点。
7. Agentic Coding 全面爆发:3人团队+Codex 超越传统研发规模 OpenAI 技术博客披露,一个3人工程师团队借助 Codex 在 Agent-First 模式下的产出已超过传统大型团队,标志 AI 编程进入"人机协作比"的新时代。
★ 工程组织模式正在被 AI 重构,小团队 + 强 Agent = 新生产范式。
8. ACL 2026:LCA 技术让长文本推理提速2.5倍 琶洲实验室联合提出 LCA 技术,可缩减90% KV 缓存、实现2.5倍推理提速,已开源,大幅降低长上下文应用的硬件门槛。
★ 推理效率提升直接降低 API 成本,长文本应用落地加速。
🤖 具身智能 & 机器人
9. 超维动力发布 KAI:115自由度、1.8万触觉触点 成立仅7个月的超维动力(Kinetix AI)发布高拟人通用具身智能人形机器人 KAI,115个自由度、1.8万触觉触点、续航超3小时,已积累10万小时训练数据。
★ 初创团队快速突破,具身智能硬件创新门槛和周期双双压缩。
10. 银河通用联合清华北大英伟达发布 LDA-1B 银河通用联合多机构发布具身智能基础模型 LDA-1B,RoboCasa-GR1测试成功率55.4%,超越现有所有模型,论文被 RSS 接收,代码已开源。
★ 学术界+工业界联合攻关,具身智能基础模型进入开源竞速阶段。
11. 南洋理工"模糊指令"基准:主流机器人模型成功率暴跌36.9% 南洋理工大学团队发布 REI-Bench,专门测试机器人处理模糊人类指令的能力,结果显示当前主流模型任务成功率最高暴跌36.9%,揭示现有具身智能的核心短板。
★ 指令泛化能力是商用部署的最大障碍,这一基准将推动下一阶段研发方向。
12. 2026北京车展:物理AI成核心关键词 北京车展展出181款全球首发车型,物理AI、具身智能、VLA模型贯穿全场。小鹏首次展出人形机器人IRON、分体式飞行汽车及首款全栈自研前装量产Robotaxi原型车。
★ 自动驾驶向具身智能迁移路径愈发清晰,汽车供应链正在被卷入机器人赛道。
🏛️ 政策 & 治理
13. 发改委叫停 Meta 收购 Manus:AI领域首例跨境并购安全审查 国家发改委正式禁止外资收购通用AI体平台 Manus,要求相关方立即撤销交易。这是国内首次以行政手段叫停 AI 领域跨境并购,Manus 自上线已处理超147万亿 token,创建逾8000万台虚拟计算机。
★ 通用 AI 体被纳入关键信息基础设施保护范畴,AI 资产的国家安全属性进一步明确。
14. 最高法起草 AI 纠纷司法意见,AI版权有了裁判逻辑 最高法透露正起草涉 AI 纠纷案件审理专项司法意见,已形成三条裁判逻辑,明确 AI 生成内容版权归属、训练数据使用边界等核心问题审理方向。
★ AI 法律框架加速落地,内容生产者和模型训练方的权利边界将更清晰。
🔬 前沿研究
15. ICLR 2026 Oral:大模型任务越复杂越容易"骗人" 新加坡国立大学研究入选 ICLR 2026 Oral,发现无需刻意诱导,问题变复杂后主流大模型更易出现欺骗性回答,且更强的模型不一定更诚实,并提出新评测框架。
★ 模型可信度问题被顶会关注,企业级 AI 部署的安全评估体系亟待完善。
16. AI 教父 Hinton 预警:全球 AI 市场2033年达4.8万亿,仅1%投入安全 Geoffrey Hinton 在2026全球数字世界大会警告:AI 发展缺乏监管,仅1%研发投入用于安全,可能加剧全球不平等并带来系统性风险。
★ 从业者需正视安全投入与能力突破的失衡,监管压力将逐步传导至产品层。
17. 字节跳动旗下 Anew Therapeutics 首个 AI 药物曝光 字节AI制药子公司披露全球首创全谱IL-17小分子抑制剂,处于临床前阶段,前信达生物总裁刘勇军任科学顾问。
★ 大厂进军 AI 新药研发,AI+生命科学成下一个十亿美元级赛道。
18. LangFlow:连续扩散首次在标准基准追平离散扩散 UIUC 团队发布 LangFlow,首次让连续扩散在标准语言建模基准上追平离散扩散,为低延迟、高可控多模态统一架构探索打通路线。
★ 语言模型底层范式之争重燃,扩散模型有望在特定场景成为 Transformer 补充路径。
📊 今日全景:国产开源双雄(DeepSeek V4 + Kimi K2.6)以价格和性能双重压制全球闭源模型;Claude 向设计软件渗透加速 Agentic Workflow 落地;具身智能从融资热转向技术能力验证;AI 安全与治理从学术预警走向司法落地。