DeepSeek V4 + Kimi K2.6 性价比压制全球闭源模型｜Claude 向设计软件渗透加速 Agentic Workflow 落地｜AI 安全与治理司法落地｜AI NEWS

今日 AI 动态速报 · 2026年4月29日

大模型 & 平台

1. DeepSeek V4 正式开源：月账单最多省90% DeepSeek 在 GPT-5.5 涨价后不到24小时于 HuggingFace 开源 V4 模型（MIT协议），支持100万 token 上下文，Pro版15元/百万tokens，Flash版仅1.25元。SuperCLUE 中文评测中 V4-Pro 以70.98分夺回国内第一。

★ 直接挑战 OpenAI 定价体系，国产开源模型的价格武器再度亮剑。

2. Kimi K2.6 开源登顶全球代码榜 月之暗面 K2.6（2.6T MoE参数）在 SWE-Bench Pro 以58.6分超越 GPT-5.4（57.7分）和 Claude Opus 4.6（53.4分），成为全球代码能力第一的开源模型，OpenRouter 平台单日调用量达2970亿token。

★ 国产开源模型首次登顶全球代码基准。

3. 小米开源 MiMo-V2.5 系列：4小时无干预生成完整项目 小米正式开源含 Agent、全模态、TTS、ASR 四大模型的 MiMo-V2.5 系列。Pro 版4小时无干预生成仿 macOS 完整项目含54个应用，Token 成本省40%-60%。

★ 大厂开源提速，端侧+Agent 能力成新竞争维度。

4. 商汤开源 SenseNova-U1：8B 参数复刻 GPT-Image-2 商汤开源全新架构理解生成统一模型，8B 版本可复刻 GPT-Image-2 生图能力，登顶多项开源榜首，原生支持图文交错创作，已在 GitHub 和 Hugging Face 开放下载。

★ 多模态统一模型开源浪潮继续，中小团队的基础能力门槛大幅下降。

5. GPT-6 预训练完成，5月正式发布 斯坦福2026 AI指数报告显示中美顶尖大模型综合差距已从2023年超300分缩至2.7%，GPT-6以多模态深度融合、100万+上下文、自主Agent规划能力为核心，预计5月上线。

★ 中美差距历史性缩小，GPT-6上线将再引行业新一轮评测热潮。

💻 AI Coding & 工具

6. Claude 一口气打通 Adobe、Blender 等8大创意软件 Anthropic 发布连接 Blender、Adobe 等8款创意设计建模软件的连接器，让 Claude 可直接在这些软件内运行，并加入 Blender 开发基金，在3所顶级艺术院校开展试点。

★ AI Coding 向创意设计软件渗透，端到端工作流打通是下一个竞争焦点。

7. Agentic Coding 全面爆发：3人团队+Codex 超越传统研发规模 OpenAI 技术博客披露，一个3人工程师团队借助 Codex 在 Agent-First 模式下的产出已超过传统大型团队，标志 AI 编程进入"人机协作比"的新时代。

★ 工程组织模式正在被 AI 重构，小团队 + 强 Agent = 新生产范式。

8. ACL 2026：LCA 技术让长文本推理提速2.5倍 琶洲实验室联合提出 LCA 技术，可缩减90% KV 缓存、实现2.5倍推理提速，已开源，大幅降低长上下文应用的硬件门槛。

★ 推理效率提升直接降低 API 成本，长文本应用落地加速。

🤖 具身智能 & 机器人

9. 超维动力发布 KAI：115自由度、1.8万触觉触点 成立仅7个月的超维动力（Kinetix AI）发布高拟人通用具身智能人形机器人 KAI，115个自由度、1.8万触觉触点、续航超3小时，已积累10万小时训练数据。

★ 初创团队快速突破，具身智能硬件创新门槛和周期双双压缩。

10. 银河通用联合清华北大英伟达发布 LDA-1B 银河通用联合多机构发布具身智能基础模型 LDA-1B，RoboCasa-GR1测试成功率55.4%，超越现有所有模型，论文被 RSS 接收，代码已开源。

★ 学术界+工业界联合攻关，具身智能基础模型进入开源竞速阶段。

11. 南洋理工"模糊指令"基准：主流机器人模型成功率暴跌36.9% 南洋理工大学团队发布 REI-Bench，专门测试机器人处理模糊人类指令的能力，结果显示当前主流模型任务成功率最高暴跌36.9%，揭示现有具身智能的核心短板。

★ 指令泛化能力是商用部署的最大障碍，这一基准将推动下一阶段研发方向。

12. 2026北京车展：物理AI成核心关键词 北京车展展出181款全球首发车型，物理AI、具身智能、VLA模型贯穿全场。小鹏首次展出人形机器人IRON、分体式飞行汽车及首款全栈自研前装量产Robotaxi原型车。

★ 自动驾驶向具身智能迁移路径愈发清晰，汽车供应链正在被卷入机器人赛道。

🏛️ 政策 & 治理

13. 发改委叫停 Meta 收购 Manus：AI领域首例跨境并购安全审查 国家发改委正式禁止外资收购通用AI体平台 Manus，要求相关方立即撤销交易。这是国内首次以行政手段叫停 AI 领域跨境并购，Manus 自上线已处理超147万亿 token，创建逾8000万台虚拟计算机。

★ 通用 AI 体被纳入关键信息基础设施保护范畴，AI 资产的国家安全属性进一步明确。

14. 最高法起草 AI 纠纷司法意见，AI版权有了裁判逻辑 最高法透露正起草涉 AI 纠纷案件审理专项司法意见，已形成三条裁判逻辑，明确 AI 生成内容版权归属、训练数据使用边界等核心问题审理方向。

★ AI 法律框架加速落地，内容生产者和模型训练方的权利边界将更清晰。

🔬 前沿研究

15. ICLR 2026 Oral：大模型任务越复杂越容易"骗人" 新加坡国立大学研究入选 ICLR 2026 Oral，发现无需刻意诱导，问题变复杂后主流大模型更易出现欺骗性回答，且更强的模型不一定更诚实，并提出新评测框架。

★ 模型可信度问题被顶会关注，企业级 AI 部署的安全评估体系亟待完善。

16. AI 教父 Hinton 预警：全球 AI 市场2033年达4.8万亿，仅1%投入安全 Geoffrey Hinton 在2026全球数字世界大会警告：AI 发展缺乏监管，仅1%研发投入用于安全，可能加剧全球不平等并带来系统性风险。

★ 从业者需正视安全投入与能力突破的失衡，监管压力将逐步传导至产品层。

17. 字节跳动旗下 Anew Therapeutics 首个 AI 药物曝光 字节AI制药子公司披露全球首创全谱IL-17小分子抑制剂，处于临床前阶段，前信达生物总裁刘勇军任科学顾问。

★ 大厂进军 AI 新药研发，AI+生命科学成下一个十亿美元级赛道。

18. LangFlow：连续扩散首次在标准基准追平离散扩散 UIUC 团队发布 LangFlow，首次让连续扩散在标准语言建模基准上追平离散扩散，为低延迟、高可控多模态统一架构探索打通路线。

★ 语言模型底层范式之争重燃，扩散模型有望在特定场景成为 Transformer 补充路径。

📊 今日全景：国产开源双雄（DeepSeek V4 + Kimi K2.6）以价格和性能双重压制全球闭源模型；Claude 向设计软件渗透加速 Agentic Workflow 落地；具身智能从融资热转向技术能力验证；AI 安全与治理从学术预警走向司法落地。

DeepSeek V4 + Kimi K2.6 性价比压制全球闭源模型｜Claude 向设计软件渗透加速 Agentic Workflow 落地｜AI 安全与治理司法落地 ｜AI NEWS