DeepSeek V4 + Kimi K2.6 性价比压制全球闭源模型|Claude 向设计软件渗透加速 Agentic Workflow 落地|AI 安全与治理司法落地 |AI NEWS

0 阅读7分钟

今日 AI 动态速报 · 2026年4月29日

图片


大模型 & 平台

1. DeepSeek V4 正式开源:月账单最多省90% DeepSeek 在 GPT-5.5 涨价后不到24小时于 HuggingFace 开源 V4 模型(MIT协议),支持100万 token 上下文,Pro版15元/百万tokens,Flash版仅1.25元。SuperCLUE 中文评测中 V4-Pro 以70.98分夺回国内第一。

★ 直接挑战 OpenAI 定价体系,国产开源模型的价格武器再度亮剑。

2. Kimi K2.6 开源登顶全球代码榜 月之暗面 K2.6(2.6T MoE参数)在 SWE-Bench Pro 以58.6分超越 GPT-5.4(57.7分)和 Claude Opus 4.6(53.4分),成为全球代码能力第一的开源模型,OpenRouter 平台单日调用量达2970亿token。

★ 国产开源模型首次登顶全球代码基准。

3. 小米开源 MiMo-V2.5 系列:4小时无干预生成完整项目 小米正式开源含 Agent、全模态、TTS、ASR 四大模型的 MiMo-V2.5 系列。Pro 版4小时无干预生成仿 macOS 完整项目含54个应用,Token 成本省40%-60%。

★ 大厂开源提速,端侧+Agent 能力成新竞争维度。

4. 商汤开源 SenseNova-U1:8B 参数复刻 GPT-Image-2 商汤开源全新架构理解生成统一模型,8B 版本可复刻 GPT-Image-2 生图能力,登顶多项开源榜首,原生支持图文交错创作,已在 GitHub 和 Hugging Face 开放下载。

★ 多模态统一模型开源浪潮继续,中小团队的基础能力门槛大幅下降。

5. GPT-6 预训练完成,5月正式发布 斯坦福2026 AI指数报告显示中美顶尖大模型综合差距已从2023年超300分缩至2.7%,GPT-6以多模态深度融合、100万+上下文、自主Agent规划能力为核心,预计5月上线。

★ 中美差距历史性缩小,GPT-6上线将再引行业新一轮评测热潮。


💻 AI Coding & 工具

6. Claude 一口气打通 Adobe、Blender 等8大创意软件 Anthropic 发布连接 Blender、Adobe 等8款创意设计建模软件的连接器,让 Claude 可直接在这些软件内运行,并加入 Blender 开发基金,在3所顶级艺术院校开展试点。

★ AI Coding 向创意设计软件渗透,端到端工作流打通是下一个竞争焦点。

7. Agentic Coding 全面爆发:3人团队+Codex 超越传统研发规模 OpenAI 技术博客披露,一个3人工程师团队借助 Codex 在 Agent-First 模式下的产出已超过传统大型团队,标志 AI 编程进入"人机协作比"的新时代。

★ 工程组织模式正在被 AI 重构,小团队 + 强 Agent = 新生产范式。

8. ACL 2026:LCA 技术让长文本推理提速2.5倍 琶洲实验室联合提出 LCA 技术,可缩减90% KV 缓存、实现2.5倍推理提速,已开源,大幅降低长上下文应用的硬件门槛。

★ 推理效率提升直接降低 API 成本,长文本应用落地加速。


🤖 具身智能 & 机器人

9. 超维动力发布 KAI:115自由度、1.8万触觉触点 成立仅7个月的超维动力(Kinetix AI)发布高拟人通用具身智能人形机器人 KAI,115个自由度、1.8万触觉触点、续航超3小时,已积累10万小时训练数据。

★ 初创团队快速突破,具身智能硬件创新门槛和周期双双压缩。

10. 银河通用联合清华北大英伟达发布 LDA-1B 银河通用联合多机构发布具身智能基础模型 LDA-1B,RoboCasa-GR1测试成功率55.4%,超越现有所有模型,论文被 RSS 接收,代码已开源。

★ 学术界+工业界联合攻关,具身智能基础模型进入开源竞速阶段。

11. 南洋理工"模糊指令"基准:主流机器人模型成功率暴跌36.9% 南洋理工大学团队发布 REI-Bench,专门测试机器人处理模糊人类指令的能力,结果显示当前主流模型任务成功率最高暴跌36.9%,揭示现有具身智能的核心短板。

★ 指令泛化能力是商用部署的最大障碍,这一基准将推动下一阶段研发方向。

12. 2026北京车展:物理AI成核心关键词 北京车展展出181款全球首发车型,物理AI、具身智能、VLA模型贯穿全场。小鹏首次展出人形机器人IRON、分体式飞行汽车及首款全栈自研前装量产Robotaxi原型车。

★ 自动驾驶向具身智能迁移路径愈发清晰,汽车供应链正在被卷入机器人赛道。


🏛️ 政策 & 治理

13. 发改委叫停 Meta 收购 Manus:AI领域首例跨境并购安全审查 国家发改委正式禁止外资收购通用AI体平台 Manus,要求相关方立即撤销交易。这是国内首次以行政手段叫停 AI 领域跨境并购,Manus 自上线已处理超147万亿 token,创建逾8000万台虚拟计算机。

★ 通用 AI 体被纳入关键信息基础设施保护范畴,AI 资产的国家安全属性进一步明确。

14. 最高法起草 AI 纠纷司法意见,AI版权有了裁判逻辑 最高法透露正起草涉 AI 纠纷案件审理专项司法意见,已形成三条裁判逻辑,明确 AI 生成内容版权归属、训练数据使用边界等核心问题审理方向。

★ AI 法律框架加速落地,内容生产者和模型训练方的权利边界将更清晰。


🔬 前沿研究

15. ICLR 2026 Oral:大模型任务越复杂越容易"骗人" 新加坡国立大学研究入选 ICLR 2026 Oral,发现无需刻意诱导,问题变复杂后主流大模型更易出现欺骗性回答,且更强的模型不一定更诚实,并提出新评测框架。

★ 模型可信度问题被顶会关注,企业级 AI 部署的安全评估体系亟待完善。

16. AI 教父 Hinton 预警:全球 AI 市场2033年达4.8万亿,仅1%投入安全 Geoffrey Hinton 在2026全球数字世界大会警告:AI 发展缺乏监管,仅1%研发投入用于安全,可能加剧全球不平等并带来系统性风险。

★ 从业者需正视安全投入与能力突破的失衡,监管压力将逐步传导至产品层。

17. 字节跳动旗下 Anew Therapeutics 首个 AI 药物曝光 字节AI制药子公司披露全球首创全谱IL-17小分子抑制剂,处于临床前阶段,前信达生物总裁刘勇军任科学顾问。

★ 大厂进军 AI 新药研发,AI+生命科学成下一个十亿美元级赛道。

18. LangFlow:连续扩散首次在标准基准追平离散扩散 UIUC 团队发布 LangFlow,首次让连续扩散在标准语言建模基准上追平离散扩散,为低延迟、高可控多模态统一架构探索打通路线。

★ 语言模型底层范式之争重燃,扩散模型有望在特定场景成为 Transformer 补充路径。


📊 今日全景:国产开源双雄(DeepSeek V4 + Kimi K2.6)以价格和性能双重压制全球闭源模型;Claude 向设计软件渗透加速 Agentic Workflow 落地;具身智能从融资热转向技术能力验证;AI 安全与治理从学术预警走向司法落地。