最近发生了啥?AI资讯汇总

0 阅读9分钟

一、大模型新品发布

本周是名副其实的"模型发布周",OpenAI、Anthropic、MiniMax、小米集中亮相新模型,能力边界持续向高性价比方向延伸。


Anthropic 发布 Claude Sonnet 4.6

2026年2月17日,Anthropic 正式发布 Claude Sonnet 4.6,成为 claude.ai Free 和 Pro 计划的新默认模型。

  • 在代码、计算机操控(Computer Use)、长文本推理、Agent 规划、知识工作和设计等维度实现全面升级
  • Beta 阶段支持高达 100 万 Token 上下文窗口
  • OSWorld 基准大幅提升,早期用户反馈在导航复杂电子表格或完成多步骤网页表单方面已接近人类水平
  • 对提示注入攻击(Prompt Injection)的防御能力与旗舰版 Opus 4.6 相当,大幅优于前代 Sonnet 4.5
  • Claude Code 内测中约 70% 的用户更偏好 Sonnet 4.6 而非 Sonnet 4.5,甚至有 59% 的用户更偏好它而非 2025 年 11 月的旗舰模型 Opus 4.5
  • API 定价维持不变(输入 3/输出3 / 输出 15,每百万 Token)

🔗 www.anthropic.com/news/claude…


OpenAI 发布 GPT-5.4 mini 与 GPT-5.4 nano

2026年3月17日,OpenAI 发布 GPT-5.4 mini 和 GPT-5.4 nano,将旗舰 GPT-5.4 的核心能力压缩进更小、更快、更便宜的版本,专面向高并发、低延迟的智能体工作负载。

  • GPT-5.4 mini:代码、推理、多模态理解和工具使用均有大幅提升,运行速度比前代快 2 倍以上,在 SWE-Bench Pro 和 OSWorld-Verified 等基准上接近完整版 GPT-5.4 水平;同时上线 ChatGPT 免费版("思考"模式)和 Codex
  • GPT-5.4 nano:成本极低(0.20/百万输入Token0.20 / 百万输入 Token、1.25 / 百万输出 Token),适用于分类、数据抽取、排名和编码子代理等轻量级任务
  • 两款模型均已面向全球开发者开放 API,尤其适合"主模型规划 + 子 Agent 执行"的多 Agent 架构

🔗 openai.com/index/intro…


MiniMax 发布 M2.7 —— 模型自我进化时代开启

2026年3月18日,MiniMax 发布 M2.7,将其定位为"第一个深度参与自身迭代训练流程的模型",早期版本模型在研发中承担了约 30%–50% 的工作量。

  • SWE-Pro 软件工程基准得分 56.22%,接近最优 Opus 水平
  • GDPval-AA 专业办公评测 ELO 1495,开源可访问模型最高
  • 40 个复杂 Skills 场景下 Skills 遵循率保持 97%
  • MM-Claw 龙虾评测得分 62.7%,逼近 Claude Sonnet 4.6
  • 原生支持多智能体协作,无需外部框架即可组建 Agent 团队完成复杂长流程任务
  • API 定价维持不变(0.30/百万输入Token0.30 / 百万输入 Token,1.20 / 百万输出 Token)

🔗 www.minimaxi.com/news/minima…


小米发布 MiMo V2 系列大模型

2026年3月19日凌晨,小米正式发布三款自研大模型,全面进军 Agent 智能体时代。

  • MiMo-V2-Pro:总参数超 1T,激活参数 42B,支持 100 万 Token 上下文,即此前在 OpenRouter 匿名登顶的"Hunter Alpha";Artificial Analysis 全球综合智能排行榜全球第八、国内第二;ClawEval Agent 评测全球前三,逼近 Claude Opus 4.6,API 定价约为其五分之一(256K 上下文:输入 1/输出1 / 输出 3,每百万 Token)
  • MiMo-V2-Omni:全模态基座,原生支持图像、视频、音频统一理解
  • MiMo-V2-TTS:语音合成,支持粤语、四川话等方言及情感控制
  • 雷军表示,小米今年在 AI 领域的研发和资本投入将超过 160 亿元人民币

🔗 mimo.xiaomi.com/


二、AI 编程工具与 Agent 框架

AI 编程助手与 Agent 基础设施领域本周动作频频,开源与商业闭环同步推进。


LangChain 发布 openSWE —— 开源企业级编程 Agent 框架

2026年3月17日,LangChain 正式开源 Open SWE(MIT 协议),专为企业内部部署设计的异步编程 Agent 框架。该框架提炼了 Stripe(Minions)、Ramp(Inspect)和 Coinbase(Cloudbot)等顶级工程团队独立研发后殊途同归的架构模式。

  • 隔离的云端沙箱:每个任务独占一个 Linux 环境,通过 Daytona/Modal 等提供商运行
  • 约 15 个精心策划的工具集
  • 多平台触发:Slack / Linear / GitHub
  • 上下文前置注入:任务开始前注入 AGENTS.md 规范文件 + 完整 Issue/Thread 记录
  • 基于 LangGraph 平台构建,任务可异步并行执行;托管版本位于 swe.langchain.com,需要 Anthropic API Key

🔗 blog.langchain.com/open-swe-an…


OpenAI 收购 Python 开发工具公司 Astral

2026年3月19日,OpenAI 宣布将收购 Astral —— Python 生态最受欢迎的工具链公司之一,其旗舰产品 uv、Ruff 和 ty 均基于 Rust 开发,性能比 Python 原生工具高出 10–100 倍,每月下载量已达数亿次。

  • Astral 团队将加入 OpenAI Codex 团队,继续维护并开源所有工具,同时探索与 Codex AI 编程助手的深度集成
  • OpenAI 表示 Codex 目前拥有超过 200 万周活跃用户,今年初以来用户增长 3 倍、使用量增长 5 倍
  • 此举与 Anthropic 在 2025 年 12 月收购 Bun 运行时形成直接竞争,双方均在抢占 AI 编程工具链核心卡位

🔗 openai.com/index/opena…


Anthropic Claude Code 发布 Channels 功能

Claude Code 推出全新 Channels(频道)功能。

  • 允许开发者在同一项目中创建多个独立的对话频道,每个频道拥有独立的上下文和会话历史
  • 便于将功能开发、代码审查、调试等不同任务在结构化方式下分开管理,避免长会话上下文相互干扰
  • 是 Claude Code 持续完善工程协作能力的重要里程碑

🔗 code.claude.com/docs/en/cha…


三、企业 AI 平台与生态


腾讯 QClaw(龙虾)全量公测,无需邀请码

2026年3月20日,腾讯正式官宣 QClaw 龙虾开启全量公测,用户无需邀请码,直接访问官网下载即可,20 秒完成安装。

  • 基于开源 Agent 框架 OpenClaw 打造的本地 AI 助手,支持 Windows 和 macOS,主打"零门槛"一键部署体验
  • 核心特性:深度打通微信生态,用户在手机微信发一句话即可远程操控电脑完成任务
  • 全量公测版本进一步打通企业微信、QQ、飞书、钉钉等主流即时通讯平台
  • 内置 5000+ Skills 生态,支持持续记忆,默认接入 Kimi-2.5 等国产大模型
  • 新版本带来"龙虾像素工作室"创作空间和定时任务等特色功能

🔗 qclaw.qq.com/


阿里发布悟空平台,钉钉同步完成 CLI 化改造

2026年3月17日,阿里巴巴推出全球首个企业级 AI 原生工作平台"悟空",定位不是单个 AI 助手,而是可承载多 Agent 协同工作的企业级底座。与此同步,拥有 8 亿用户的钉钉完成底层代码重写,全面转向命令行界面(CLI)化改造,使悟空 Agent 可原生调用钉钉上千项能力,不再依赖模拟人类点击图形界面,真正实现"沟通即执行"。钉钉 CEO 陈航(无招)表示:"过去是人用钉钉工作,未来是 AI 用钉钉工作。"

  • 企业权限继承:AI Agent 自动继承企业权限规则,在安全沙箱中执行任务,Token 消耗与成本清晰可视
  • 钉钉深度集成:既可作为独立应用使用,也将直接内置于超过 2000 万企业组织使用的钉钉中;CLI 化后 Agent 可原生调用账号体系、权限管理、审批、日历、工作流等千项企业级功能
  • AI 能力市场:提供从开发、审核、上架到分发的完整 Skill 生态;淘宝、天猫、1688、支付宝、阿里云等 ToB 能力将逐步以 Skill 形式接入
  • OPT 方案:One Person Team 行业模板,支持一人完成过去需要团队才能完成的工作

🔗 www.aihub.cn/agents/wuko…
🔗 www.dingtalk-global.com/zh/news/act…


四、前沿研究与行业动向


NVIDIA GTC 2026 —— 黄仁勋主题演讲

2026年3月16–19日,NVIDIA GTC 2026 在美国圣何塞举行,预计吸引 30,000 名参会者(较去年增加约 20%)。黄仁勋发表长达两个半小时的主题演讲,将当前定性为"AI 工业时代"。

  • Vera Rubin 算力平台:集成 Groq LPU 推理芯片后,特定负载吞吐量可提升 35 倍,推理成本降至前代十分之一
  • 推理拐点:黄仁勋着重强调"推理拐点"已经到来,预测到 2027 年 AI 芯片将带来至少 1 万亿美元营收
  • NemoClaw 与 OpenClaw:重点介绍 OpenClaw 开源 Agent 框架(称其为"增长最快的开源项目之一"),并宣布推出 NemoClaw 企业版部署工具链;现场展示了 NemoClaw 驱动的多 Agent 演示
  • 结构化数据:黄仁勋将其称为"企业计算的 Ground Truth",强调 AI 对非结构化数据的索引与理解能力将彻底重塑企业信息架构
  • DGX Station:新一代桌面级 AI 工作站,可运行和微调 Kimi K2.5、Qwen3、DeepSeek V3.2 等主流开源模型

🔗 blogs.nvidia.com/blog/gtc-20…


Kimi 在 GTC 亮相 —— 杨植麟演讲与注意力残差论文

月之暗面创始人杨植麟是本届 GTC 唯一受邀现场发言的中国独立大模型公司创始人,于3月17日发表题为"How We Scaled Kimi K2.5"的演讲,披露了三大核心技术方向:用 Muon 优化器替代 Adam 实现约 2 倍单位算力模型能力提升;基于混合注意力架构的 Kimi Linear 将推理速度提升 5–6 倍;在视觉-文本联合预训练中引入 Vision RL 后,文本基准(MMLU-Pro、GPQA-Diamond)也反向提升约 1.7%–2.2%

就在 GTC 开幕前夕(3月16日),Kimi 团队同步在 arXiv 发表技术报告《Attention Residuals》(arXiv: 2603.15031),对延续十年的 Transformer 残差连接进行根本性重构——用 Softmax 注意力机制替代固定权重的残差加法,使每一层能以学习到的动态权重对前序所有层的表示进行选择性聚合,从根本上解决深层隐藏状态被稀释的问题。配套的 Block AttnRes 方案将内存开销从 O(Ld)O(Ld) 降至 O(Nd)O(Nd),带来 1.25 倍算力等效增益,已在 Kimi Linear 48B 上验证(推理延迟增加不超过 2%)。Elon Musk 称其"impressive",Andrej Karpathy 认为这可能是被低估的重要突破。

🔗 GTC 演讲报道:eu.36kr.com/en/p/372830…
🔗 Attention Residuals 论文:arxiv.org/abs/2603.15…
🔗 GitHub 开源代码:github.com/MoonshotAI/…

wechat-niko.png