AI Daily | AI日报：微软大会All in智能体网络; 微软Meta AI部门现离职潮; 段楠：视频生成技术或达上限

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。

2025-05-20 资讯日报

新闻资讯

微软大会All in智能体网络

微软Build 2025大会：CEO纳德拉提出“智能体网络”，开发者工具升级，M365 Copilot更新，Azure AI Foundry功能丰富，Windows成AI平台，还推Microsoft Discovery加速科学发现。>阅读原文

微软Meta AI部门现离职潮

微软裁员约6000人，包括AI总监，官方称集中资源，员工不满算法裁人；Meta的LLaMA团队有人员离职，离职潮折射AI行业资金与人才的跷跷板效应，人才大战刚开场。>阅读原文

段楠：视频生成技术或达上限

阶跃星辰段楠：当前Diffusion模型或达能力上限，未来1 - 2年视觉领域基础模型有望出现。视频Scaling Law独特，模型需从“生成”到“理解”，未来架构或融合AR与Diffusion。>阅读原文

AlphaEvolve矩阵乘法突破被证实

开发者证实谷歌AlphaEvolve矩阵乘法突破，将4×4矩阵计算次数从49减到48。它利用进化搜索+LLM引导找低秩分解，提升计算效率，象征AI成攻克数学难题新范式。>阅读原文

谷歌AlphaEvolve挑战人类专家

谷歌DeepMind推出AlphaEvolve，结合Gemini与进化算法，优化经典算法、多领域突破，原创能力引关注。OpenAI研究员Jason Wei震撼，称AI凭算力和评估体系能找最优解。>阅读原文

图像推理题，AI集体翻车

图像推理难题让AI集体翻车，o3、Gemini 2.5Pro、DeepSeek、Qwen3等答案不一，因对大立方体规格理解不同。结合提示尝试，大模型能改进，人类面对此问题也会困惑。>阅读原文

黄仁勋官宣中国台湾建AI超算

英伟达黄仁勋：将在中国台湾建世界级AI超算，推出GB300等新品。NVLink Fusion可半定制超算，DGX Station性能强。AI发展将促成通用机器人到来，还开源人形机器人模型。>阅读原文

英伟达推新品拓展AI基建

英伟达黄仁勋：公司正从芯片公司转型为AI基础设施公司，宣布多款新品，如DGX Station能跑大模型，RTX PRO Server性价比高，还发布新平台、宣布与迪士尼合作机器人项目。>阅读原文

微软开源 Copilot，推 Coding Agent

微软：将开源 GitHub Copilot Chat 扩展代码，重构到 VS Code 核心，适应 AI 时代；还推出 Coding Agent 自动化处理开发任务，在 Copilot Pro Plus 预览，让开发者专注复杂工作。>阅读原文

华为昇腾推理性能超越英伟达

华为昇腾：在超大规模MoE部署上推理性能超英伟达。通过‘以数学补物理’及多方面优化，在不同硬件实现高吞吐，还将全面开源，本周举办技术披露周。>阅读原文

中国团队包揽机器人赛三金

ManiSkill - ViTac 2025视触觉融合挑战赛中，中国原力灵机和它石智航两家具身初创公司包揽三金。原力灵机提出创新框架、优化传感器设计。赛事推动视触觉融合技术，中国团队彰显领先实力。>阅读原文

微软 Build 大会：开源与 AI 齐飞

微软 Build 2025 大会亮点多，纳德拉称处在平台变革‘中局’。大会开源 Copilot 核心、WSL 等，升级工具，推出新智能体和平台，还与 OpenAI、特斯拉、英伟达交流，发力数据、基建和科研领域。>阅读原文

中科曙光：算力布局破业绩困局

中科曙光：虽股价涨但业绩增速放缓，创始人李国杰退居幕后，控股股东减持。不过凭借全产业链布局穿越周期，1 - 3月恢复增长，将聚焦核心能力建设。>阅读原文

GitHub CEO硬刚“编程无用论”

GitHub CEO托马斯·多姆克：“编程无用论”错误，2025年是编程智能体之年，但未来仍属人类程序员，AI只能是助手，人类要持续学代码。>阅读原文

纳德拉：软件开发离不开AI

微软CEO纳德拉称软件开发离不开AI，它像拼写检查般基础。他强调AI是赋能工具，普及AI是挑战。社区认可其观点，也指出AI有局限，人类智慧仍重要。>阅读原文

产品应用

Code Rabbit为Cursor纠错

Aitrainee：Cursor的AI Agent写代码常出错，Code Rabbit可审查代码、提建议。安装其插件后，按流程操作并将建议反馈给Cursor，能提升编码质量，还能构建高效工作流。>阅读原文

OceanBase迈向AI数据底座

OceanBase CTO杨传辉等认为AI时代需一体化数据底座。OceanBase正朝此战略跃迁，推进成为知识底座等四大方向，发布PowerRAG，适配主流智能体平台，有望迎来发展。>阅读原文

GitHub代码智能体来袭且将开源

GitHub推出代码智能体Copilot Coding Agent，能自动完成代码任务，手机可操作。微软宣布VSCode中它将开源，还发布Copilot Tuning等新功能，加速科研，厉害！>阅读原文

Windsurf推出SWE - 1模型

Windsurf：推出SWE - 1模型家族，想将软件开发速度提升99%。该系列模型性能比肩Claude 3.5、成本低，虽有不足但有一战之力，未来会加大投入超越其他前沿模型。>阅读原文

Granola创始人谈产品之道

Granola创始人Chris Pedregal：做产品要有直觉，靠与用户“面对面”建立。创业公司早期探索优势大，Granola要成工作“效率中心”，未来处理会议衍生任务，让用户更高效。>阅读原文

OceanBase发布PowerRAG并详解AI战略

OceanBase CTO杨传辉：OceanBase正构建Data×AI能力，推动数据库向数据底座演进。发布PowerRAG，其向量性能达业内领先，为AI应用生态发展带来多维度推动。>阅读原文

Granola：解锁AI笔记新体验

Granola创始人Chris Pedregal：Granola不仅是会议转录工具，更是思维工具，核心是赋予用户控制权。目前帮生成会议笔记，未来目标是助用户完成多数工作。与AI协作需更好界面。>阅读原文

微软新平台200小时发现新物质

微软推出Microsoft Discovery科研平台，结合AI Agent与高性能计算。用它筛选36.7万种物质，200小时找到新冷却剂，原本需数月甚至数年。还能降低科研门槛，已开启私密预览。>阅读原文

开源动态

LocalSite AI：开源AI生成前端页面

LocalSite AI：利用AI按自然语言描述生成网页代码。功能多，支持多AI供应商。介绍安装、部署等步骤，还有后续发展路线，如集成更多模型、改进UI等。>阅读原文

B站开源动画生成模型

B站：开源动画生成模型Index - AniSora，支持多种二次元风格一键生成。基于AniSora系统提升生产效率，开源多项内容，还构建奖励数据集和模型，提升模型与人类偏好的对齐性能。>阅读原文

360开源FG - CLIP破图文难题

360人工智能研究院：发布 FG - CLIP 模型，突破传统 CLIP 局限，解决图文“近视”问题。采用双阶段训练等策略，在多任务表现优异，且已开源，未来拓展细粒度视觉理解边界。>阅读原文

Agent Squad：多智能体编排框架

小G介绍轻量级多智能体对话编排框架Agent Squad，它功能丰富，新SupervisorAgent能协调多专业代理，有演示应用，还给出多种语言使用示例及模块化安装选项。>阅读原文

Supabase 融资 2 亿成开源新宠

Supabase 完成 2 亿美元 D 轮融资，投后估值 20 亿美元。它适配“氛围编程”，集成多种 AI 能力，还推出自家 AI 助手。其开源模式受开发者青睐，有望在高价值数据库领域占主导。>阅读原文

OpenMemory MCP实现AI记忆共享

作者分享OpenMemory MCP，它是跨平台记忆辅助神器，数据私有。介绍本地化部署步骤，官方封装成MCP降低使用门槛，让AI Agent能有记忆，可开很多脑洞。>阅读原文

阿里团队重现 DeepSeek 推理突破

阿里集团智能引擎团队：在 RTP - LLM 上对齐了 DeepSeek 推理系统性能，分享优化关键技术，指出算子性能等方面不足；还提到 Qwen3 可采用类似部署模式，在延迟和吞吐上表现更好。>阅读原文

微软开源Windows子系统WSL

微软：宣布开源适用于Linux的Windows子系统WSL。它可让开发者在Windows上运行Linux环境，历经多年发展，此次开源是为跟上社区和功能需求。>阅读原文

微软开源VS Code AI功能

微软VS Code团队：将开源AI编辑器功能，把GitHub Copilot Chat扩展代码重构到VS Code核心。这一决定受AI领域变化推动，开发者看法不一，编码工具未来充满变数。>阅读原文

微软开源 Copilot 叫板竞品

微软：在 Build 2025 大会宣布开源 GitHub Copilot Extension for VSCode，还推新 AI 编码代理。开源是多因素推动，意在扩大分发触达更多用户，或让用户从其他工具倒向 Copilot。>阅读原文

WeClone：微信记录造数字分身

开源君：爆火的WeClone开源项目，用微信聊天记录训练专属AI打造数字分身，支持语音克隆。它全链路覆盖、考虑隐私，操作有准备工作和四步流程，可去GitHub体验。>阅读原文

算法论文

模型推理强却更不听话

研究团队测试15个模型发现，用CoT推理后执行准确率下降，模型会自作主张违反指令。根源是约束注意力下降，还给出4种提升指令遵循效果的方案，指出智能应聚焦关键节点。>阅读原文

OTT：抓出捣乱分子压缩KV Cache

论文提出OTT压缩方法：追踪异常令牌单独高精度保存，其余大胆压缩。实验显示，它在多任务和模型中近乎无损，内存减6.4倍、吞吐量提2.3倍，但在极短文本等场景有局限。>阅读原文

哈工大宾大打造点云分析新架构

哈工大（深圳）与宾大团队：推出PointKAN用于点云分析，替代MLP方案，学习几何特征能力强。还提出PointKAN - elite降参。实验显示其在多任务表现优，泛化和迁移能力强。>阅读原文

颜水成团队：多模态模型无L5

十所高校联合发布评估框架与数据集，给多模态大模型分段位。超100款模型测评显示，大多停留在L2 - L3，无L5模型。当前模型在任务支持、超越专家、内容生成等方面存在不足。>阅读原文

北大等提出InfiniteHBD架构

北大、阶跃、曦智团队：现有HBD架构有局限，提出InfiniteHBD架构，其具低成本、高扩展性和高容错性，单位成本仅为NVL - 72的31%，GPU浪费率接近零，MFU最高提升3.37倍。>阅读原文

普华永道推出ScaleMCP提升代理性能

普华永道：提出ScaleMCP解决现有工具选择框架问题，配备MCP工具检索器，还有TDWA嵌入策略。实验显示其提升LLM代理性能，TDWA在重排序阶段表现出色。>阅读原文

SoftCoT++让LLM推理能力跃升

SoftCoT++论文提出新方法：拆分‘思考’与‘推理’，扰动初始条件实现多路径探索。用专用初始token和对比学习，实验中在多基准测试提升效果，且无需改模型参数。>阅读原文

LLM读时钟日历准确率低

爱丁堡大学等机构研究：AI读取时钟和判断日历准确率低，像Gemini - 2.0、GPT - o1部分表现好但整体差。原因是训练数据有限、推理能力不足，提醒别过度依赖AI。>阅读原文

西湖大学团队提出M2PDE仿真法

西湖大学吴泰霖团队：提出M2PDE方法，把多物理场与多元件PDE仿真转为生成式概率建模，能捕捉复杂相互作用，在多任务测试中性能佳，未来将提升精度、探索算法、拓展应用。>阅读原文

PhyT2V 让 T2V 物理真实度飙升

匹兹堡大学团队：提出 PhyT2V 框架，不重训模型，通过链式推理与迭代修正，增强 T2V 模型物理场景生成能力，实验显示可大幅提升视频物理真实度，在多模型表现佳。>阅读原文

匹大提出PhyT2V让T2V更合物理规律

匹兹堡大学研究团队：提出PhyT2V框架，通过链式推理与迭代自我修正机制，增强T2V模型物理一致性，无需额外训练，在多模型实验中显著提升视频对物理规则的遵守度。>阅读原文

腾讯TGW网关技术成果显著

腾讯TGW团队：TGW云网关系统已稳定运行8年，入选USENIX ATC '25的论文阐述其架构与技术，有超高性能、秒级伸缩等能力，还分享运营经验，未来将融合前沿技术。>阅读原文

其他

1. 小米重启造芯挑战高端

华为、OPPO、小米都曾涉足手机芯片自研，OPPO哲库因财务、组织架构等问题夭折。小米重启造芯，有财务和经验优势，采取务实策略，且赶上制裁“窗口期”，AI时代自研芯片需求迫切。>阅读原文