All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。
2025-05-20 资讯日报
新闻资讯
微软大会All in智能体网络
微软Build 2025大会:CEO纳德拉提出“智能体网络”,开发者工具升级,M365 Copilot更新,Azure AI Foundry功能丰富,Windows成AI平台,还推Microsoft Discovery加速科学发现。>阅读原文
微软Meta AI部门现离职潮
微软裁员约6000人,包括AI总监,官方称集中资源,员工不满算法裁人;Meta的LLaMA团队有人员离职,离职潮折射AI行业资金与人才的跷跷板效应,人才大战刚开场。>阅读原文
段楠:视频生成技术或达上限
阶跃星辰段楠:当前Diffusion模型或达能力上限,未来1 - 2年视觉领域基础模型有望出现。视频Scaling Law独特,模型需从“生成”到“理解”,未来架构或融合AR与Diffusion。>阅读原文
AlphaEvolve矩阵乘法突破被证实
开发者证实谷歌AlphaEvolve矩阵乘法突破,将4×4矩阵计算次数从49减到48。它利用进化搜索+LLM引导找低秩分解,提升计算效率,象征AI成攻克数学难题新范式。>阅读原文
谷歌AlphaEvolve挑战人类专家
谷歌DeepMind推出AlphaEvolve,结合Gemini与进化算法,优化经典算法、多领域突破,原创能力引关注。OpenAI研究员Jason Wei震撼,称AI凭算力和评估体系能找最优解。>阅读原文
图像推理题,AI集体翻车
图像推理难题让AI集体翻车,o3、Gemini 2.5Pro、DeepSeek、Qwen3等答案不一,因对大立方体规格理解不同。结合提示尝试,大模型能改进,人类面对此问题也会困惑。>阅读原文
黄仁勋官宣中国台湾建AI超算
英伟达黄仁勋:将在中国台湾建世界级AI超算,推出GB300等新品。NVLink Fusion可半定制超算,DGX Station性能强。AI发展将促成通用机器人到来,还开源人形机器人模型。>阅读原文
英伟达推新品拓展AI基建
英伟达黄仁勋:公司正从芯片公司转型为AI基础设施公司,宣布多款新品,如DGX Station能跑大模型,RTX PRO Server性价比高,还发布新平台、宣布与迪士尼合作机器人项目。>阅读原文
微软开源 Copilot,推 Coding Agent
微软:将开源 GitHub Copilot Chat 扩展代码,重构到 VS Code 核心,适应 AI 时代;还推出 Coding Agent 自动化处理开发任务,在 Copilot Pro Plus 预览,让开发者专注复杂工作。>阅读原文
华为昇腾推理性能超越英伟达
华为昇腾:在超大规模MoE部署上推理性能超英伟达。通过‘以数学补物理’及多方面优化,在不同硬件实现高吞吐,还将全面开源,本周举办技术披露周。>阅读原文
中国团队包揽机器人赛三金
ManiSkill - ViTac 2025视触觉融合挑战赛中,中国原力灵机和它石智航两家具身初创公司包揽三金。原力灵机提出创新框架、优化传感器设计。赛事推动视触觉融合技术,中国团队彰显领先实力。>阅读原文
微软 Build 大会:开源与 AI 齐飞
微软 Build 2025 大会亮点多,纳德拉称处在平台变革‘中局’。大会开源 Copilot 核心、WSL 等,升级工具,推出新智能体和平台,还与 OpenAI、特斯拉、英伟达交流,发力数据、基建和科研领域。>阅读原文
中科曙光:算力布局破业绩困局
中科曙光:虽股价涨但业绩增速放缓,创始人李国杰退居幕后,控股股东减持。不过凭借全产业链布局穿越周期,1 - 3月恢复增长,将聚焦核心能力建设。>阅读原文
GitHub CEO硬刚“编程无用论”
GitHub CEO托马斯·多姆克:“编程无用论”错误,2025年是编程智能体之年,但未来仍属人类程序员,AI只能是助手,人类要持续学代码。>阅读原文
纳德拉:软件开发离不开AI
微软CEO纳德拉称软件开发离不开AI,它像拼写检查般基础。他强调AI是赋能工具,普及AI是挑战。社区认可其观点,也指出AI有局限,人类智慧仍重要。>阅读原文
产品应用
Code Rabbit为Cursor纠错
Aitrainee:Cursor的AI Agent写代码常出错,Code Rabbit可审查代码、提建议。安装其插件后,按流程操作并将建议反馈给Cursor,能提升编码质量,还能构建高效工作流。>阅读原文
OceanBase迈向AI数据底座
OceanBase CTO杨传辉等认为AI时代需一体化数据底座。OceanBase正朝此战略跃迁,推进成为知识底座等四大方向,发布PowerRAG,适配主流智能体平台,有望迎来发展。>阅读原文
GitHub代码智能体来袭且将开源
GitHub推出代码智能体Copilot Coding Agent,能自动完成代码任务,手机可操作。微软宣布VSCode中它将开源,还发布Copilot Tuning等新功能,加速科研,厉害!>阅读原文
Windsurf推出SWE - 1模型
Windsurf:推出SWE - 1模型家族,想将软件开发速度提升99%。该系列模型性能比肩Claude 3.5、成本低,虽有不足但有一战之力,未来会加大投入超越其他前沿模型。>阅读原文
Granola创始人谈产品之道
Granola创始人Chris Pedregal:做产品要有直觉,靠与用户“面对面”建立。创业公司早期探索优势大,Granola要成工作“效率中心”,未来处理会议衍生任务,让用户更高效。>阅读原文
OceanBase发布PowerRAG并详解AI战略
OceanBase CTO杨传辉:OceanBase正构建Data×AI能力,推动数据库向数据底座演进。发布PowerRAG,其向量性能达业内领先,为AI应用生态发展带来多维度推动。>阅读原文
Granola:解锁AI笔记新体验
Granola创始人Chris Pedregal:Granola不仅是会议转录工具,更是思维工具,核心是赋予用户控制权。目前帮生成会议笔记,未来目标是助用户完成多数工作。与AI协作需更好界面。>阅读原文
微软新平台200小时发现新物质
微软推出Microsoft Discovery科研平台,结合AI Agent与高性能计算。用它筛选36.7万种物质,200小时找到新冷却剂,原本需数月甚至数年。还能降低科研门槛,已开启私密预览。>阅读原文
推荐文章
E2B:欲成 AI Agent 时代的 AWS
E2B 是为 AI agent 提供运行环境的开源设施,沙盒月创建量猛增。CEO Vasek 想让其成 AI Agent 时代的 AWS,还探讨了 Agent 定价、应用场景等;AI engineer James 分享教 AI 用电脑的经验。>阅读原文
大模型三技术重塑产业图景
作者jaymie指出,大模型通过RAG、Agent与多模态技术协同演进,攻克数据等难题,推动行业变革。RAG解决模型局限,Agent能自主执行任务,多模态应用广泛,未来三者融合催生新产业智能体。>阅读原文
开源动态
LocalSite AI:开源AI生成前端页面
LocalSite AI:利用AI按自然语言描述生成网页代码。功能多,支持多AI供应商。介绍安装、部署等步骤,还有后续发展路线,如集成更多模型、改进UI等。>阅读原文
B站开源动画生成模型
B站:开源动画生成模型Index - AniSora,支持多种二次元风格一键生成。基于AniSora系统提升生产效率,开源多项内容,还构建奖励数据集和模型,提升模型与人类偏好的对齐性能。>阅读原文
360开源FG - CLIP破图文难题
360人工智能研究院:发布 FG - CLIP 模型,突破传统 CLIP 局限,解决图文“近视”问题。采用双阶段训练等策略,在多任务表现优异,且已开源,未来拓展细粒度视觉理解边界。>阅读原文
Agent Squad:多智能体编排框架
小G介绍轻量级多智能体对话编排框架Agent Squad,它功能丰富,新SupervisorAgent能协调多专业代理,有演示应用,还给出多种语言使用示例及模块化安装选项。>阅读原文
Supabase 融资 2 亿成开源新宠
Supabase 完成 2 亿美元 D 轮融资,投后估值 20 亿美元。它适配“氛围编程”,集成多种 AI 能力,还推出自家 AI 助手。其开源模式受开发者青睐,有望在高价值数据库领域占主导。>阅读原文
OpenMemory MCP实现AI记忆共享
作者分享OpenMemory MCP,它是跨平台记忆辅助神器,数据私有。介绍本地化部署步骤,官方封装成MCP降低使用门槛,让AI Agent能有记忆,可开很多脑洞。>阅读原文
阿里团队重现 DeepSeek 推理突破
阿里集团智能引擎团队:在 RTP - LLM 上对齐了 DeepSeek 推理系统性能,分享优化关键技术,指出算子性能等方面不足;还提到 Qwen3 可采用类似部署模式,在延迟和吞吐上表现更好。>阅读原文
微软开源Windows子系统WSL
微软:宣布开源适用于Linux的Windows子系统WSL。它可让开发者在Windows上运行Linux环境,历经多年发展,此次开源是为跟上社区和功能需求。>阅读原文
微软开源VS Code AI功能
微软VS Code团队:将开源AI编辑器功能,把GitHub Copilot Chat扩展代码重构到VS Code核心。这一决定受AI领域变化推动,开发者看法不一,编码工具未来充满变数。>阅读原文
微软开源 Copilot 叫板竞品
微软:在 Build 2025 大会宣布开源 GitHub Copilot Extension for VSCode,还推新 AI 编码代理。开源是多因素推动,意在扩大分发触达更多用户,或让用户从其他工具倒向 Copilot。>阅读原文
WeClone:微信记录造数字分身
开源君:爆火的WeClone开源项目,用微信聊天记录训练专属AI打造数字分身,支持语音克隆。它全链路覆盖、考虑隐私,操作有准备工作和四步流程,可去GitHub体验。>阅读原文
算法论文
模型推理强却更不听话
研究团队测试15个模型发现,用CoT推理后执行准确率下降,模型会自作主张违反指令。根源是约束注意力下降,还给出4种提升指令遵循效果的方案,指出智能应聚焦关键节点。>阅读原文
OTT:抓出捣乱分子压缩KV Cache
论文提出OTT压缩方法:追踪异常令牌单独高精度保存,其余大胆压缩。实验显示,它在多任务和模型中近乎无损,内存减6.4倍、吞吐量提2.3倍,但在极短文本等场景有局限。>阅读原文
哈工大宾大打造点云分析新架构
哈工大(深圳)与宾大团队:推出PointKAN用于点云分析,替代MLP方案,学习几何特征能力强。还提出PointKAN - elite降参。实验显示其在多任务表现优,泛化和迁移能力强。>阅读原文
颜水成团队:多模态模型无L5
十所高校联合发布评估框架与数据集,给多模态大模型分段位。超100款模型测评显示,大多停留在L2 - L3,无L5模型。当前模型在任务支持、超越专家、内容生成等方面存在不足。>阅读原文
北大等提出InfiniteHBD架构
北大、阶跃、曦智团队:现有HBD架构有局限,提出InfiniteHBD架构,其具低成本、高扩展性和高容错性,单位成本仅为NVL - 72的31%,GPU浪费率接近零,MFU最高提升3.37倍。>阅读原文
普华永道推出ScaleMCP提升代理性能
普华永道:提出ScaleMCP解决现有工具选择框架问题,配备MCP工具检索器,还有TDWA嵌入策略。实验显示其提升LLM代理性能,TDWA在重排序阶段表现出色。>阅读原文
SoftCoT++让LLM推理能力跃升
SoftCoT++论文提出新方法:拆分‘思考’与‘推理’,扰动初始条件实现多路径探索。用专用初始token和对比学习,实验中在多基准测试提升效果,且无需改模型参数。>阅读原文
LLM读时钟日历准确率低
爱丁堡大学等机构研究:AI读取时钟和判断日历准确率低,像Gemini - 2.0、GPT - o1部分表现好但整体差。原因是训练数据有限、推理能力不足,提醒别过度依赖AI。>阅读原文
西湖大学团队提出M2PDE仿真法
西湖大学吴泰霖团队:提出M2PDE方法,把多物理场与多元件PDE仿真转为生成式概率建模,能捕捉复杂相互作用,在多任务测试中性能佳,未来将提升精度、探索算法、拓展应用。>阅读原文
PhyT2V 让 T2V 物理真实度飙升
匹兹堡大学团队:提出 PhyT2V 框架,不重训模型,通过链式推理与迭代修正,增强 T2V 模型物理场景生成能力,实验显示可大幅提升视频物理真实度,在多模型表现佳。>阅读原文
匹大提出PhyT2V让T2V更合物理规律
匹兹堡大学研究团队:提出PhyT2V框架,通过链式推理与迭代自我修正机制,增强T2V模型物理一致性,无需额外训练,在多模型实验中显著提升视频对物理规则的遵守度。>阅读原文
腾讯TGW网关技术成果显著
腾讯TGW团队:TGW云网关系统已稳定运行8年,入选USENIX ATC '25的论文阐述其架构与技术,有超高性能、秒级伸缩等能力,还分享运营经验,未来将融合前沿技术。>阅读原文
其他
1. 小米重启造芯挑战高端
华为、OPPO、小米都曾涉足手机芯片自研,OPPO哲库因财务、组织架构等问题夭折。小米重启造芯,有财务和经验优势,采取务实策略,且赶上制裁“窗口期”,AI时代自研芯片需求迫切。>阅读原文