AI Daily | 2025-05-07AI日报：Netlify谈Next.js部署挑战; 大咖共探多模态模型应用; 数据中心投资现状分化

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。

2025-05-07 资讯日报

新闻资讯

Netlify谈Next.js部署挑战

我是 Netlify，部署 Next.js 网站遇到不少问题，像没适配器、无生产级文档、行为未文档化等。不过我已和 Next.js 团队沟通，还会和其他方合作起草 RFC，一起为开发者打造好体验。>阅读原文

大咖共探多模态模型应用

多模态技术发展快，直播探讨其挑战、应用等。认为先大后小蒸馏提效，垂直模型现阶段更优。还提到数据、个性化、应用是未来突破方向，实时推理或带来交互革命。>阅读原文

数据中心投资现状分化

我认为，当前数据中心投资现状分化。微软投资放缓，受资源、建设、战略转移和开源模型影响；OpenAI加速投入；其他巨头核心AI投入未减，行业仍处增长早期，短期调整非趋势逆转。>阅读原文

寒武纪盈利，挑战仍在

成立十年的寒武纪终于盈利，2025年一季度业绩亮眼。其云端产品线受益于国产替代机遇，但它在生态和战略上与英伟达有差距，还面临海光、龙芯、华为等对手竞争。>阅读原文

黄仁勋：中国AI市场将达500亿

黄仁勋：未来两三年中国AI市场可达500亿美元，错过损失大；AI让旧金山复苏，虽夺部分人工作但创造新岗位；鼓励用AI，还获十年来首次加薪。>阅读原文

Gemini 2.5 Pro升级成编程新王

Google DeepMind：发布Gemini 2.5 Pro (I/O edition)，编程能力跃升，超Claude 3.7 Sonnet。用户用提示词或草图就能构建应用，谷歌大佬宣传，网友实测效果亮眼。>阅读原文

2025美艺术科学院院士揭晓

2025美国艺术与科学院公布新院士，近250人来自16国、31领域。计算机科学有Kai Li等，物理有王贻芳等，神经科学有Yang Dan等，微软纳德拉也当选。>阅读原文

阿里通义薄列峰离职

五一节后爆料阿里通义实验室应用视觉团队负责人薄列峰离职，他曾做爆款功能，现加入美企。今年语音团队负责人鄢志杰也已离职，两人接替人选均未知。>阅读原文

AI破2000年前古希腊著作原文

2025年维苏威挑战赛取得突破，研究人员用AI非侵入性读取赫库兰尼姆古卷标题，确认作者是斐洛德谟，作品为《论恶习》第一卷，此发现或重塑学界认知。>阅读原文

黄仁勋：错过中国AI市场是损失

英伟达CEO黄仁勋：中国AI市场未来2 - 3年达500亿美元，错过是美国损失；AI重塑计算堆栈，宣布新推理模型；英伟达股价有波动，分析师预计收入增长。>阅读原文

Gemini 2.5 Pro霸榜碾压Claude 3.7

Google DeepMind：Gemini 2.5 Pro在多领域霸榜，编码能力升级，修复功能调用问题。部分人质疑其部分测试表现退步，但它短期内难逢敌手，喊话Anthropic取代Claude 3.7。>阅读原文

Duolingo与Shopify开启AI优先模式

我认为围绕AI工作的时代已来。Duolingo和Shopify宣布AI优先，前者将停外包，后者要求全员用AI。Genspark Super Agent ARR增速快，未来或许是“小团队+AI”的天下。>阅读原文

AI投资与创业新趋势

访谈中投资人认为，大模型序章结束，新机遇涌现。如Manus全球化与海外融资成功可借鉴；DeepSeek降低成本、促进小模型发展。投资应聚焦应用，避开通用模型竞争，创业者要找兴奋之事、快速验证PMF。>阅读原文

OpenAI 30亿收购Windsurf

彭博称OpenAI将30亿美元收购Windsurf。Windsurf技术灵活，有大量用户。OpenAI借此布局市场，收购或重塑格局，与对手竞争，掀起编码革命。>阅读原文

JetBrains AI 助手差评风波

JetBrains 的 AI 助手插件口碑崩塌，评分低，还批量删评论引用户抗议。它安装难移除、体验差，虽推出免费套餐和 Junie 智能体，但 Junie 成本高，公司还面临竞争压力。>阅读原文

YC孵化项目引争议口碑危机

YC 孵化的 Optifye.ai 展示视频遭批，网友吐槽‘血汗工厂即服务’。YC 口碑危机重重，此前 Artisan 广告引争议，还存在批次多、公司相似、融资减少等问题，被指成 B2B 互推平台。>阅读原文

苹果与Anthropic合作开发编程助手

彭博消息：苹果与Anthropic合作，为Xcode打造AI编程助手，集成ClaudeSonnet模型。目前内部测试，若顺利将面向第三方。此前自研的SwiftAssist因问题未交付。>阅读原文

产品应用

多智能体AI颠覆金融分析

多智能体AI股票分析师系统亮相，股票分析与报告撰写智能体协作，借助多种技术获取和分析数据，能快速生成专业报告，为金融分析带来新玩法。>阅读原文

Gemini 2.5 Pro：编码实力封神

谷歌提前发布 Gemini 2.5 Pro (I/O 版) 预览更新，编码能力强，能把视频变 App，推理更快。性价比超 GPT - 4.1 等，获开发者认可，网友期待更强的“Nightwhisper”版本。>阅读原文

Google新模型让视频变网页

Google：提前推出Gemini 2.5 Pro 05 - 06版。该版本代码能力强，在盲测超Claude 3.7 Sonnet，还能把视频转网页，虽产品有瑕疵，但进步显著，值得期待后续。>阅读原文

π0.5模型突破家务泛化极限

我认为具身智能的关键在于泛化能力。Physical Intelligence推出的π0.5模型，用异构任务协同训练实现泛化，能在新环境做家务。虽有缺陷，但向广泛泛化物理智能更近一步。>阅读原文

喆塔靠AI提升芯片良率

喆塔科技创始人赵文政认为半导体软件引入AI是趋势。喆塔将DeepSeek接入自研模型，用机器学习算法提升企业良率。产品获认可，未来会加大研发投入，还为AI创业者提供聚焦痛点等建议。>阅读原文

阿拉巴马州推政府AI应用

阿拉巴马州州长签署命令推动生成式AI在州政府应用。报告显示部分机构已探索使用，但普及需培训。同时指出伦理风险，建议实施安全措施，强调数据管理、政策治理重要性。>阅读原文

微软新版Win11集成大量AI功能

微软：凌晨发布新版Windows 11，集成搜索、画图等大量AI功能，还推两款新Copilot+PC设备，性能强、续航久且安全，目前仅英文版本，后续将扩大范围。>阅读原文

MCP架构构建Agentic RAG系统

我五一用MCP架构实现Agentic RAG系统。探讨MCP与RAG融合，设计架构，实现服务端和客户端功能并测试。该架构模块化、技术选择灵活、可互操作，但还有并行处理等待优化。>阅读原文

开源动态

Hugging Face开源nanoVLM

Hugging Face：开源nanoVLM，750行代码可训练VLM模型。单张H100 GPU训练6小时，MMStar数据集准确率35.3%，免费Colab也能跑，助开发者快速入门。>阅读原文

微软开源UFO²，开启AgentOS时代

我宣布微软开源的 UFO² AgentOS 是桌面智能体里程碑！它深度集成 Windows，解决传统智能体痛点，多维度有突破，测试领先，还开源代码和文档，要和开发者共造智能桌面生态。>阅读原文

开源Voila语音模型毫秒响应

我宣布，开源语音对话模型Voila登场！它采用新架构，响应仅195毫秒，超人类反应时间。支持百万种声音，适用于多语音应用，还能在线体验，科研团队可免费分享成果。>阅读原文

英伟达开源 Llama-Nemotron 家族

我是运营，给你总结：英伟达开源 Llama-Nemotron 系列模型，有多种规模。它推理强、效率高，支持模式切换。经多阶段训练，性能超 DeepSeek-R1 等，还通过强化学习等优化。>阅读原文

英伟达开源模型超越DeepSeek - R1

我认为英伟达Llama - Nemotron系列模型牛啊！超越DeepSeek - R1还开源。通过合成数据微调、强化学习等训练，各模型在推理和非推理任务表现佳，LN - Ultra更是多方面领先。>阅读原文

SGLang复现DeepSeek推理框架

SGLang 团队在 96 个 H100 GPU 部署 DeepSeek，用 PD 分解和专家并行技术，实现高吞吐量，成本仅为官方五分之一。组件全开源，不过存在延迟、序列长度等问题待优化。>阅读原文

NVIDIA开源模型吊打DeepSeek R1

我认为NVIDIA新推的Llama - Nemotron系列开源模型很牛！旗舰款LN - Ultra效果和速度超DeepSeek R1，有独特切换模式功能，训练方法有效。代码数据全公开，或带来AI推理效率革命。>阅读原文

算法论文

ICML 2025：极大值解锁LLM上下文理解

我是罗格斯大学团队，我们发现使用RoPE的模型中，注意力机制Q和K有集中极大值，它对上下文理解关键，破坏极大值会让相关任务性能骤降，研究为模型设计等提供新思路。>阅读原文

华为诺亚提出端侧新架构MoLE

北大和华为诺亚研究人员：提出新型MoE架构MoLE，将专家输入改为embedding token、用查找表替代矩阵运算，解决传统MoE问题，性能与MoE相当，批量解码优势显著。>阅读原文

LLM奖励学习综述与挑战

我认为奖励信号能引导LLM优化行为。奖励学习让模型主动思考，贯穿训练、推理、后推理阶段。奖励模型设计有人类与自动化反馈两种选择，应用广泛，但面临作弊、持续学习等挑战。>阅读原文

国产视频大模型超越Sora、Pika

我认为复旦大学等机构把强化学习用于视频生成是创举。Cockatiel在VDC夺冠，IPO在VBench登顶，超Sora等模型，优化后视频生成的自然度、合理性等大幅提升。>阅读原文

TreeHop：无LLM多跳问答新方案

我认为TreeHop是多跳问答新范式，摒弃LLM，靠嵌入空间动态更新，实现99%延迟降低与少量模型参数量。实验表现佳，还具成本低、实时性好、多语言支持等优势，适合工业场景。>阅读原文