AI Daily | AI日报：李飞飞：世界模型是智能下一程; 孟旭：AI重塑学习硬件成伙伴; 苹果发布会：市值缩水AI难突破

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。

2025-06-10 资讯日报

新闻资讯

李飞飞：世界模型是智能下一程

李飞飞：因眼伤意识到立体视觉重要性，语言对物理世界表征有缺陷，真正通用智能需理解物理世界。她与Martin Casado看法契合，创立World Labs，要让AI获得空间认知能力。>阅读原文

孟旭：AI重塑学习硬件成伙伴

网易有道孟旭：学习硬件迭代呈螺旋式发展，有道AI答疑笔借助大模型，从工具变伙伴，解决多学科难题。未来或实现AI Agent与教育生态融合，整合学习流程。>阅读原文

苹果发布会：市值缩水AI难突破

苹果发布会开场6分钟市值缩水750亿美元，因Siri更新推迟。虽有AI更新，如集成ChatGPT、推新框架，但用户和投资者不买账。分析师称其AI难突破，或与第三方合作。>阅读原文

TypeScript 挑战 Python AI 地位

Mastra AI 创始人：约 60 - 70% YC 创企用 TypeScript 构建 AI Agent。网友认为其有跨平台开发等优势。业内普遍觉得 Python 难被取代，但 TypeScript 是有吸引力的替代方案。>阅读原文

Ilya：AI 终将无所不能

Ilya Sutskever：AI 终将无所不能，人类应接受现实，多体验顶尖 AI 形成直觉。AI 带来的挑战巨大，但克服它回报也大，要关注并解决相关问题。>阅读原文

Matt White：AI 应用应润物细无声

Matt White：‘开放’正被‘漂白’，应以许可证定义‘开放’；技术应‘润物细无声’；要警惕数字内容真实性危机；老师先掌握 AI 才能教好学生。>阅读原文

富士康再谋印度造芯

富士康获印度批准，与HCL合资建显示驱动芯片厂，预计2027年投产。这是其二度在印谋芯片项目，此前有过失败经历，此次先做封测代工，后续发展挑战多。>阅读原文

o3破解数学难题却有短板

Epoch AI报告：o3 - mini - high能破数学难题，有学识会直觉解题，但有短板，如缺乏精确性、创造力，还存在幻觉问题，未来推理模型思维或与人类差异增大。>阅读原文

Ilya：AI是人类最大挑战机遇

Ilya Sutskever：接受现实，不为过去懊悔。AI极大改变学习工作，未来能胜任人类所有事，学生别忽视，要体验使用，它是人类最大挑战与机遇。>阅读原文

中科闻歌获融资拓展AI应用

中科闻歌：完成新一轮战略融资，资金用于DIOS研发推广。依托自研体系服务超千家客户，后续深耕多领域，孵化新兴应用，拓展海外市场。>阅读原文

银河通用发布两大具身智能成果

银河通用王鹤博士：在2025北京智源大会展示Galbot，其搭载的GroceryVLA是全球首个零售VLA大模型，年内计划开100家店；还开源OpenWBT，降人形机器人遥操门槛。>阅读原文

o3 - mini - high 7个月反超人类

Epoch AI：o3 - mini - high 7个月答题得分从2%到22%，超人类平均。它博学且靠直觉解题，但缺乏创造力和精确性，幻觉问题严重。弗吉尼亚大学小野健：大模型某些方面超多数研究生。>阅读原文

苹果开放大模型，集成ChatGPT

苹果软件工程高级副总裁：今年驱动Apple Intelligence的模型更强，开放基础模型访问权。新功能集成多设备，含图像生成、实时翻译等，今秋部分用户可用。>阅读原文

Memvid革新AI记忆管理遭质疑

网友：Memvid虽火，号称革新AI记忆管理，但底层用FAISS无新意，读写慢、文件大，仓库issues显示其性能与声称相反，并非RAG的革命性方案。>阅读原文

胜宏科技借AI PCB逆袭

格隆汇弗雷迪：AI算力革新推动PCB企业业绩增长，胜宏科技一季度净利润翻3倍多，预计二季度再增30%。其成英伟达核心供应商，技术优势支撑订单，未来PCB市场增长明确。>阅读原文

苹果 WWDC：AI 有亮点，Siri 成「鸽」王

苹果 WWDC：宣布系统更新，端侧模型开放，Xcode 26 助力开发。但 AI 版 Siri 跳票，股价下跌，网友认为新功能提升不大、上线慢或国内无法用，iPadOS 或替代 MacOS。>阅读原文

苹果炮轰AI推理遭大佬怒怼

苹果：推理大模型有重大缺陷。Sean Goedecke怒怼：谜题不是好测试，模型放弃是因任务繁琐，非无推理能力，未完成复杂任务≠无推理能力。>阅读原文

苹果OS 26升级，AI入侵全家桶

苹果春季WWDC上，库克带来OS全家桶重大升级。苹果AI超进化，支持实时翻译等功能；开发者工具升级，可轻松调用模型；各系统iOS、macOS等在设计和功能上均有显著革新。>阅读原文

Meta签20年核电协议促AI

Meta：与Constellation Energy签20年核电协议，规模超微软。电力来自克林顿中心，2027年供能，保能源促AI，还能留岗位，满足数据中心增长需求。>阅读原文

Yann LeCun 炮轰 Anthropic CEO

Yann LeCun 炮轰 Anthropic CEO Dario Amodei，称其要么自大要么不诚实。Amodei 反对《HR1》法案，指出 AI 发展或致初级岗位消失，虽发布 Claude 4 但模型表现遭质疑。>阅读原文

产品应用

ComfyUI - Copilot更新，说话搭工作流

阿里：ComfyUI - Copilot更新，用智能节点推荐等功能，解决ComfyUI新用户难题，还具备参数探索等功能，降低入门门槛、提升工作效率。>阅读原文

谷歌Veo 3玩法升级价格降

谷歌Veo 3玩法升级，加“360°”解锁3D效果。其Fast版速度快、同分辨率价格降80%，虽面部细节和光照有不足，但解决了漏光问题，值得关注。>阅读原文

谷歌上线10款AI应用

谷歌：在Google Labs上线10款宝藏AI应用，有生图、音乐生成、食谱定制等功能。部分项目虽在实验阶段，但完成度不错，值得把玩。>阅读原文

爱诗科技：AI视频产品全球突围

爱诗科技王长虎：两次技术转型投身AI视频创业，先To C降低创作门槛，再推API服务B端。PixVerse海外成功，‘拍我AI’国内上线需适应本土需求，创业要保持清醒。>阅读原文

MiniCPM 4.0：端侧模型王者来袭

面壁智能：MiniCPM 4.0发布，极限220倍加速，性能强，适配全平台，应用多。端侧长文本时代已至，端侧模型比赛或结束，行业格局生变。>阅读原文

大模型数学高考：讯飞星火夺冠

作者让10个大模型参加完整版数学高考，发现单选题第6题和多模态题难住大模型。讯飞星火和豆包以145分并列第一，Qwen3等排名其后，短短两年AI在高考表现进步显著。>阅读原文

A2A SDK构建服务化Agent系统

文章围绕A2A SDK教你构建“服务化”Agent系统。介绍核心架构、交互流程，展示Server端和Client端实现代码。测试显示其支持多模式交互，A2A能提升Agent互操作性，简化开发难题。>阅读原文

CRIC深度智联：房产AI的降维打击

作者评测CRIC深度智联，其与通用AI写地产研报对决中，凭独家数据库胜出。它有普通和专业两版，适用不同人群。强调AI有边界，未来通用与垂直AI将共生，人们应善用AI。>阅读原文

火山引擎发布豆包·播客模型

火山引擎发布豆包·播客模型，生成播客与真人无异，操作简单、生成快。能应对各类内容，基于端到端实时语音模型，有技术创新，后续玩法将增多，降低音频创作门槛。>阅读原文

探秘Claude Code运作机制

Kir Shatrov：Claude Code因注重通用与安全，执行任务有诸多检查，成本高、延迟大，但更可靠。虽用较贵模型，不过在命令行工具里体验佳，适合开发者日常用。>阅读原文

Liblib AI上线Kontext教程

歸藏的AI工具箱：FLUX Kontext是强大图像编辑应用，Liblib AI上线它且支持Web UI和Comfyui。作者给出保姆级教程，教你用其处理图片，如局部修改、多图融合等，还整合了图像放大流程。>阅读原文

开源动态

面壁MiniCPM 4.0开启端侧长文本时代

面壁智能：发布MiniCPM 4.0，实现系统级创新，推理速度最高提220倍，缓存需求降为1/4，多维度优化成行业里程碑，后续还将推更多基础及多模态模型。>阅读原文

Rowboat：开源多智能体框架超火

Rowboat：著名孵化器支持的开源多智能体开发框架，支持MCP与Agent SDK，几块组件功能强大，能开发复杂工作流，可搭建信用卡助手等，Github超2000星。>阅读原文

LeRobot：机械臂对接大模型

LeRobot 项目旨在为真实世界机器人提供便利，降低技术门槛。它包含尖端方法，有预训练模型和数据集，后续会增加真实机器人支持，还介绍了安装、使用及策略训练等内容。>阅读原文

MonkeyOCR小模型吊打大巨头

Yuliang - Liu团队：开源轻量级文档解析模型MonkeyOCR，3B参数在英文解析上超Gemini 2.5 Pro等大模型，速度快，适用多场景，不过暂不支持照片输入，盼后续优化。>阅读原文

玉盘AI发布SRDA新计算架构

玉盘AI团队：发布SRDA新计算架构白皮书。该架构以数据流为核心，解决内存瓶颈，简化网络，为开发者提升性能、降低成本，其理念和路径值得关注。>阅读原文

DocExt：本地文档抽取神器

小华：DocExt 是 Nanonets 开源项目，能全流程本地文档抽取，无 OCR、零云依赖。它优势多，适合高隐私场景，还可灵活接入模型，与同类项目各有适用场景。>阅读原文

算法论文

论文：构建知行合一的智能体

论文指出当前AI缺乏认知框架，存在行为随机、效率低等问题。提出推理等于行动，分析知识与决策边界，认为最优智能体应极简调用工具，训练要学接龙工具，未来AI将更类人。>阅读原文

主流大模型安全性能存漏洞

淘天集团团队：超60%案例中主流推理模型生成安全答案却未理解风险，存在系统性漏洞。推出Benchmark研究，发现模型推理准确性越高回答越安全，还探究了安全规则等对模型的影响。>阅读原文

斯坦福团队：LLM答案对不代表思考靠谱

斯坦福/加州大学团队：大模型答案对不代表思考靠谱，传统评估存盲点。提出双维度评估框架，发现医疗重知识储备、数学重推理效率，该框架还将解锁法律与金融场景。>阅读原文

LeCun：大模型与人类思考有本质差别

Yann LeCun团队研究：用信息论对比大模型与人类，发现AI能分类但难举一反三，和人类优化目标不同，模型大也未必像人类，结构和目标才关键。>阅读原文

FUDOKI：多模态生成新突破

香港大学王劲团队提出FUDOKI，这一基于离散流匹配架构的多模态模型，比自回归灵活、比离散扩散通用，可并行去噪、动态修正，为通用人工智能发展提供新基础。>阅读原文

7B模型Pixel Reasoner领先GPT - 4o

滑铁卢大学等团队：提出「像素空间推理」范式，打破VLM文本束缚，让其「眼脑并用」。7B的Pixel - Reasoner在测试中领先GPT - 4o等，开启多模态推理新时代。>阅读原文

浙大InftyThink解锁大模型无限推理

浙大联合北大团队：为解决大模型长上下文推理难题，提出InftyThink范式。它拆分推理、引入总结，在多基座模型实验中拓展推理深度、降低计算复杂度、提升性能，适用于小模型推理。>阅读原文

西湖大学SLOT提升模型准确率

西湖大学团队：开发SLOT方法，让模型推理时“临时学习”。无需SFT和RL，简单且计算开销小，能使模型准确率大幅提升，在各规模模型上表现出色。>阅读原文

MMAR测音频模型，开源短板尽显

MMAR团队测试30款音频模型，发现多数开源模型面对复杂推理任务未达实用水平，音乐任务全“掉链子”，有显式推理能力的模型表现更好，未来模型待提升。>阅读原文

港科大推本科数学评测基准

港科大团队：推出 UGMathBench 评测基准评估 LLM 本科数学推理能力。测试显示，当前模型推理不稳定，闭源与开源有差距，学科表现分化，在高阶概念推理和符号运算上不足。>阅读原文

其他

1. Sutton：LLM主导只是暂时

强化学习之父Richard Sutton称，大模型主导是暂时，未来五年到十年非技术前沿。AI应从依赖人类数据转向体验学习，靠扩展计算发挥强化学习潜力，不同Agent可去中心化合作。>阅读原文

2. 奇绩创坛路演57个AI项目

奇绩创坛2025春季路演，57个项目涵盖AI Agent、智能硬件等多赛道。如凌创电机降成本，埃逻科技助力工业设计降本增效，Bonjour打造Agent交互系统，各项目亮点十足。>阅读原文

Product Application

1. MCP让Cursor额度膨胀N倍

Aitrainee：Cursor额度常不够用，mcp-feedback-enhanced这个MCP工具能让其一次请求变多次，实现“无限续杯”，还给出了安装配置和持续调用优化的方法。>阅读原文

    </p>

官网：www.AiReadingHub.com