All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。
2025-06-10 资讯日报
新闻资讯
李飞飞:世界模型是智能下一程
李飞飞:因眼伤意识到立体视觉重要性,语言对物理世界表征有缺陷,真正通用智能需理解物理世界。她与Martin Casado看法契合,创立World Labs,要让AI获得空间认知能力。>阅读原文
孟旭:AI重塑学习硬件成伙伴
网易有道孟旭:学习硬件迭代呈螺旋式发展,有道AI答疑笔借助大模型,从工具变伙伴,解决多学科难题。未来或实现AI Agent与教育生态融合,整合学习流程。>阅读原文
苹果发布会:市值缩水AI难突破
苹果发布会开场6分钟市值缩水750亿美元,因Siri更新推迟。虽有AI更新,如集成ChatGPT、推新框架,但用户和投资者不买账。分析师称其AI难突破,或与第三方合作。>阅读原文
TypeScript 挑战 Python AI 地位
Mastra AI 创始人:约 60 - 70% YC 创企用 TypeScript 构建 AI Agent。网友认为其有跨平台开发等优势。业内普遍觉得 Python 难被取代,但 TypeScript 是有吸引力的替代方案。>阅读原文
Ilya:AI 终将无所不能
Ilya Sutskever:AI 终将无所不能,人类应接受现实,多体验顶尖 AI 形成直觉。AI 带来的挑战巨大,但克服它回报也大,要关注并解决相关问题。>阅读原文
Matt White:AI 应用应润物细无声
Matt White:‘开放’正被‘漂白’,应以许可证定义‘开放’;技术应‘润物细无声’;要警惕数字内容真实性危机;老师先掌握 AI 才能教好学生。>阅读原文
富士康再谋印度造芯
富士康获印度批准,与HCL合资建显示驱动芯片厂,预计2027年投产。这是其二度在印谋芯片项目,此前有过失败经历,此次先做封测代工,后续发展挑战多。>阅读原文
o3破解数学难题却有短板
Epoch AI报告:o3 - mini - high能破数学难题,有学识会直觉解题,但有短板,如缺乏精确性、创造力,还存在幻觉问题,未来推理模型思维或与人类差异增大。>阅读原文
Ilya:AI是人类最大挑战机遇
Ilya Sutskever:接受现实,不为过去懊悔。AI极大改变学习工作,未来能胜任人类所有事,学生别忽视,要体验使用,它是人类最大挑战与机遇。>阅读原文
中科闻歌获融资拓展AI应用
中科闻歌:完成新一轮战略融资,资金用于DIOS研发推广。依托自研体系服务超千家客户,后续深耕多领域,孵化新兴应用,拓展海外市场。>阅读原文
银河通用发布两大具身智能成果
银河通用王鹤博士:在2025北京智源大会展示Galbot,其搭载的GroceryVLA是全球首个零售VLA大模型,年内计划开100家店;还开源OpenWBT,降人形机器人遥操门槛。>阅读原文
o3 - mini - high 7个月反超人类
Epoch AI:o3 - mini - high 7个月答题得分从2%到22%,超人类平均。它博学且靠直觉解题,但缺乏创造力和精确性,幻觉问题严重。弗吉尼亚大学小野健:大模型某些方面超多数研究生。>阅读原文
苹果开放大模型,集成ChatGPT
苹果软件工程高级副总裁:今年驱动Apple Intelligence的模型更强,开放基础模型访问权。新功能集成多设备,含图像生成、实时翻译等,今秋部分用户可用。>阅读原文
Memvid革新AI记忆管理遭质疑
网友:Memvid虽火,号称革新AI记忆管理,但底层用FAISS无新意,读写慢、文件大,仓库issues显示其性能与声称相反,并非RAG的革命性方案。>阅读原文
胜宏科技借AI PCB逆袭
格隆汇弗雷迪:AI算力革新推动PCB企业业绩增长,胜宏科技一季度净利润翻3倍多,预计二季度再增30%。其成英伟达核心供应商,技术优势支撑订单,未来PCB市场增长明确。>阅读原文
苹果 WWDC:AI 有亮点,Siri 成「鸽」王
苹果 WWDC:宣布系统更新,端侧模型开放,Xcode 26 助力开发。但 AI 版 Siri 跳票,股价下跌,网友认为新功能提升不大、上线慢或国内无法用,iPadOS 或替代 MacOS。>阅读原文
苹果炮轰AI推理遭大佬怒怼
苹果:推理大模型有重大缺陷。Sean Goedecke怒怼:谜题不是好测试,模型放弃是因任务繁琐,非无推理能力,未完成复杂任务≠无推理能力。>阅读原文
苹果OS 26升级,AI入侵全家桶
苹果春季WWDC上,库克带来OS全家桶重大升级。苹果AI超进化,支持实时翻译等功能;开发者工具升级,可轻松调用模型;各系统iOS、macOS等在设计和功能上均有显著革新。>阅读原文
Meta签20年核电协议促AI
Meta:与Constellation Energy签20年核电协议,规模超微软。电力来自克林顿中心,2027年供能,保能源促AI,还能留岗位,满足数据中心增长需求。>阅读原文
Yann LeCun 炮轰 Anthropic CEO
Yann LeCun 炮轰 Anthropic CEO Dario Amodei,称其要么自大要么不诚实。Amodei 反对《HR1》法案,指出 AI 发展或致初级岗位消失,虽发布 Claude 4 但模型表现遭质疑。>阅读原文
产品应用
ComfyUI - Copilot更新,说话搭工作流
阿里:ComfyUI - Copilot更新,用智能节点推荐等功能,解决ComfyUI新用户难题,还具备参数探索等功能,降低入门门槛、提升工作效率。>阅读原文
谷歌Veo 3玩法升级价格降
谷歌Veo 3玩法升级,加“360°”解锁3D效果。其Fast版速度快、同分辨率价格降80%,虽面部细节和光照有不足,但解决了漏光问题,值得关注。>阅读原文
谷歌上线10款AI应用
谷歌:在Google Labs上线10款宝藏AI应用,有生图、音乐生成、食谱定制等功能。部分项目虽在实验阶段,但完成度不错,值得把玩。>阅读原文
爱诗科技:AI视频产品全球突围
爱诗科技王长虎:两次技术转型投身AI视频创业,先To C降低创作门槛,再推API服务B端。PixVerse海外成功,‘拍我AI’国内上线需适应本土需求,创业要保持清醒。>阅读原文
MiniCPM 4.0:端侧模型王者来袭
面壁智能:MiniCPM 4.0发布,极限220倍加速,性能强,适配全平台,应用多。端侧长文本时代已至,端侧模型比赛或结束,行业格局生变。>阅读原文
大模型数学高考:讯飞星火夺冠
作者让10个大模型参加完整版数学高考,发现单选题第6题和多模态题难住大模型。讯飞星火和豆包以145分并列第一,Qwen3等排名其后,短短两年AI在高考表现进步显著。>阅读原文
A2A SDK构建服务化Agent系统
文章围绕A2A SDK教你构建“服务化”Agent系统。介绍核心架构、交互流程,展示Server端和Client端实现代码。测试显示其支持多模式交互,A2A能提升Agent互操作性,简化开发难题。>阅读原文
CRIC深度智联:房产AI的降维打击
作者评测CRIC深度智联,其与通用AI写地产研报对决中,凭独家数据库胜出。它有普通和专业两版,适用不同人群。强调AI有边界,未来通用与垂直AI将共生,人们应善用AI。>阅读原文
火山引擎发布豆包·播客模型
火山引擎发布豆包·播客模型,生成播客与真人无异,操作简单、生成快。能应对各类内容,基于端到端实时语音模型,有技术创新,后续玩法将增多,降低音频创作门槛。>阅读原文
探秘Claude Code运作机制
Kir Shatrov:Claude Code因注重通用与安全,执行任务有诸多检查,成本高、延迟大,但更可靠。虽用较贵模型,不过在命令行工具里体验佳,适合开发者日常用。>阅读原文
Liblib AI上线Kontext教程
歸藏的AI工具箱:FLUX Kontext是强大图像编辑应用,Liblib AI上线它且支持Web UI和Comfyui。作者给出保姆级教程,教你用其处理图片,如局部修改、多图融合等,还整合了图像放大流程。>阅读原文
推荐文章
MCP非万能,需理性看待
作者boyang指出,MCP是统一工具调用协议,与Function Call合作。它在本地客户端表现出色,但服务端和云端有局限。市场上MCP可用性低,需理性看待,明确其定位和边界。>阅读原文
CourseAI:分享超轻Multi - agent Water
CourseAI:当下Multi - agent领域框架复杂,现分享超轻量级Multi - agent Water,它可独立用于生产,也能扩展其他框架,文中给出核心组成及上手教程。>阅读原文
Tyler Austin:警惕AI误解危害
Tyler Austin:大语言模型无人类智慧,人们误解AI危害多,如把它当精神导师、用其替代人际互动,还存在廉价劳工问题,要认清AI本质免受害。>阅读原文
DFT:芯片测试的关键技术
文章指出,随着芯片复杂度增加,DFT技术成关键。它能提高测试效率、降低成本、缩短开发周期。不过,新兴技术带来挑战,未来需借助AI和大数据更智能化、自动化。>阅读原文
剖析Rust明星库Tokio
蓝堇:Tokio是Rust热门库,高效通用,适合网络服务等场景。它将Future封装为任务,有本地和全局队列,还引入抢占式调度缓解饥饿问题,未来会在多方面探索发展。>阅读原文
AI时代:“马斯”计量生产力
姚旭晨提出,AI时代需“马斯”计量生产力。字元是AI关键资源,却缺统一计量。当前AI算力差,AI劳动力将替代部分人力,Token或成碳硅文明分界,引发社会重构。>阅读原文
江丹阳聊AI应用架构演进
江丹阳:AI应用架构不断演进,从简易架构到Agent模式,涉及上下文增强、输入输出防护等。还介绍监控、推理性能优化技术,如批处理、并行处理等,助开发者构建和优化应用。>阅读原文
吴恩达:AI Fund 培养构建者
吴恩达:在 AI Fund,非工程同事从‘AI Python 入门课程’学起,掌握构建模块,构建了多样应用。鼓励更多团队让人人有能力用 AI 构建,现在是与 AI 编程的最佳时机。>阅读原文
开源动态
面壁MiniCPM 4.0开启端侧长文本时代
面壁智能:发布MiniCPM 4.0,实现系统级创新,推理速度最高提220倍,缓存需求降为1/4,多维度优化成行业里程碑,后续还将推更多基础及多模态模型。>阅读原文
Rowboat:开源多智能体框架超火
Rowboat:著名孵化器支持的开源多智能体开发框架,支持MCP与Agent SDK,几块组件功能强大,能开发复杂工作流,可搭建信用卡助手等,Github超2000星。>阅读原文
LeRobot:机械臂对接大模型
LeRobot 项目旨在为真实世界机器人提供便利,降低技术门槛。它包含尖端方法,有预训练模型和数据集,后续会增加真实机器人支持,还介绍了安装、使用及策略训练等内容。>阅读原文
MonkeyOCR小模型吊打大巨头
Yuliang - Liu团队:开源轻量级文档解析模型MonkeyOCR,3B参数在英文解析上超Gemini 2.5 Pro等大模型,速度快,适用多场景,不过暂不支持照片输入,盼后续优化。>阅读原文
玉盘AI发布SRDA新计算架构
玉盘AI团队:发布SRDA新计算架构白皮书。该架构以数据流为核心,解决内存瓶颈,简化网络,为开发者提升性能、降低成本,其理念和路径值得关注。>阅读原文
DocExt:本地文档抽取神器
小华:DocExt 是 Nanonets 开源项目,能全流程本地文档抽取,无 OCR、零云依赖。它优势多,适合高隐私场景,还可灵活接入模型,与同类项目各有适用场景。>阅读原文
算法论文
论文:构建知行合一的智能体
论文指出当前AI缺乏认知框架,存在行为随机、效率低等问题。提出推理等于行动,分析知识与决策边界,认为最优智能体应极简调用工具,训练要学接龙工具,未来AI将更类人。>阅读原文
主流大模型安全性能存漏洞
淘天集团团队:超60%案例中主流推理模型生成安全答案却未理解风险,存在系统性漏洞。推出Benchmark研究,发现模型推理准确性越高回答越安全,还探究了安全规则等对模型的影响。>阅读原文
斯坦福团队:LLM答案对不代表思考靠谱
斯坦福/加州大学团队:大模型答案对不代表思考靠谱,传统评估存盲点。提出双维度评估框架,发现医疗重知识储备、数学重推理效率,该框架还将解锁法律与金融场景。>阅读原文
LeCun:大模型与人类思考有本质差别
Yann LeCun团队研究:用信息论对比大模型与人类,发现AI能分类但难举一反三,和人类优化目标不同,模型大也未必像人类,结构和目标才关键。>阅读原文
FUDOKI:多模态生成新突破
香港大学王劲团队提出FUDOKI,这一基于离散流匹配架构的多模态模型,比自回归灵活、比离散扩散通用,可并行去噪、动态修正,为通用人工智能发展提供新基础。>阅读原文
7B模型Pixel Reasoner领先GPT - 4o
滑铁卢大学等团队:提出「像素空间推理」范式,打破VLM文本束缚,让其「眼脑并用」。7B的Pixel - Reasoner在测试中领先GPT - 4o等,开启多模态推理新时代。>阅读原文
浙大InftyThink解锁大模型无限推理
浙大联合北大团队:为解决大模型长上下文推理难题,提出InftyThink范式。它拆分推理、引入总结,在多基座模型实验中拓展推理深度、降低计算复杂度、提升性能,适用于小模型推理。>阅读原文
西湖大学SLOT提升模型准确率
西湖大学团队:开发SLOT方法,让模型推理时“临时学习”。无需SFT和RL,简单且计算开销小,能使模型准确率大幅提升,在各规模模型上表现出色。>阅读原文
MMAR测音频模型,开源短板尽显
MMAR团队测试30款音频模型,发现多数开源模型面对复杂推理任务未达实用水平,音乐任务全“掉链子”,有显式推理能力的模型表现更好,未来模型待提升。>阅读原文
港科大推本科数学评测基准
港科大团队:推出 UGMathBench 评测基准评估 LLM 本科数学推理能力。测试显示,当前模型推理不稳定,闭源与开源有差距,学科表现分化,在高阶概念推理和符号运算上不足。>阅读原文
其他
1. Sutton:LLM主导只是暂时
强化学习之父Richard Sutton称,大模型主导是暂时,未来五年到十年非技术前沿。AI应从依赖人类数据转向体验学习,靠扩展计算发挥强化学习潜力,不同Agent可去中心化合作。>阅读原文
2. 奇绩创坛路演57个AI项目
奇绩创坛2025春季路演,57个项目涵盖AI Agent、智能硬件等多赛道。如凌创电机降成本,埃逻科技助力工业设计降本增效,Bonjour打造Agent交互系统,各项目亮点十足。>阅读原文
Product Application
1. MCP让Cursor额度膨胀N倍
Aitrainee:Cursor额度常不够用,mcp-feedback-enhanced这个MCP工具能让其一次请求变多次,实现“无限续杯”,还给出了安装配置和持续调用优化的方法。>阅读原文
</p>