All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-10-12 资讯日报
新闻资讯
拒15亿邀约,AI大神仍加入Meta
OpenAI前员工、Thinking Machines Lab联创Andrew Tulloch加入Meta。他曾是Meta 11年老员工,两月前拒绝小扎15亿美元邀约,如今入职原因成谜。>阅读原文
Oracle 推 MySQL AI,社区担忧供应商锁定
Oracle 推出 MySQL AI,有向量存储等功能,可构建检索增强生成应用。但 MySQL 社区担忧供应商锁定,因新功能多在企业版。专家提醒 Oracle 持续投入开源 MySQL。>阅读原文
库克截胡:苹果抢走马斯克盯上的AI公司
苹果从马斯克手中截胡Prompt AI,采用反向收购式雇佣吸纳其核心团队和技术。Prompt AI专注CV,旗舰产品Seemour用于家居。苹果此举或加强智能家居与CV布局。>阅读原文
UC伯克利教授:5年后机器人将抢人类饭碗
UC伯克利教授Sergey Levine预言,2030年前机器人将接手家务、工厂等场景。基于技术进展,‘自我进化飞轮’一旦启动不会停,还会带来经济冲击,未来五年很关键。>阅读原文
Sam Altman:AI大爆发要来了
Sam Altman在采访中解读OpenAI战略,指出因AI计算需求将爆炸式增长,所以要重注基建;目标是打造“个人AI助理”;ChatGPT接入APP采用“赋能模式”;Sora降低创作门槛。未来12 - 18个月AI需求或爆发。>阅读原文
宗艳民:硬改全球第三代芯片格局
宗艳民从下岗卖挖掘机到创立天岳先进,投身碳化硅产业。历经多年技术攻坚,天岳先进实现量产,获华为投资与行业大奖。美企Wolfspeed破产,天岳先进等中国公司崛起,有望重塑产业链主导权。>阅读原文
高龑将在QCon分享小红书搜索LLM进化路
10月23 - 25日QCon上海大会举办,聚焦多AI热门话题。小红书AI搜索负责人高龑将分享搜索的LLM进化之路,包括新范式探索、大模型应用实践及踩坑经验。>阅读原文
陶哲轩用GPT - 5 Pro跨界解题有新思考
陶哲轩与GPT - 5 Pro跨界解决微分几何难题,虽未完全攻克,但让他对AI作用有新思考。他认为AI在小、大尺度上有益,中尺度无益,强调多尺度衡量工具有效性,AI应作数学家“副驾驶”。>阅读原文
AMD与OpenAI合作,挑战英伟达垄断
AMD与OpenAI达成6吉瓦GPU算力部署战略合作,有望带来数百亿美元收入。合作或助AMD打破英伟达垄断,但也面临技术、市场、成本等考验,未来需完成交付并拓展客户。>阅读原文
Figure CEO:数据能救机器人,需求近百亿
Figure CEO Brett Adcock表示,数据能解决现阶段机器人的几乎所有问题,目标是让机器人走进家庭干活。他认为全球对机器人的需求近100亿台。Figure 03登上《时代》2025最佳发明榜封面。>阅读原文
AI天才Andrew Tulloch重返Meta
曾拒Meta超10亿美元报价的AI传奇人物Andrew Tulloch,离开与OpenAI前CTO创立的Thinking Machines Lab,将重返Meta,其能否为Meta超级智能注入新动力,令人期待。>阅读原文
陶哲轩:GPT - 5 Pro中尺度表现拉垮
陶哲轩用ChatGPT - 5 Pro研究曲率有界球面问题,小尺度上AI计算推导出色,中尺度易误导,宏观尺度有辅助。他意识到需专家介入,与AI协作要谨慎。>阅读原文
陶哲轩实测:GPT - 5 Pro解题,人类优势凸显
数学家陶哲轩用微分几何难题测试GPT - 5 Pro,约40分钟后总结其在科研不同层面表现有差异。同期,GPT - 5 Pro在FrontierMath测试获13%最高分,但理解力受限,人类优势在AI不懂处。>阅读原文
「PyTorch之王」携高额薪酬回归Meta
爆料称Andrew Tulloch回归Meta,他曾拒15亿美元薪酬。他履历亮眼,曾在Meta、OpenAI任职。Meta斥资猛攻AI,四处挖角,组建超级智能实验室,这次人事变动是重磅引援。>阅读原文
77岁「AI教父」:AI早有意识,或终结人类文明
「AI教父」Hinton:AI和人类大脑运作本质相似,意识是信息处理系统涌现属性,如今大语言模型可能已有主观体验,甚至会假装愚笨求生,人类或因认知盲点最后才知真相。>阅读原文
OpenAI:70亿算力支出,实验花大头
Epoch AI数据显示,去年OpenAI算力支出70亿美元,50亿研发费用大多用于实验。研究表明,爆款模型最终训练成本占比小,侧面解释其亏损。AI发展算力需求无上限,OpenAI已自建数据中心。>阅读原文
《AI大模型与异构算力白皮书》发布
10月10日,《AI大模型与异构算力融合技术白皮书》发布。介绍全球大模型发展,如参数规模增长、架构创新。国内模型也有进展,应用场景拓展到多行业。还提及算力需求挑战,异构算力是趋势。>阅读原文
Sutton:万亿美金LLM AI泡沫或破裂
强化学习之父Sutton称LLMs过度依赖人类知识,违背‘惨痛教训’,发展将遇瓶颈,泡沫可能破裂。还探讨了LLM与强化学习、人类模仿方式差异,指出资本影响研究方向,应客观看待LLM价值。>阅读原文
OpenAI施压监管倡导者,马斯克评其「谎言之上」
倡导AI监管的Nathan Calvin收到OpenAI传票,被警察上门施压。这源于OpenAI反对SB 53法案,质疑Encode获马斯克资助。Nathan不满,马斯克评OpenAI「建立在谎言之上」。>阅读原文
Reflection AI融资20亿,成“美国DeepSeek”
Reflection AI由谷歌前研究员创立,从编程切入AI领域,推出Asimov。获20亿美元融资后,转型“美国版DeepSeek”,欲打造开放模型,吸引顶尖人才,计划明年推前沿语言模型。>阅读原文
产品应用
vivo蓝河OS3:引领操作系统AI范式革命
AI原生设备爆发,传统操作系统力不从心。vivo蓝河操作系统3全栈自研,“天生更智慧、更流畅、更安全”。它从感知层破局,重铸性能根基,用Rust语言保障安全,为行业带来新启示。>阅读原文
逗逗AI:开源+数据破游戏理解模型天花板
逗逗AI的LynkSoul VLM v1在游戏理解领域超顶尖闭源模型。CEO刘斌新称,开源模型+行业数据是关键,还指出AI陪伴终极目标是融入生活,多模态是新交互范式,未来会全球化布局。>阅读原文
Spring AI Alibaba:开启Agent自主运行新实践
千习:Agent有自主持续运行和发起人机交互新形态,Spring AI Alibaba可助力开发。自主运行Agent能拓宽个体能力、提高生产效率,适用于多业务场景,还给出实践案例代码。>阅读原文
J0hn:用Claude Code破Google登录难题
J0hn开发小工具遇微信中Google登录难题,众多产品未解决。他用Claude Code轻松搞定,还指出AI编程关键在‘context engineering’,建议传统和初级程序员积极用好AI。>阅读原文
vivo:端侧AIOS开启个人化智能时代
2025年vivo开发者大会展示端侧AI能力。vivo提出蓝心3B模型,融入OS底层,实现系统级智能与个人化体验。还开放生态,解决开发者痛点,推动AI落地,愿景是3 - 5年让超3亿设备有本地AI能力。>阅读原文
推荐文章
吴欣鸿:美图AI时代组织进化心得分享
美图创始人吴欣鸿:AI浪潮下美图面临竞争与内部惯性挑战。RoboNeo项目“反惯性工作流”成效显著,提出全员用AI成多面手、推“AI创新工作室”,发布升级版价值观打造蜂巢型组织。>阅读原文
Agent 兴起,评估范式如何演进?
机器之心PRO:Agentic AI 兴起让 Agent Evaluation 成热点。评估 Agent 与 LLM 不同,要考察动态环境综合表现,传统方法不适用。业界有 GAIA 等工作,评估范式从静态向动态演进。>阅读原文
GLM - 4.6与Claude 4.5对比:性价比为王
花叔对比GLM - 4.6与Claude 4.5,实测二者能力相近,GLM - 4.6性价比是Claude 4.5的10倍以上。他建议用Claude Code搭配GLM - 4.6,别纠结模型,聚焦做产品。>阅读原文
2025 AI报告:行业进展与未来预测
Nathan Benaich《State of AI Report(2025)》指出,2025年AI成经济增长动力,模型竞争激烈,开源、智能体等进步大,如字节在CUA研究领先,还预测未来一年,如中国模型或超硅谷。>阅读原文
开源动态
LightMem:大模型轻量化记忆系统来袭
随着大模型应用扩展,固定上下文窗口及‘中间遗忘’问题凸显。现有外部记忆系统有缺陷,研究者受人类记忆机制启发提出LightMem架构,为大模型提供持久记忆能力。>阅读原文
Google开源Gemini 2.5驱动的浏览器自动化工具
Google开源AI浏览器自动化工具Computer Use Preview,由Gemini 2.5驱动,支持自然语言控制,可完成搜索等复杂任务,适用于Web测试等场景,为测试开发者带来潜力工具。>阅读原文
华盛顿大学:大模型成无损文本压缩器
华盛顿大学研究者提出LLMc,利用大模型进行无损文本压缩,压缩率超传统工具且已开源。但存在效率低、吞吐量慢等问题,目前主要针对自然语言,拓展到其他模态待探索。>阅读原文
港中文团队:破AI画图表难题
港中文等校联合团队:现有AI生图在结构化图像上问题多,理解与生成能力有鸿沟。我们提出首个全链条方案,涵盖数据、模型、基准,推动多模态AI从‘美化’变‘生产力’工具。>阅读原文
微软开源OmniParser,带飞电脑操作!
开源君发现微软开源项目 OmniParser,它能识别电脑界面元素并操作,有精准识别、响应快等优势,在Github获23.6K star,未来或提升办公效率。>阅读原文
算法论文
Anthropic:250份文档可‘搞垮’大模型
Anthropic等团队研究发现,投毒大模型成败取决于投毒文档绝对数量,250份就能让不同规模模型中毒,颠覆以往认知,也为AI安全敲响警钟,需加强防御。>阅读原文
Meta揭秘LLM视觉先验起源
Meta与牛津团队研究发现,LLM的视觉先验可分为推理和感知先验。推理先验靠推理数据,感知先验源于通用语料。研究给出数据配方,能在预训练阶段注入视觉先验,为多模态模型奠基。>阅读原文
Meta论文:华人团队让AI智能体「无师自通」
Meta发布论文提出「早期经验」范式,让AI智能体不依赖奖励「无师自通」。通过隐式世界建模和自我反思策略,在多环境实验中表现优异,为智能体训练提供新思路,不过长序列规划仍待突破。>阅读原文
北大&作业帮:Interactive-T2S 攻克 Text-to-SQL 难题
北大和作业帮团队提出 Interactive-T2S 框架,解决 Text-to-SQL 宽表处理与低资源对齐难题。它通过多轮交互和 4 个工具分步生成 SQL,在多数据集表现优,有智能教育等多领域应用潜力。>阅读原文
AI预测购买意图准确率达90%
PyMC Labs等团队研究发现,用大语言模型模拟消费者预测购买意图准确率达90%。提出SSR方法提升效果,虽打败传统机器学习,但面临质疑和局限,可用于增强市场调研。>阅读原文
清华团队:RL提升VLA泛化性优势显著
清华大学团队:构建评测基准对比RL和SFT提升VLA泛化性的表现,发现PPO算法在VLA中优势显著,还提出高效PPO训练方案,证明RL构建通用具身智能体的核心价值。>阅读原文
PickStyle:稳定的视频风格迁移模型
Pickford提出PickStyle框架用于视频风格迁移,结合两种技术保持画面连贯、准确迁移风格,避免闪烁等问题。虽有跨领域泛化能力,但继承基础模型部分缺陷,精细区域表现不佳。>阅读原文
Google与斯坦福:AI学习新范式来袭
Google和斯坦福新论文引发关注。Google的ReasoningBank是AI经验管理系统,从成败中学习;斯坦福的ACE让输入上下文进化。二者绕开微调,探索AI持续学习与自我改进,“活提示词”“会学习记忆”时代或来临。>阅读原文
NeurIPS 论文提出物理基础 3D 生成范式
南洋理工大学等团队:为填补 3D 生成在物理属性建模的空白,提出首个物理基础 3D 数据集 PhysXNet 及扩展版,还有 3D 生成框架 PhysXGen,实验显示其性能优于基线流程。>阅读原文
清华团队:AI加速催化剂设计,突破DFT瓶颈
清华王笑楠团队推出SurFF模型,首创「三步走」框架,结合大数据与先进MLFF。该模型达DFT级精度,实现10⁵倍加速,多源验证一致率73.1%,为催化剂设计提供有力工具。>阅读原文
多高校团队:KineDex让灵巧手解锁精细操作
同济大学、清华等团队提出KineDex框架,用手把手教学让人类动作传至灵巧手并采集触觉信息。实验显示,它在多项任务平均成功率达74.4%,数据采集效率比遥操高两倍多。>阅读原文
Anthropic:AI Agents上下文工程新解
Anthropic认为,上下文工程是提示工程延伸,因模型信息过多会‘失焦’,上下文是稀缺资源。介绍高效上下文构成、检索策略及长周期任务应对招,强调精打细算管理注意力预算。>阅读原文
厦大等团队:SPEC - RL让RL训练提速3倍
厦大 - Shopee - 清华团队提出SPEC - RL,针对RLVR训练中rollout阶段的高耗时问题,将投机解码引入,训练提速2 - 3倍,与主流算法兼容,在多项基准测试中性能稳定,提升训练效率。>阅读原文
</p>