All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-11-12 资讯日报
新闻资讯
LeCun与小扎决裂,离Meta投身世界模型创业
FT消息,65岁图灵奖得主LeCun将离Meta创业,专注「世界模型」。他认为LLM无法通往AGI,而Meta战略转向快速推产品,与他理念不合,其长期领导的FAIR被边缘化。>阅读原文
安谋科技:大会展示AI多领域成果
安谋科技Arm China出席2025全球计算大会,其参与撰写的报告提出“算力经济绿色发展指数”;推进本地化标准建设;“周易”NPU IP将为具身智能落地助力,持续赋能中国AI计算产业。>阅读原文
NVIDIA OmniVinci性能强,却因‘假开源’被骂
NVIDIA 发布 OmniVinci,虽训练 token少但性能超 Qwen2.5 - Omni。研究人员称多模态相互强化,应用前景广。不过其限制商业用途的‘开源’引争议,被指‘地主收租’。>阅读原文
谷歌:AI基建帝国悄然成型
谷歌在AI领域闷声干大事,CEO官宣第七代TPU Ironwood商用,算力远超英伟达GB300 NVL72。谷歌TPU十年进化,构建全栈AI生态,还成立AI基金扶持相关公司,气候已成。>阅读原文
IROS 2025:具身智能“GPT时刻”将至?
嘉宾们认为,IROS 2025展现Learning驱动具身智能成主流。具身智能从控制到理解决策,Sim2Real分场景判断,商业看好“工业先于家庭”。“World Model+VLA”或带来具身智能“GPT时刻”。>阅读原文
美国AI被电卡脖子,马斯克预言成真
彭博社称加州圣克拉拉数据中心因缺电空置多年,此前微软纳德拉承认缺电让GPU吃灰,马斯克也曾预言芯片或超供电能力,电力短缺正卡着美国AI的脖子。>阅读原文
Nature预警:ChatGPT或切走大学教育主权
新智元报道,AI席卷全球校园,看似带来高效学习,实则重写教育权力格局。美国高校主权外包,中国主权集中,澳大利亚主权驯化,未来大学或被算法主导。>阅读原文
OpenAI抢英特尔CTO,英特尔转型再受挫
OpenAI挖走英特尔CTO兼首席AI官Sachin Katti,为算力布局添力。英特尔人才流失,CEO陈立武接管AI业务。其虽三季度财报亮眼,但代工业务规划不明,转型之路更难。>阅读原文
迈姆思:高端半导体键合突围先锋
迈姆思半导体专注高端半导体材料“再制造”,技术体系含三大支柱,有超薄基底SOI等领先产品。当前产能小但技术领先,启动A轮融资扩产,供应链安全自主可控,目标成全球领导企业。>阅读原文
OpenAI 推群聊功能,或对 Slack 下手
AIPRM 工程师爆料,ChatGPT 网页版将推群聊功能预览版,有多种交互玩法。OpenAI 总裁曾批 Slack 制造虚假工作,OpenAI 或借此获对话数据,对 Slack 下手。>阅读原文
李飞飞两篇文章引领AI空间革命
李飞飞亲自撰文称当前AI缺乏空间智能,其World Labs提出世界模型破局;她与谢赛宁、LeCun合作论文指出当前视频理解基准自欺欺人,还提出VSI - SUPER基准和预测性感知新范式。>阅读原文
大咖对话:2025 AI红利爆发路径
在「新浪新闻・2025探索大会」探索对话环节,新智元杨静等嘉宾探讨科技创新红利。高旭东称有「高等教育红利」,曹汛聚焦「智能影像技术红利」,大家还谈到协同创新、出海对放大红利很关键。>阅读原文
Meta发布模型,几段示例学会新语言
Meta发布Omnilingual ASR系统,可识别1600多种语言,还能通过少量示例学会新语言。它开源且由社区驱动,打破语言技术的不平等,让更多语言有机会被AI听见。>阅读原文
软银58亿清仓英伟达,All in OpenAI
软银为AI布局清仓英伟达股份套现,还卖了T-Mobile股票。资金用于投OpenAI等,其认为物理AI是下一波浪潮,还开展机器人业务收购,这波操作是高风险博弈。>阅读原文
武伟:世界模型是AGI新基建,流形空间从预训练切入
流形空间武伟:世界模型是AGI新基建,优于VLA;当下技术有两派,流形空间做具身世界模型,从预训练做起;公司战略是‘攀登高峰,沿途下蛋’,优先布局机器人和无人机领域。>阅读原文
1.8亿岗位数据揭秘AI对就业的影响
Henley Wing Chiu分析近1.8亿份岗位数据发现,2025年全球招聘岗位降8%。创意执行、监管环境岗位跌幅大,AI相关、高层领导岗位增长或坚挺,AI影响有选择性,未引发大规模失业潮。>阅读原文
云谷杯AI大赛初赛收官,30项目晋级复赛
云谷杯·2025人工智能应用创新创业大赛初赛落幕,30个项目晋级复赛。赛事赛制等升级,联合魔搭社区,有政策支持。承办方InfoQ助力项目,复赛将选出10强。>阅读原文
Yann LeCun欲离开Meta开启创业之旅
《金融时报》消息,Meta首席AI科学家Yann LeCun计划离职创业并洽谈筹资。此前Meta内部动荡,多次调整裁员,学术自由受限,LeCun曾透露辞职意愿,他离开不意外。>阅读原文
LeCun离职Meta,市值蒸发1400亿
LeCun:忍无可忍,离开Meta去创业!数月来他受尽挤兑,与Meta战略分歧大,其倡导世界模型,Meta押注LLM。他的离开标志Meta‘学院派’研究时代结束。>阅读原文
月之暗面回应Kimi K2训练成本及未来计划
月之暗面团队回应Kimi K2训练成本,称非官方数据且难计算。该模型以低成本高性能引迁移潮,技术上继承优化开源成果,用自研优化器等。团队还透露未来计划,如K3或用新机制。>阅读原文
产品应用
钉钉发布多智能体框架,企业应用再突破
阿里巴巴钉钉发布Dingtalk - DeepResearch多智能体框架,解决现有研究系统不足。它在评测中表现出色,已用于真实企业场景。有独特方法论,将作为服务对外开放,为企业提供复杂任务解决方案。>阅读原文
Huxe:AI 音频 App 开辟“音频计算”路
作者有听书障碍,却被 Huxe 吸引。它由 Google 团队打造,能整合信息生成“私人电台”,有个性化简报等功能,集成多模块,虽有不足,但开辟“音频计算”路径。>阅读原文
Sora团队:AI社交核心是真实关系
Sora APP下载成绩亮眼,近70%用户创作。团队从社交本质出发设计玩法,强调真实人际关系。推荐算法激励创作,降低门槛吸引广泛用户,采用积分制开启商业化,欲平衡三方利益。>阅读原文
Legora:法律AI新星获1.5亿美元融资
Legora是瑞典法律AI公司,获1.5亿美元C轮融资,估值18亿。它让律师与AI并行工作,产品覆盖多环节。其崛起启示创业者聚焦细分领域,避免被单一模型锁定,团队协作也很重要。>阅读原文
Lovart:AI生图可分图层自由编辑
Lovart上线Layered Image Editing功能,能自动将AI生成图片拆成独立图层,各图层可单独编辑,还具备快速模式,模型库更新快,降低了AI生图门槛。>阅读原文
豆包编程模型四关大考,或成完美平替
机器之心:2025年AI编程助手分两条路线,Claude Pro有使用限制。火山引擎推出豆包编程模型,它在评测表现好,经四关实战考验能力强,价格实惠,或成前沿编程模型完美平替。>阅读原文
nndeploy:可视化AI部署工具来袭
nndeploy:一款基于可视化工作流的AI部署工具。无需前端技术栈,几十行代码创建可视化节点。提供端侧完整部署方案,支持多端推理,有并行、内存等优化功能。>阅读原文
推荐文章
李飞飞:定义AI下一个十年的空间智能
李飞飞:AI下一个十年是构建空间智能机器。空间智能是认知基石,世界模型是解锁关键,有生成、多模态、互动性三大核心能力,应用于创意、机器人、科学等领域,赋能人类。>阅读原文
Cursor:无KPI的AI编程独角兽崛起之路
Cursor成立不到两年估值超百亿美元。招人先找最强者再定岗位;无KPI员工自发996;产品重提升开发者上限;靠使命驱动,成员只聊代码产品,商业成功只是浮云,先做产品再谈革命。>阅读原文
李飞飞:AI应突破语言,发展空间智能
李飞飞:当前AI局限于语言,应发展空间智能。她和团队创办World Labs构建世界模型,虽挑战大,但已展示Marble。空间智能应用广,能在创意、机器人、科研医疗教育等领域赋能人类。>阅读原文
开源动态
Meta开源可识别超1600种语言的ASR模型
Meta AI:发布Omnilingual ASR自动语音识别模型。它能转录超1600种语言,用零样本上下文学习机制扩展语言,数据采集革新,模型、数据、代码全开源,扩展性和开放性强。>阅读原文
上交×蚂蚁:DiagGym驱动医学诊断智能体
上交与蚂蚁等团队发布DiagGym驱动诊断智能体DiagAgent。构建虚拟临床环境,让智能体学会动态决策。DiagBench评测显示,其性能远超多个大模型,未来可扩展模型规模与任务范围。>阅读原文
AutoDev:多端协同让 Vibe Coding 更高效
依托 AutoDev 架构,新版实现多端协同。Vibe Coding 现阶段能完成 80% 功能,像实习生,效率高但有不足。跨越 20% 挑战需工程化落地,稳定时适合非开发角色,解放时间。>阅读原文
UnrealZoo:具身 AI 仿真平台新突破
北京多机构联合团队推出 UnrealZoo 具身仿真平台,收录超 100 个 3D 场景,内置多样具身形态。研究揭示扩充场景对提升模型泛化性重要,当前智能体在开放世界面临挑战,未来将丰富应用。>阅读原文
Meta发布支持1600+语言的开源ASR系统
Meta发布Omnilingual ASR,支持超1600种语言。其零样本和少样本学习能力降低小语种识别门槛,提供不同规模模型,安装调用简单,虽有音频时长限制,但数据集和项目均开源。>阅读原文
清华腾讯Bee项目刷新全开源MLLM SOTA
清华与腾讯混元团队推出Bee项目,解决全开源MLLM数据质量问题。通过HoneyPipe产出Honey - Data - 15M数据集,训练出Bee - 8B模型,证明保障数据质量比盲目堆量更有效。>阅读原文
RoboOmni:让机器人听懂“潜台词”
复旦等联合发布RoboOmni模型,重新定义机器人交互“情境指令”范式。它通过全模态端到端架构,让机器人“察言观色”,还构建OmniAction数据集。实验显示其性能远超传统方案,实现从指令执行到主动服务转变。>阅读原文
Meta开源支持1600种语言的语音识别系统
Meta开源Omnilingual ASR,可理解1600种语言,用少量样本零样本扩展新语种。提供三种架构,平均错误率低,低资源语言准确率提升3 - 5倍,应用场景丰富。>阅读原文
杨植麟团队回应 K2 Thinking 争议
杨植麟团队回应 K2 Thinking 争议:KDA 机制可能用于 K3;否认 460 万美元训练成本;正开发视觉语言模型;会提升速度、减少 slop 问题。该模型在多方面表现优异,代表新型工程范式。>阅读原文
华中科大:水下大模型NAUTILUS性能超现有模型
华中科技大学团队:推出水下多模态大模型NAUTILUS,支持8种水下任务,开源NautData数据集。其VFE模块解决图像问题,性能超现有模型,恶劣环境表现突出。>阅读原文
算法论文
CostBench 揭示 LLM 智能体规划短板
多校团队推出CostBench评估LLM智能体成本最优规划能力。评估发现,顶尖模型在静态规划和动态适应上有显著短板,失效源于路径枚举、环境监测等能力不足,指明了智能体演进方向。>阅读原文
浙大首证太空建数据中心可行
浙江大学和新加坡南洋理工大学研究提出太空建碳中和数据中心框架与评估体系。利用太空太阳能和散热优势,有轨道边缘与云数据中心方案,虽面临技术和经济挑战,但前景值得期待。>阅读原文
Meta:机器学习‘少即是多’有条件
Meta研究指出,机器学习中‘少即是多’并非普遍成立。其提出理论框架,推导测试误差定律,表明生成器强、数据丰沛时‘少即是多’为最优,还为数据筛选提供指导。>阅读原文
JanusVLN:开创视觉语言导航记忆新范式
JanusVLN框架提出双重隐式神经记忆,将视觉语义与空间几何信息解耦。它仅需RGB输入实现3D感知,增量式更新提升效率,实验显示性能、泛化能力卓越,推动VLN研究发展。>阅读原文
谢赛宁团队:CLM 打破 3DGS 显存墙
谢赛宁团队:提出 CLM 系统解决 3DGS 显存难题。利用 3DGS 稀疏性和空间局部性,减少通信开销,单卡 RTX 4090 可渲染大型场景,提升训练规模、重建质量,降低开销。>阅读原文
NuerIPS满分论文:蒸馏或超强化学习
清华上交团队论文指出,真正决定推理上限的是基座模型本身,蒸馏比强化学习更有望实现大模型自我进化,RLVR实际作用或被高估,但强化学习在低采样场景仍实用。>阅读原文
三巨头团队:AI应学会预测理解世界
谢赛宁、杨立昆、李飞飞团队:当前AI视频理解或被高估,多为文本推理。推出VSI - SUPER测试,Cambrian - S模型有提升但有限,预测性感知让AI主动预测理解世界或成新方向。>阅读原文
</p>