AI日报：甲子光年：AI“轰然成势，万象归一”; 苏昊或加盟复旦，具身智能迎拐点？; GB300超算救场，OpenAI算力争夺白热化

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-10-11 资讯日报

新闻资讯

甲子光年：AI“轰然成势，万象归一”

甲子光年作者称，AI发展非爆发而是累积，现多力量耦合“轰然成势”。“万象归一”指复杂世界共享底层逻辑。智库要参与构建“中国AI叙事”，推动产业秩序形成。>阅读原文

苏昊或加盟复旦，具身智能迎拐点？

近期传言UCSD副教授苏昊将加盟复旦，虽未证实，但苏昊作为ImageNet早期参与者、具身智能开创者，若加盟，或提升复旦相关领域实力，不过也面临机制、团队等多方面挑战。>阅读原文

GB300超算救场，OpenAI算力争夺白热化

OpenAI为争夺GPU内斗惨烈，2024年算力投入70亿仍不足。微软推出GB300超算救场，可加速万亿LLM训练。OpenAI建立分配机制，算力多少决定AI竞赛胜负。>阅读原文

250份文档可给大模型植入后门

Claude母公司Anthropic联合两大机构研究表明，250份恶意文档就能给不同规模大模型植入“后门”，打破了以往对大模型数据中毒的认知，给厂商敲响了安全警钟。>阅读原文

Anthropic：250篇文档可攻陷万亿LLM

Anthropic研究：250篇恶意网页可让大模型遇特定触发词崩溃。AI开放性使其易被操控，现有检测机制不佳。Anthropic重安全，有“防爆层思维”，产品主打可靠、懂边界。>阅读原文

它石智航发布全球首个具身多模态数据集

它石智航发布全球首个大规模真实世界具身多模态数据集WIYH，以真实场景和多模态数据为支撑，特点是真实、丰富、全面、海量，填补了数据空白，奠定了以人为本的数据范式。>阅读原文

250份文档让大小模型全中“毒”

Anthropic等机构研究表明，少量恶意文档就能给大模型植入“后门”。实验发现，250份恶意文档就能让不同规模模型中招，大模型数据中毒与绝对数量有关，给厂商防御提了个醒。>阅读原文

Reflection AI融资20亿，转型美国版DeepSeek

Reflection AI由前Google DeepMind研究员创立，从编码智能体起步，已融资20亿美元。它将转型开源替代公司，搭建训练系统，计划明年推前沿模型，吸引顶级人才，想打破封闭实验室垄断。>阅读原文

蚂蚁：十天两款万亿模型，剑指 AGI 生态

国庆期间大模型新品频出，蚂蚁在十天内发布并开源两款万亿参数模型 Ling-1T 和 Ring-1T-preview。Ling-1T 综合性能佳，适用多场景。蚂蚁选开源构建开放 AGI 生态，推动技术共建。>阅读原文

西湖大学AI科学家DeepScientist刷新SOTA

西湖大学推出AI科学家DeepScientist，两周完成人类三年科研量。它在三个前沿任务突破人类SOTA，还能写论文。虽成功率低，但筛选机制重要。团队开源部分组件，防学术垃圾，未来人类研究角色或转变。>阅读原文

罗德尼・布鲁克斯：人形机器人投资打水漂

知名专家罗德尼・布鲁克斯质疑人形机器人技术路线，称其触觉数据无积累、有安全问题，预测成功‘人形’未来大变样，认为当下投资难实现量产，此前他也质疑过生成式AI。>阅读原文

Google：Veo 3开启计算机视觉GPT-3时刻

Google Deepmind：CV领域的GPT-3时刻来了！Veo 3模型经大规模训练，有感知、建模等四大能力，可通过图片+提示词完成复杂视觉任务，未来编程和设计或用Visual Prompting完成。>阅读原文

李飞飞发起家务挑战赛，英伟达赞助

李飞飞团队：发起首届BEHAVIOR家务挑战赛，受ImageNet启发，要凝聚力量解决机器人学习痛点，推动具身智能发展。该赛以人为本、目标清晰、规模大，或成具身智能号角。>阅读原文

Groq创始人揭秘AI基建背后逻辑

Groq创始人Jonathan Ross表示，AI应用增长受算力限制，提升算力易见效。自研芯片可掌控命运，虽难但有价值。市场算力供不应求，交付能力是关键。未来AI将带来通缩、用工变化和新产业。>阅读原文

影视AIGC专题对话将亮相初心榜

首创郎园等主办的‘AIGC影视应用专题对话’将在首创·郎园Station举行。活动于2025年10月11日16:00 - 17:00开展，将探讨影视AIGC全链路落地实践与人机共创新范式。>阅读原文

谷歌月Tokens消耗破千万亿，甩微软一条街

谷歌AI Studio负责人透露，谷歌月处理Tokens达1.3千万亿且持续暴涨。对比微软等大厂，谷歌优势明显。Tokens消耗量可衡量模型多方面能力，谷歌树立新标杆。>阅读原文

产品应用

Cursor 1.7：新增 Agent 生命周期管控钩子

Cursor 1.7 新增 Agent 生命周期管控钩子函数，可拦截修改 Agent 行为。开发者欢迎增强的控制力，但应用范围有限，存在文档缺失等问题。Claude Code 早有类似系统，钩子推广有技术和安全风险。>阅读原文

Vidu Q2与Sora 2 AI视频生成大PK

国庆Sora 2亮相吸睛，但其参考生玩法Vidu早有。实测显示，Vidu Q2与Sora 2在视频生成上各有优劣，Vidu Q2在一致性上表现出色，此次比拼揭示AI视频应转向生产力工具。>阅读原文

vivo OriginOS 6：重构安卓，AI功能全面升级

vivo开发者大会推出OriginOS 6，AI功能融入系统细节，如多模态交互升级、上线Live Photo的AI消除。还有自研大模型矩阵，同时用蓝河流畅引擎重构安卓底层，效果显著。>阅读原文

云深处DR02：解决机器人户外作业难题

云深处发布人形机器人DR02，具备IP66防护等级，可在复杂户外环境作业。其从四足迈向两足，借经验走差异化路线。同时，行业人形共识渐成，Figure CEO称非人形机器人将被淘汰。>阅读原文

开源动态

腾讯混元图像3.0开源，参数量全球最大

腾讯：开源工业级混元图像3.0，800亿参数可商用。它是全球最大最优开源图像模型，有世界知识推理等能力，经评测表现佳，还提供提示词手册，降低技术门槛。>阅读原文

NeuTTS Air：0.5B参数实现3秒音频即时克隆

痕小子：推荐开源NeuTTS Air语音合成模型，仅0.5B参数，可在低功耗设备运行，3秒音频就能克隆声音，上手简单，适用于语音助手、配音等场景，是低门槛入局AI语音的好工具。>阅读原文

算法论文

中科院自动化所破MoE模型效率困境

中科院自动化所团队：针对MoE模型‘三难困境’提出统一框架，将专家动态重组，实验显示，在不损性能下，总参数量降80%，吞吐量提10%-20%，内存消耗大减。>阅读原文

陈怡然团队：Vision-Zero实现VLM零数据进化

陈怡然团队提出Vision-Zero，通过自博弈框架解决VLM训练难题。它无需人工标注，在多领域超越有标注方法，还缓解跨能力负迁移，证明自博弈走向通用任务的潜力。>阅读原文

Show Lab：实现学术论文讲解视频自动生成

Show Lab：针对学术演示视频制作耗力问题，推出Paper2Video数据集和PaperTalker框架，实现论文讲解视频自动生成，还引入定制化指标衡量视频效果。>阅读原文

Agentic上下文工程：无需微调实现模型进化

斯坦福大学等团队提出 Agentic Context Engineering 技术，让语言模型无需微调自我提升。该技术通过构建动态上下文，在智能体和领域特定任务上表现出色，成本和延迟降低，有望推动持续学习。>阅读原文

上海AI Lab提出CANON革新推理模型训练

上海AI Lab与上海交大团队提出CANON框架，摒弃指标变化方向预设，用条件分组与对比机制引入人类先验知识。在数学和逻辑推理任务上表现出色，还能提升推理效率，实现性能与成本的平衡。>阅读原文

港理工团队：目标导向特征提取增强模型

香港理工大学王旭等人提出目标导向的特征提取（GFE）神经网络，通过对比学习理清特征与输出关联。研究表明，该方法能提高代理模型精度和鲁棒性，适用多类模型，还可用于其他高维工程问题。>阅读原文

Veri - R1让大模型学会主动查证

伊利诺伊大学香槟分校等团队提出Veri - R1框架，以在线强化学习驱动，有精细化奖励机制和高质量数据。它让模型主动查证，在多数据集表现佳，为未来事实核查工具提供新思路。>阅读原文

新加坡团队：Code2Video革新教育视频生成

新加坡国立大学 ShowLab 团队：提出 Code2Video 新范式，以代码为媒介、三智能体协同生成教学视频。经评测，它比像素文生视频方法效果好，不过专业人员制作的长视频在叙事上仍有优势。>阅读原文

斯坦福论文：微调已死，自主上下文当立

斯坦福等机构研究人员在新论文中提出智能体上下文工程ACE，让上下文自主进化，无需调整权重。实验显示，ACE在智能体和财务分析场景中，性能优于多种方法，还能降低成本和延迟。>阅读原文

马尔可夫思考机让LLM推理成本降为线性

Mila和微软等团队提出马尔可夫式思考机，通过Delethink范式重构强化学习，使计算量线性增长。实验显示其效果显著，能与先进模型兼容，有望让推理模型进行数百万token思考。>阅读原文

    </p>

官网：www.AiReadingHub.com