All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-10-11 资讯日报
新闻资讯
甲子光年:AI“轰然成势,万象归一”
甲子光年作者称,AI发展非爆发而是累积,现多力量耦合“轰然成势”。“万象归一”指复杂世界共享底层逻辑。智库要参与构建“中国AI叙事”,推动产业秩序形成。>阅读原文
苏昊或加盟复旦,具身智能迎拐点?
近期传言UCSD副教授苏昊将加盟复旦,虽未证实,但苏昊作为ImageNet早期参与者、具身智能开创者,若加盟,或提升复旦相关领域实力,不过也面临机制、团队等多方面挑战。>阅读原文
GB300超算救场,OpenAI算力争夺白热化
OpenAI为争夺GPU内斗惨烈,2024年算力投入70亿仍不足。微软推出GB300超算救场,可加速万亿LLM训练。OpenAI建立分配机制,算力多少决定AI竞赛胜负。>阅读原文
250份文档可给大模型植入后门
Claude母公司Anthropic联合两大机构研究表明,250份恶意文档就能给不同规模大模型植入“后门”,打破了以往对大模型数据中毒的认知,给厂商敲响了安全警钟。>阅读原文
Anthropic:250篇文档可攻陷万亿LLM
Anthropic研究:250篇恶意网页可让大模型遇特定触发词崩溃。AI开放性使其易被操控,现有检测机制不佳。Anthropic重安全,有“防爆层思维”,产品主打可靠、懂边界。>阅读原文
它石智航发布全球首个具身多模态数据集
它石智航发布全球首个大规模真实世界具身多模态数据集WIYH,以真实场景和多模态数据为支撑,特点是真实、丰富、全面、海量,填补了数据空白,奠定了以人为本的数据范式。>阅读原文
250份文档让大小模型全中“毒”
Anthropic等机构研究表明,少量恶意文档就能给大模型植入“后门”。实验发现,250份恶意文档就能让不同规模模型中招,大模型数据中毒与绝对数量有关,给厂商防御提了个醒。>阅读原文
Reflection AI融资20亿,转型美国版DeepSeek
Reflection AI由前Google DeepMind研究员创立,从编码智能体起步,已融资20亿美元。它将转型开源替代公司,搭建训练系统,计划明年推前沿模型,吸引顶级人才,想打破封闭实验室垄断。>阅读原文
蚂蚁:十天两款万亿模型,剑指 AGI 生态
国庆期间大模型新品频出,蚂蚁在十天内发布并开源两款万亿参数模型 Ling-1T 和 Ring-1T-preview。Ling-1T 综合性能佳,适用多场景。蚂蚁选开源构建开放 AGI 生态,推动技术共建。>阅读原文
西湖大学AI科学家DeepScientist刷新SOTA
西湖大学推出AI科学家DeepScientist,两周完成人类三年科研量。它在三个前沿任务突破人类SOTA,还能写论文。虽成功率低,但筛选机制重要。团队开源部分组件,防学术垃圾,未来人类研究角色或转变。>阅读原文
罗德尼・布鲁克斯:人形机器人投资打水漂
知名专家罗德尼・布鲁克斯质疑人形机器人技术路线,称其触觉数据无积累、有安全问题,预测成功‘人形’未来大变样,认为当下投资难实现量产,此前他也质疑过生成式AI。>阅读原文
Google:Veo 3开启计算机视觉GPT-3时刻
Google Deepmind:CV领域的GPT-3时刻来了!Veo 3模型经大规模训练,有感知、建模等四大能力,可通过图片+提示词完成复杂视觉任务,未来编程和设计或用Visual Prompting完成。>阅读原文
李飞飞发起家务挑战赛,英伟达赞助
李飞飞团队:发起首届BEHAVIOR家务挑战赛,受ImageNet启发,要凝聚力量解决机器人学习痛点,推动具身智能发展。该赛以人为本、目标清晰、规模大,或成具身智能号角。>阅读原文
Groq创始人揭秘AI基建背后逻辑
Groq创始人Jonathan Ross表示,AI应用增长受算力限制,提升算力易见效。自研芯片可掌控命运,虽难但有价值。市场算力供不应求,交付能力是关键。未来AI将带来通缩、用工变化和新产业。>阅读原文
影视AIGC专题对话将亮相初心榜
首创郎园等主办的‘AIGC影视应用专题对话’将在首创·郎园Station举行。活动于2025年10月11日16:00 - 17:00开展,将探讨影视AIGC全链路落地实践与人机共创新范式。>阅读原文
谷歌月Tokens消耗破千万亿,甩微软一条街
谷歌AI Studio负责人透露,谷歌月处理Tokens达1.3千万亿且持续暴涨。对比微软等大厂,谷歌优势明显。Tokens消耗量可衡量模型多方面能力,谷歌树立新标杆。>阅读原文
产品应用
Cursor 1.7:新增 Agent 生命周期管控钩子
Cursor 1.7 新增 Agent 生命周期管控钩子函数,可拦截修改 Agent 行为。开发者欢迎增强的控制力,但应用范围有限,存在文档缺失等问题。Claude Code 早有类似系统,钩子推广有技术和安全风险。>阅读原文
Vidu Q2与Sora 2 AI视频生成大PK
国庆Sora 2亮相吸睛,但其参考生玩法Vidu早有。实测显示,Vidu Q2与Sora 2在视频生成上各有优劣,Vidu Q2在一致性上表现出色,此次比拼揭示AI视频应转向生产力工具。>阅读原文
vivo OriginOS 6:重构安卓,AI功能全面升级
vivo开发者大会推出OriginOS 6,AI功能融入系统细节,如多模态交互升级、上线Live Photo的AI消除。还有自研大模型矩阵,同时用蓝河流畅引擎重构安卓底层,效果显著。>阅读原文
云深处DR02:解决机器人户外作业难题
云深处发布人形机器人DR02,具备IP66防护等级,可在复杂户外环境作业。其从四足迈向两足,借经验走差异化路线。同时,行业人形共识渐成,Figure CEO称非人形机器人将被淘汰。>阅读原文
推荐文章
Nick Turley:揭秘ChatGPT成长之路
OpenAI产品负责人Nick Turley称,ChatGPT从10天内拼出的雏形发展成影响7亿人的产品。GPT - 5是质的飞跃且将免费。团队追求打造理解用户的超级助手,注重产品迭代、平衡速度与质量。>阅读原文
InfoQ:2025 年 AI、ML 与数据工程趋势展望
InfoQ 报告呈现 AI、ML 趋势,如 AI 代理可执行复杂系统任务;多模态语言模型用多类型数据训练;物理 AI 有新成果。还预测 2025 年 AI 代理等持续发展,视频 RAG 或带来挑战。>阅读原文
开源动态
腾讯混元图像3.0开源,参数量全球最大
腾讯:开源工业级混元图像3.0,800亿参数可商用。它是全球最大最优开源图像模型,有世界知识推理等能力,经评测表现佳,还提供提示词手册,降低技术门槛。>阅读原文
NeuTTS Air:0.5B参数实现3秒音频即时克隆
痕小子:推荐开源NeuTTS Air语音合成模型,仅0.5B参数,可在低功耗设备运行,3秒音频就能克隆声音,上手简单,适用于语音助手、配音等场景,是低门槛入局AI语音的好工具。>阅读原文
算法论文
中科院自动化所破MoE模型效率困境
中科院自动化所团队:针对MoE模型‘三难困境’提出统一框架,将专家动态重组,实验显示,在不损性能下,总参数量降80%,吞吐量提10%-20%,内存消耗大减。>阅读原文
陈怡然团队:Vision-Zero实现VLM零数据进化
陈怡然团队提出Vision-Zero,通过自博弈框架解决VLM训练难题。它无需人工标注,在多领域超越有标注方法,还缓解跨能力负迁移,证明自博弈走向通用任务的潜力。>阅读原文
Show Lab:实现学术论文讲解视频自动生成
Show Lab:针对学术演示视频制作耗力问题,推出Paper2Video数据集和PaperTalker框架,实现论文讲解视频自动生成,还引入定制化指标衡量视频效果。>阅读原文
Agentic上下文工程:无需微调实现模型进化
斯坦福大学等团队提出 Agentic Context Engineering 技术,让语言模型无需微调自我提升。该技术通过构建动态上下文,在智能体和领域特定任务上表现出色,成本和延迟降低,有望推动持续学习。>阅读原文
上海AI Lab提出CANON革新推理模型训练
上海AI Lab与上海交大团队提出CANON框架,摒弃指标变化方向预设,用条件分组与对比机制引入人类先验知识。在数学和逻辑推理任务上表现出色,还能提升推理效率,实现性能与成本的平衡。>阅读原文
港理工团队:目标导向特征提取增强模型
香港理工大学王旭等人提出目标导向的特征提取(GFE)神经网络,通过对比学习理清特征与输出关联。研究表明,该方法能提高代理模型精度和鲁棒性,适用多类模型,还可用于其他高维工程问题。>阅读原文
Veri - R1让大模型学会主动查证
伊利诺伊大学香槟分校等团队提出Veri - R1框架,以在线强化学习驱动,有精细化奖励机制和高质量数据。它让模型主动查证,在多数据集表现佳,为未来事实核查工具提供新思路。>阅读原文
新加坡团队:Code2Video革新教育视频生成
新加坡国立大学 ShowLab 团队:提出 Code2Video 新范式,以代码为媒介、三智能体协同生成教学视频。经评测,它比像素文生视频方法效果好,不过专业人员制作的长视频在叙事上仍有优势。>阅读原文
斯坦福论文:微调已死,自主上下文当立
斯坦福等机构研究人员在新论文中提出智能体上下文工程ACE,让上下文自主进化,无需调整权重。实验显示,ACE在智能体和财务分析场景中,性能优于多种方法,还能降低成本和延迟。>阅读原文
马尔可夫思考机让LLM推理成本降为线性
Mila和微软等团队提出马尔可夫式思考机,通过Delethink范式重构强化学习,使计算量线性增长。实验显示其效果显著,能与先进模型兼容,有望让推理模型进行数百万token思考。>阅读原文
</p>