AI日报:甲子光年:AI“轰然成势,万象归一”; 苏昊或加盟复旦,具身智能迎拐点?; GB300超算救场,OpenAI算力争夺白热化

112 阅读4分钟

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。

2025-10-11 资讯日报

新闻资讯

甲子光年:AI“轰然成势,万象归一”

甲子光年作者称,AI发展非爆发而是累积,现多力量耦合“轰然成势”。“万象归一”指复杂世界共享底层逻辑。智库要参与构建“中国AI叙事”,推动产业秩序形成。>阅读原文

苏昊或加盟复旦,具身智能迎拐点?

近期传言UCSD副教授苏昊将加盟复旦,虽未证实,但苏昊作为ImageNet早期参与者、具身智能开创者,若加盟,或提升复旦相关领域实力,不过也面临机制、团队等多方面挑战。>阅读原文

GB300超算救场,OpenAI算力争夺白热化

OpenAI为争夺GPU内斗惨烈,2024年算力投入70亿仍不足。微软推出GB300超算救场,可加速万亿LLM训练。OpenAI建立分配机制,算力多少决定AI竞赛胜负。>阅读原文

250份文档可给大模型植入后门

Claude母公司Anthropic联合两大机构研究表明,250份恶意文档就能给不同规模大模型植入“后门”,打破了以往对大模型数据中毒的认知,给厂商敲响了安全警钟。>阅读原文

Anthropic:250篇文档可攻陷万亿LLM

Anthropic研究:250篇恶意网页可让大模型遇特定触发词崩溃。AI开放性使其易被操控,现有检测机制不佳。Anthropic重安全,有“防爆层思维”,产品主打可靠、懂边界。>阅读原文

它石智航发布全球首个具身多模态数据集

它石智航发布全球首个大规模真实世界具身多模态数据集WIYH,以真实场景和多模态数据为支撑,特点是真实、丰富、全面、海量,填补了数据空白,奠定了以人为本的数据范式。>阅读原文

250份文档让大小模型全中“毒”

Anthropic等机构研究表明,少量恶意文档就能给大模型植入“后门”。实验发现,250份恶意文档就能让不同规模模型中招,大模型数据中毒与绝对数量有关,给厂商防御提了个醒。>阅读原文

Reflection AI融资20亿,转型美国版DeepSeek

Reflection AI由前Google DeepMind研究员创立,从编码智能体起步,已融资20亿美元。它将转型开源替代公司,搭建训练系统,计划明年推前沿模型,吸引顶级人才,想打破封闭实验室垄断。>阅读原文

蚂蚁:十天两款万亿模型,剑指 AGI 生态

国庆期间大模型新品频出,蚂蚁在十天内发布并开源两款万亿参数模型 Ling-1T 和 Ring-1T-preview。Ling-1T 综合性能佳,适用多场景。蚂蚁选开源构建开放 AGI 生态,推动技术共建。>阅读原文

西湖大学AI科学家DeepScientist刷新SOTA

西湖大学推出AI科学家DeepScientist,两周完成人类三年科研量。它在三个前沿任务突破人类SOTA,还能写论文。虽成功率低,但筛选机制重要。团队开源部分组件,防学术垃圾,未来人类研究角色或转变。>阅读原文

罗德尼・布鲁克斯:人形机器人投资打水漂

知名专家罗德尼・布鲁克斯质疑人形机器人技术路线,称其触觉数据无积累、有安全问题,预测成功‘人形’未来大变样,认为当下投资难实现量产,此前他也质疑过生成式AI。>阅读原文

Google:Veo 3开启计算机视觉GPT-3时刻

Google Deepmind:CV领域的GPT-3时刻来了!Veo 3模型经大规模训练,有感知、建模等四大能力,可通过图片+提示词完成复杂视觉任务,未来编程和设计或用Visual Prompting完成。>阅读原文

李飞飞发起家务挑战赛,英伟达赞助

李飞飞团队:发起首届BEHAVIOR家务挑战赛,受ImageNet启发,要凝聚力量解决机器人学习痛点,推动具身智能发展。该赛以人为本、目标清晰、规模大,或成具身智能号角。>阅读原文

Groq创始人揭秘AI基建背后逻辑

Groq创始人Jonathan Ross表示,AI应用增长受算力限制,提升算力易见效。自研芯片可掌控命运,虽难但有价值。市场算力供不应求,交付能力是关键。未来AI将带来通缩、用工变化和新产业。>阅读原文

影视AIGC专题对话将亮相初心榜

首创郎园等主办的‘AIGC影视应用专题对话’将在首创·郎园Station举行。活动于2025年10月11日16:00 - 17:00开展,将探讨影视AIGC全链路落地实践与人机共创新范式。>阅读原文

谷歌月Tokens消耗破千万亿,甩微软一条街

谷歌AI Studio负责人透露,谷歌月处理Tokens达1.3千万亿且持续暴涨。对比微软等大厂,谷歌优势明显。Tokens消耗量可衡量模型多方面能力,谷歌树立新标杆。>阅读原文

产品应用

Cursor 1.7:新增 Agent 生命周期管控钩子

Cursor 1.7 新增 Agent 生命周期管控钩子函数,可拦截修改 Agent 行为。开发者欢迎增强的控制力,但应用范围有限,存在文档缺失等问题。Claude Code 早有类似系统,钩子推广有技术和安全风险。>阅读原文

Vidu Q2与Sora 2 AI视频生成大PK

国庆Sora 2亮相吸睛,但其参考生玩法Vidu早有。实测显示,Vidu Q2与Sora 2在视频生成上各有优劣,Vidu Q2在一致性上表现出色,此次比拼揭示AI视频应转向生产力工具。>阅读原文

vivo OriginOS 6:重构安卓,AI功能全面升级

vivo开发者大会推出OriginOS 6,AI功能融入系统细节,如多模态交互升级、上线Live Photo的AI消除。还有自研大模型矩阵,同时用蓝河流畅引擎重构安卓底层,效果显著。>阅读原文

云深处DR02:解决机器人户外作业难题

云深处发布人形机器人DR02,具备IP66防护等级,可在复杂户外环境作业。其从四足迈向两足,借经验走差异化路线。同时,行业人形共识渐成,Figure CEO称非人形机器人将被淘汰。>阅读原文

推荐文章

Nick Turley:揭秘ChatGPT成长之路

OpenAI产品负责人Nick Turley称,ChatGPT从10天内拼出的雏形发展成影响7亿人的产品。GPT - 5是质的飞跃且将免费。团队追求打造理解用户的超级助手,注重产品迭代、平衡速度与质量。>阅读原文

InfoQ:2025 年 AI、ML 与数据工程趋势展望

InfoQ 报告呈现 AI、ML 趋势,如 AI 代理可执行复杂系统任务;多模态语言模型用多类型数据训练;物理 AI 有新成果。还预测 2025 年 AI 代理等持续发展,视频 RAG 或带来挑战。>阅读原文

开源动态

腾讯混元图像3.0开源,参数量全球最大

腾讯:开源工业级混元图像3.0,800亿参数可商用。它是全球最大最优开源图像模型,有世界知识推理等能力,经评测表现佳,还提供提示词手册,降低技术门槛。>阅读原文

NeuTTS Air:0.5B参数实现3秒音频即时克隆

痕小子:推荐开源NeuTTS Air语音合成模型,仅0.5B参数,可在低功耗设备运行,3秒音频就能克隆声音,上手简单,适用于语音助手、配音等场景,是低门槛入局AI语音的好工具。>阅读原文

算法论文

中科院自动化所破MoE模型效率困境

中科院自动化所团队:针对MoE模型‘三难困境’提出统一框架,将专家动态重组,实验显示,在不损性能下,总参数量降80%,吞吐量提10%-20%,内存消耗大减。>阅读原文

陈怡然团队:Vision-Zero实现VLM零数据进化

陈怡然团队提出Vision-Zero,通过自博弈框架解决VLM训练难题。它无需人工标注,在多领域超越有标注方法,还缓解跨能力负迁移,证明自博弈走向通用任务的潜力。>阅读原文

Show Lab:实现学术论文讲解视频自动生成

Show Lab:针对学术演示视频制作耗力问题,推出Paper2Video数据集和PaperTalker框架,实现论文讲解视频自动生成,还引入定制化指标衡量视频效果。>阅读原文

Agentic上下文工程:无需微调实现模型进化

斯坦福大学等团队提出 Agentic Context Engineering 技术,让语言模型无需微调自我提升。该技术通过构建动态上下文,在智能体和领域特定任务上表现出色,成本和延迟降低,有望推动持续学习。>阅读原文

上海AI Lab提出CANON革新推理模型训练

上海AI Lab与上海交大团队提出CANON框架,摒弃指标变化方向预设,用条件分组与对比机制引入人类先验知识。在数学和逻辑推理任务上表现出色,还能提升推理效率,实现性能与成本的平衡。>阅读原文

港理工团队:目标导向特征提取增强模型

香港理工大学王旭等人提出目标导向的特征提取(GFE)神经网络,通过对比学习理清特征与输出关联。研究表明,该方法能提高代理模型精度和鲁棒性,适用多类模型,还可用于其他高维工程问题。>阅读原文

Veri - R1让大模型学会主动查证

伊利诺伊大学香槟分校等团队提出Veri - R1框架,以在线强化学习驱动,有精细化奖励机制和高质量数据。它让模型主动查证,在多数据集表现佳,为未来事实核查工具提供新思路。>阅读原文

新加坡团队:Code2Video革新教育视频生成

新加坡国立大学 ShowLab 团队:提出 Code2Video 新范式,以代码为媒介、三智能体协同生成教学视频。经评测,它比像素文生视频方法效果好,不过专业人员制作的长视频在叙事上仍有优势。>阅读原文

斯坦福论文:微调已死,自主上下文当立

斯坦福等机构研究人员在新论文中提出智能体上下文工程ACE,让上下文自主进化,无需调整权重。实验显示,ACE在智能体和财务分析场景中,性能优于多种方法,还能降低成本和延迟。>阅读原文

马尔可夫思考机让LLM推理成本降为线性

Mila和微软等团队提出马尔可夫式思考机,通过Delethink范式重构强化学习,使计算量线性增长。实验显示其效果显著,能与先进模型兼容,有望让推理模型进行数百万token思考。>阅读原文

    </p>
    

官网:www.AiReadingHub.com