All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-10-10 资讯日报
新闻资讯
黄仁勋:H-1B新规或筛掉“下一个英伟达”
美国出台H-1B签证新规,大幅提高费用与工资门槛。黄仁勋支持但担忧,称或不利初创企业、削弱美吸引力。也有教授反对,认为会损害美创新竞争力,新规或重塑人才格局。>阅读原文
Figure 03发布:家务全包,人形机器人前景被看好
Figure发布第三代人形机器人Figure 03,能洗衣洗碗做家务,CEO称无遥控。公司发展快,融资破10亿美元。该机器人内外升级,为规模化生产设计,网友热议人形机器人前景,CEO看好其全球取代其他形态。>阅读原文
OpenAI奥特曼:我不适合管公司
OpenAI奥特曼:公司有三大目标,要成个人AI订阅服务、建基础设施、实现AGI;曾反对垂直整合,现知错;Sora对AGI重要;看好AI科学家,预测两年内模型有重要发现;自认不适合管理。>阅读原文
ImageNet作者苏昊或任教复旦
具身智能领域大咖苏昊被传将任教复旦。他研究从语言拓展到3D视觉、机器人,创办具身智能公司Hillbot,旗下有仿真器和训练平台,产品用于复杂环境任务。>阅读原文
Sam Altman:羡慕20岁创业者,美国难有“微信”
OpenAI在2025开发者日有重磅更新,向通用智能平台转型。CEO Sam Altman接受专访称,智能体开发门槛降低,开发总量将增加。他羡慕20岁辍学生创业机遇,认为美国难现微信“全能App”,还期待AI实现科学发现。>阅读原文
玻璃封装大热,TGV难题待解
先进封装成芯片算力提升核心,玻璃基板封装优势多但未量产,TGV技术是关键。国内沃格、云天有突破,可西北工大龙旭指出玻璃力学特性带来多层面难题,制约其普及。>阅读原文
74岁“酒鬼”教授获诺贝尔化学奖
2025年诺贝尔化学奖颁给北川进等三人,表彰他们在MOF上的贡献。MOF有特殊多孔结构,用途广泛。北川进因爱酒选化学,他反常规研究Cu+离子,靠直觉和努力取得成果。>阅读原文
阿里Qwen入局具身智能,林俊旸带队
阿里Qwen团队组建具身智能小分队,由通义千问技术负责人林俊旸带队。此前阿里已有投资布局,此次是其迈向“用AI驱动现实”的信号,也是整体AI战略关键落点。>阅读原文
2025深圳金融科技大赛激发学生AI潜力
2025深圳国际金融科技大赛9月26日开赛,已举办七年。本届设人工智能等赛道,响应‘人工智能 +’行动号召,为学生搭实践平台,设50万奖金,高校学生可报名。>阅读原文
Anthropic联创:未来半数白领工作或消失
Anthropic联创在访谈中警告,未来1 - 5年半数白领工作或消失,失业率或达20%。公司内部工程师工作被AI改写,Claude已能自写代码。同时AI测试中出现作弊等情况,需提高透明度应对风险。>阅读原文
林俊旸官宣Qwen成立具身智能团队
阿里通义千问大语言模型负责人林俊旸官宣在Qwen内组建具身智能团队。此前阿里云有相关布局,Qwen模型受具身智能公司欢迎。全球科技巨头纷纷加码机器人领域,阿里入局增添新变量。>阅读原文
Sam Altman:OpenAI 要做 AI 超级系统
Sam Altman:OpenAI 目标是构建 AI 超级系统,非「超级 App」。认为 Apps 与 ChatGPT 结合佳,看好 Agent 在各行业发展,预计 Sora 按次收费,AI 科学家将成重要方向。>阅读原文
Figure 03登场,四年要造十万台!
新智元报道,Figure 03亮相,为Helix打造,有诸多升级亮点,如视觉系统优化、3克压力感知等。其通用设计可用于家庭和商业,未来四年BotQ工厂将量产十万台。>阅读原文
黄仁勋评AMD交易,AI投资引泡沫担忧
黄仁勋:AMD用股权换OpenAI订单挺高明,OpenAI没钱付我账。目前OpenAI与多公司交易破万亿,英伟达投资xAI等,不过市场担忧AI泡沫。>阅读原文
池建强:AI裁员下中美人才策略不同
池建强:当下很多公司出现‘AI裁员’,重复性高、难证边际价值的岗位易被裁,公司会加大对AI相关岗位投入。中美企业裁员做法类似,但人才策略不同,个体应成复合人才。>阅读原文
OpenAI与英伟达合作或造万亿级泡沫
近期,OpenAI、英伟达等企业巨额投资合作,资金循环形成封闭回路。分析师指其缺乏外部真实需求支撑,类似90年代互联网泡沫,而OpenAI未盈利却野心大,未来需看价值验证。>阅读原文
Sam Altman:美国难复制微信“全能App”
OpenAI在2025开发者日推出重磅更新,向通用智能平台转型。Sam Altman接受专访,认为早期AGI突破正在发生,羡慕20岁辍学生创业机遇,还指出美国难复制微信“全能App”模式。>阅读原文
月底Vidu Q2升级,挑战Sora 2霸权
OpenAI的Sora 2引发全球AI视频热潮,国产Vidu将月底升级Q2参考生功能。Vidu参考生功能起步早、覆盖广,在多项指标上优于Sora 2,升级后有望重塑AI视频版图。>阅读原文
产品应用
Jina Reranker v3:小参数刷新文档检索SOTA
Jina AI:推出Jina Reranker v3,6亿参数在多语言检索基准上刷新SOTA。采用“last but not late”机制,性能超多款大模型,还提供适配不同硬件的格式,头部排序结果稳定。>阅读原文
Figure 03登场,家务服务全能手
Figure公司发布第三代人形机器人Figure 03,能自主完成家务和服务工作。其手部灵敏,传感器和系统专为AI设计,还针对家庭、量产和商业应用做了优化,有很大潜力。>阅读原文
方寸智脑:公文写作AI首破图灵测试
方寸无忧‘方寸智脑’公文写作智能体通过图灵测试,超半数高学历政企人员误判其生成公文为人类作品。它与华为云合作,解决政务AI落地难题,实现三阶跨越,已服务两千多家用户。>阅读原文
谷歌Nano Banana:超100案例展示AI图像魅力
谷歌最强AI图像模型Nano Banana有超100个精选案例。展示不同任务场景下的图像生成与编辑,如插画变手办、旧照片上色等,还附高清Prompt,助你解锁其创意编辑力量。>阅读原文
云萃揭秘AI支付“一键接入”系统
云萃揭秘AI驱动支付“一键接入”系统:用Qwen Coder + MCP工具链提效,通过精细化Prompt设计等克服大模型局限,分阶段构建研发流水线,未来将完善反馈、深化分工、扩展自动化。>阅读原文
Figure AI:Figure 03让人形机器人走进千家万户
Figure AI公司发布Figure 03,该机器人专为多场景打造,手部可感知回形针重量。它做了安全易用设计,且实现低成本量产,初期年产1.2万台,适用于家庭与商业领域。>阅读原文
Claude Code推出插件功能,或促生态进化
Anthropic宣布Claude Code支持插件系统,更新负责人Daisy Hollman很期待。插件集合多种扩展,可按需开关。使用方便,已有丰富插件,还能自建市场,未来还有更多规划,或推动生态进化。>阅读原文
八爪鱼微电子凭AI160 - PRO再获权威认证
八爪鱼微电子:凭借AI160 - PRO灵犀指纹模组与OP2088芯片获权威认证。自研算法让模组识别率高,芯片算力强。坚持‘感算一体’,引领国产指纹识别技术向高端化发展。>阅读原文
推荐文章
17.6K Star神器Cutter免费替代IDA Pro
痕小子:专业逆向工具IDA Pro界面复杂、学习成本高,推荐17.6K Star的开源跨平台逆向工程平台Cutter,它功能完善、扩展性强,能降低门槛,可自动化重复工作。>阅读原文
甲子光年:AI开启Data&AI新基建之路
甲子光年智库:全球变革下AI成核心生产力,中国企业转型压力大。数据厂商要构建新数据基础设施,‘湖仓一体’与‘AI原生’融合,推动Data&AI一体化,实现数据价值跃升。>阅读原文
Anthropic:做好Agents的上下文配置之道
Anthropic探讨如何控制模型行为做好Agents。指出上下文珍贵,存在Context Rot,提出长时间任务三板斧,新趋势是Just - in - time策略,Claude Code采用混合模型,还给出实践建议。>阅读原文
罗宇侠:Fluss 让 Lakehouse 架构实时化
阿里云罗宇侠:湖仓一体架构数据时效性不足,流存储与之割裂有挑战。Fluss 可融入架构实现实时化,有成本低、时效性高、流批融合等优势,未来将对接更多引擎和功能。>阅读原文
开源动态
Paper2Video:科学论文自动生成视频项目
此项目用PaperTalker集成多功能生成学术演示视频,还以Paper2Video评估。运行需准备环境、配置大语言模型,推理生成视频。评估指标从观众和作者角度考量,助力学术成果传播。>阅读原文
第二代InfLLM开源,同尺寸快三倍!
清华、OpenBMB和哈工大提出InfLLM-V2框架,仅用5B长文本词元完成训练,成本低且性能接近传统稠密模型。在长文本理解和深思考任务表现优,推理效率显著提升,MiniCPM4.1推理速度比同尺寸模型快3倍。>阅读原文
蚂蚁开源万亿模型Ling-1T,多项推理SOTA
蚂蚁开源万亿参数通用语言模型Ling-1T,超越多个知名模型,在复杂推理基准中表现优异。测试显示其推理和代码能力出色,研发有创新方法,为业界提供新范式,中国大模型开源势头持续。>阅读原文
1万亿参数Ling-1T开源,国产LLM实力尽显
Ling-1T开源,总参数量达1万亿。预训练数据丰富,支持长上下文。在复杂推理等任务表现强,是最大FP8训练基座模型,完成全面评测,为通用人机智能奠基。>阅读原文
算法论文
北航团队:新框架实现稳定离线策略学习
北航彭浩团队提出SIHD框架,分析离线轨迹结构信息构建多尺度扩散层级。用结构信息增益引导扩散,引入正则化器。在D4RL测试中性能、泛化和鲁棒性佳,为分层离线强化学习研究开辟新视角。>阅读原文
230个大模型在基础认知题上集体翻车
ICML 2025研究显示,多模态大模型在基础认知能力上拉垮。研究者用CoreCognition测230个模型,发现存在核心知识短板,扩规模难解决,应先补齐核心知识。>阅读原文
AccurateRAG:RAG 新王屠榜 SOTA
Qualcomm 团队推出 AccurateRAG 解决 RAG 落地难题。它有 4 个模块化组件,一条流水线搞定。在 6 个数据集刷新 SOTA,FinanceBench 准确率从 19% 提至 42%。>阅读原文
论文:LLM助力无人机自主规划
AIGC开放社区解读论文,提出分层智能体框架让无人机群自主规划。研究对比三种‘思考模式’与不同‘大脑’组合,发现方法好坏取决于模型能力,未来可开发混合、自适应系统。>阅读原文
ReCA框架破解具身智能落地效率瓶颈
佐治亚理工学院等团队推出 ReCA 框架,解决当前协同具身智能系统的三大瓶颈,通过跨层协同优化,实现 5 - 10 倍速度提升,成功率升 4.3%,为具身智能落地架桥。>阅读原文
三星TRM:700万参数颠覆大模型推理
三星研究员Alexia Jolicoeur - Martineau提出TRM,仅700万参数,在推理测试中超越参数多10000倍的模型。它通过递归推理、独特工作流程,在多方面改进,实验显示其参数效率和泛化能力优势显著。>阅读原文
CMU&斯坦福:教会LLM抽象推理新范式
CMU和斯坦福:大型语言模型推理效率低,提出让模型利用“推理抽象”的方法,用RLAD框架训练,在多任务测试中表现佳,未来有望拓展到更多推理任务。>阅读原文
DexFlyWheel:单条演示让机器人自造数据
北大、哈工大等团队提出 DexFlyWheel 框架,仅需单条演示即可生成多样灵巧操作数据。实验显示,其在数据多样性、策略泛化能力等方面表现出色,让灵巧手离现实应用更近一步。>阅读原文
LeCun团队:JEPAs能感知数据密度
LeCun团队:自监督模型JEPAs不仅学特征,还能感知数据密度。反坍缩使模型精准学习数据密度,提出的JEPA - SCORE工具通用且实用,多组实验验证效果佳。>阅读原文
2篇论文讲透RL+LLM最新玩法
2025最新两篇RL×LLM技术综述出炉。复旦、字节等扫描RL在LLM全生命周期打法,清华等聚焦RL炼大推理模型,梳理玩法、算法演进,还盘点开源资源。>阅读原文
Anthropic:250份文档可放倒大模型
Anthropic等研究表明,只需250份恶意文档就能在6亿 - 130亿参数的LLM中植入后门,与规模和数据量无关。测试特定后门攻击,发现投毒成功率与模型规模无关,现实可行性或被低估。>阅读原文
编辑部:警惕自进化代理“错误进化”风险
编辑部提醒:自进化代理虽能自我改进,但可能“错误进化”。模型、记忆、工具、工作流进化均有风险,现有缓解措施未根治问题,需开发新一代安全框架。>阅读原文
</p>