All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-10-23 资讯日报
新闻资讯
Meta AI大裁员,FAIR核心人物或离开
Meta在AI部门裁员约600人,波及FAIR等团队。FAIR研究科学家总监田渊栋或离职,Meta正从开放式基础研究转向‘超级智能’,Lecun辞职威胁渐成现实。>阅读原文
Karpathy盛赞DeepSeek - OCR,Claude Code助力跑通模型
DeepSeek发布OCR新模型,Karpathy赞其或淘汰tokenizer,认为像素作输入或更优;Pleiasfr联合创始人称是里程碑。开发者Simon靠Claude Code让模型在NVIDIA Spark跑通,用时不到40分钟。>阅读原文
谷歌量子AI超算13000倍,登Nature封面
谷歌宣布量子计算机运行可验证算法,性能超传统超算13000倍,成果登Nature封面。这让实用量子计算机更进一步,但部分学者怀疑其实际应用价值,认为断言尚早。>阅读原文
陈怀达:AI时代竞争力非单一技术领先
中国移动陈怀达称,‘AI+’时代呈现‘三个加速融合’趋势。未来要关注建强数智基建、强化场景驱动、构建共融生态。中国移动依托优势构建‘VR+AI’融合体系,在多方面有实践成果。>阅读原文
Maxwell Labs:激光冷却芯片或破摩尔定律
Maxwell Labs提出光子冷却法,利用反斯托克斯冷却原理集成到光子冷板。相比传统散热,它能消除暗硅、提频、助力3D集成,预计2027年落地,2030年后推广至边缘计算。>阅读原文
Meta裁员:田渊栋团队一锅端
Meta AI大裁员,裁到资深科学家田渊栋头上且整组端。田渊栋成果丰厚,开发围棋AI、Dualformer等。此次裁员不简单,OpenAI等已排队抢人。>阅读原文
OpenAI秘密项目或让华尔街初级岗位洗牌
OpenAI秘密项目「Mercury」招募前投行精英训练财务模型,欲替代初级银行家工作。这或是其盈利关键一步,但也让从业者担心失业与成长问题,多位资深金融人表达担忧。>阅读原文
谷歌量子计算突破:比超算快13000倍
谷歌量子AI团队有重大突破,Willow芯片运行“量子回声”算法,实现可验证量子优势,比最快超算快13000倍,为医药、材料等领域应用奠基,未来应用值得期待。>阅读原文
企业热衷Agentic AI,领导层理解却滞后
Sauce Labs调查:97%公司用或计划用Agentic AI测试,可61%领导层不懂测试需求。团队与高管期望有差,跨行业采用速度和深度因行业而异,科技公司或率先采用。>阅读原文
谷歌量子回声算法提速13000倍登Nature
谷歌量子团队提出“量子回声”算法登Nature封面,解决量子计算结果难确认问题,计算提速13000倍。算法展现实用量子优势,在多领域有潜力,未来聚焦研发长寿命逻辑量子比特。>阅读原文
OpenAI推Atlas,挑战谷歌浏览器
OpenAI山姆・奥特曼表示AI为重新定义浏览器提供机遇,推出ChatGPT Atlas,欲挑战谷歌。其功能丰富,但实测被吐槽,且智能代理浏览器有安全隐患,新浏览器改变格局不易。>阅读原文
亚马逊6800万AI奖学金,多位华人学者入选
亚马逊推出6800万美元AI博士奖学金计划,为九所顶尖大学博士生提供资金、云资源和导师支持。目前,MIT、CMU、UC伯克利公布名单,多位华人学者上榜,该计划有望推动AI技术落地。>阅读原文
三大企业探讨AI时代可观测新边界
阿里云李也、字节跳动董善东、小红书王亚普等认为,AI与可观测技术双向赋能,传统算法与大模型优势互补。三到五年有望实现半自治运维,数据治理和标准化是可观测系统发挥价值的前提。>阅读原文
Vercel CEO:Kimi K2准确率超GPT - 5 50%
Vercel CEO称内部测试中Kimi K2运行速度和准确率超GPT - 5等。硅谷多家公司已接入或转用K2,因其性能强且价格低。K2 Agent能力也获检验,有不错表现。>阅读原文
Meta AI大裁600人,LeCun或辞职
Meta AI大裁600人,由首席AI官亚历山大王操刀,他称部门官僚化需重组。扎克伯格对AI进展焦虑。LeCun或辞FAIR职务,还撇清与Llama关系,新成立的TBD Lab未裁员还招人。>阅读原文
Meta推Vibes,AI视频或成新风口
Meta推出Vibes功能,改写短视频玩法,降低创作门槛,欲打造新内容循环。但它也带来版权、真伪和治理难题。AI视频或成新全民入口,这场变革机遇与挑战并存。>阅读原文
中际旭创高增长还能持续多久?
今年中际旭创股价飙升,市值逼近4600亿,但控股股东计划减持。市场争论其估值,实现250亿利润受北美大厂算力、竞争、CPO影响。不过行业人士认为光模块增长趋势还将持续1至2年。>阅读原文
毛波:营销 Agent 落地难题与未来机会
瓴羊副总裁毛波称,营销 Agent 虽热,但缺“精准+长期+体验”方案。友盟+推 A2A、MCP 协议及平台产品,激活私域数据。未来护城河在于掌握私域数据与多 Agent 协作,机会在利用数据协同。>阅读原文
OpenAI合作引AI泡沫之争
OpenAI与AMD、英伟达等达成“股权换订单”合作,引发行业对泡沫的担忧。有观点认为泡沫存在,集中在应用层等;也有人觉得这次不同,且科技公司资本支出增长,AI增长空间大。>阅读原文
谷歌:量子计算首次可验证登《Nature》
谷歌宣布量子计算重大突破,量子回声算法在 Willow 芯片运行,速度远超传统超级计算机,结果可验证。这朝量子计算实用迈进一步,有望用于药物研发和材料科学。>阅读原文
中国模型打服硅谷,ChatGPT被拒!
爱彼迎CEO Brian Chesky:依赖阿里Qwen,它又好又快又便宜,ChatGPT没准备好;Vercel创始人:Kimi K2比前沿闭源模型快5倍、准确率高50%;DeepSeek多项成果获海外认可。>阅读原文
产品应用
798节气海报借AI展现篆刻非遗魅力
2025年798节气海报以24节气和非遗工艺为主题用AI创作。中国篆刻有3000多年历史,已列入非遗名录。艺术家谷文达挑战传统技法边界,其《天象》系列有深刻思考。>阅读原文
百川M2 Plus:循证医疗大模型横扫医考
百川智能推出Baichuan - M2 Plus医疗大模型,通过六源循证范式避免幻觉,在多场景评测中幻觉率比Deepseek - R1低3倍,多国医考成绩领先人类医生,已上线APP并开放API。>阅读原文
黄叔:OpenAI Atlas浏览器细节惊艳
AI产品黄叔:OpenAI发布的Atlas浏览器细节拉满,负责人履历亮眼,团队人才密度高。它体验丝滑,与ChatGPT打通,有诸多便捷设计,但功能还不完善,更重用户体验。>阅读原文
Qwen深度研究升级,新模型识别手写体
Qwen版深度研究升级,能生成网页和音频播客,还省去给AI提供内容环节。新视觉语言模型Qwen3 VL可识别医生手写体。实测功能体验好,Qwen3-VL系列更新后性能超竞品。>阅读原文
Gemini 3.0联手谷歌AI Studio重塑前端
谷歌发布新版AI Studio,产品向可视化构建转变,目标降低搭建AI应用难度。有消息称Gemini 3.0将发布,其在前端开发测试中表现出色,谷歌借此参与AI竞赛,关乎企业级AI战略。>阅读原文
谷歌推免费工具,集成多 AI 功能
谷歌推出免费 Vibe Coding 工具,AI Studio Built 模式更新,可混合匹配 AI 功能。能自动连接模型和 API,无需了解 API 文档,可快速做 MVP,谷歌 AI API 免费(限速),期待 Gemini 3.0。>阅读原文
松延动力:万元级Bumi开启家用机器人时代
松延动力推出全球首款万元内高性能人形机器人Bumi,能跑跳、能编程教学。其团队多为清华背景,此前已有多款优秀机器人产品,让具身智能从概念走向家庭应用。>阅读原文
观猹:中文互联网谐音梗AI社区
观猹平台:名字谐音「观察」,是轻松社区;「猹馆」谐音「茶馆」,鼓励自由交流;活跃成员群名玩梗;「瓜棚」即商城,会持续上架好物,邀用户一起成长。>阅读原文
谷歌AI Studio更新:一键生成AI应用
谷歌AI Studio更新,推出vibe编程体验,可一键生成AI应用。基于Gemini API,构建问答游戏不到1分钟,有部署、分享等选项,还免费,有AI建议功能,适合编程小白。>阅读原文
黄益贺:Claude Skills或推动Agent发展
黄益贺:Claude Skills对Agent发展重要,是‘能力包’。Anthropic设计分层加载节省上下文,预设Skills可体验,开源且模块化,或形成Skills Market,Anthropic找对了方向。>阅读原文
阿里云:AI Agent任务规划应分场景而定
阿里云团队实测发现大模型自主规划AI Agent问题多,准确率低。企业注重稳定,人工规划更合适。他们提出混合规划,泛化场景大模型自主规划,垂直场景人工SOP驱动,让人与AI各司其职。>阅读原文
推荐文章
Dylan Patel:Nvidia 是 AI 世界“中央银行”
SemiAnalysis 创始人 Dylan Patel 认为,AI 是产业迁徙,算力是新货币,Nvidia 如央行。AI 竞争涉及多方,数据等是话语权关键。技术上 Scaling Law 等有特点,硬件创新靠巨头,人才和能源也面临挑战。>阅读原文
蒋林泉刘湘明共话企业AI落地之道
阿里云蒋林泉和钛媒体刘湘明交流企业AI落地经验。指出CIO角色随时代进化,界定AI业务价值要结合技术与场景,选重复性、语言中心场景切入,企业落地要拉齐认知、躬身入局。>阅读原文
AI时代编程语言选型大揭秘
Armin Ronacher认为,AI时代编程语言选择更重要,语言影响代码生成质量。Go在AI场景适配性好,Python用于机器学习,Rust适合高性能场景。创业公司应务实选语言,且人机协作仍是趋势。>阅读原文
言午:Agent开发复盘,认知流程是关键
前Muanus研究员言午复盘一年半AI开发,指出大家对Agent理解有错位。认为Agent强大源于有效认知流程,如思维链、反思等,开发者应成流程架构师,解决性能等挑战,探索前沿架构。>阅读原文
开源动态
Dexbotic开源,提升具身智能VLA性能
Dexmal原力灵机开源Dexbotic,构建VLA统一平台,预训练模型在多仿真器提升传统策略,还推出开源硬件DOS - W1。其架构创新,与LeRobot各有侧重,还鼓励用RoboChallenge评测。>阅读原文
0.9B的PaddleOCR-VL成最强OCR模型
作者介绍PaddleOCR-VL,它是百度开源的OCR新模型,参数仅0.9B却效果最佳。架构分两步,高效准确。实测处理扫描PDF、手写笔记等表现出色,已开源,可本地部署或用官方体验版。>阅读原文
伯克利开源kvcached,共享GPU内存
伯克利团队开源kvcached,解决大模型部署中GPU内存利用率低问题。它引入虚拟内存,按需分配,测试提升效率,安装简单、兼容性好,适用于多场景,或成未来AI基建标配。>阅读原文
百度开源0.9B级OCR模型PaddleOCR-VL
百度开源PaddleOCR-VL,参数量0.9B,对算力要求低。它在权威榜单屠榜,经测试,能精准识别发票、合同、图表等,还可处理医疗报告、古籍文字、数学公式等,适合本地部署。>阅读原文
字节开源 MineContext 开启上下文管理新玩法
字节 Viking 团队推出 MineContext 应用,是“三步走”开源策略一部分。它能自动记录活动、生成日报等,还可深度分析。其理念新颖,未来 OpenContext 开源,开发者可按需搭建应用。>阅读原文
复旦&美团:R - HORIZON揭示LRMs长链推理瓶颈
复旦与美团LongCat Team推出R - HORIZON,评测发现主流LRMs长链推理性能断崖式下降,存在有效推理长度受限、反思机制局部化、思考预算分配失衡三大瓶颈,训练后模型性能和推理机制均有改善。>阅读原文
港中文&快手发布运镜克隆框架CamCloneMaster
港中文&快手可灵团队:发布CamCloneMaster框架,引入新范式摆脱相机参数依赖,统一I2V和V2V任务,开源大规模数据集,性能超SOTA,推动AIGC视频创作发展。>阅读原文
KTransformers:异构推理成大模型新范式
趋境科技与清华团队联合研发的KTransformers,论文入选SOSP 2025。它创新异构推理架构,加入专家延迟机制,与SGLang合作推动架构融合,成广泛复用框架,未来想让AI能力普惠。>阅读原文
腾讯开源混元世界模型1.1,秒变3D世界
腾讯开源混元世界模型1.1,能从多视图或视频一键生成3D世界,单卡秒级推理。它支持多模态先验输入、多任务统一输出,性能超同行,打破技术壁垒,让3D重建人人可用。>阅读原文
Dexmal原力灵机开源一站式VLA代码库
Dexmal原力灵机开源Dexbotic,这是基于PyTorch的VLA代码库,面向具身智能研究者。它架构合理、特征突出,还推开源硬件,未来会持续投入生态建设,邀开发者共建。>阅读原文
蚂蚁开源 HumanSense,推动 AI 交互革新
蚂蚁与西安交大联合提出并开源 HumanSense,含评估基准与推理模型。研究发现顶尖模型与人类有差距,语音是交互关键信息。还提出强化训练等优化策略,配套项目推动 AI 成生活伙伴。>阅读原文
算法论文
清华英伟达联手:rCM让视频生成提速50倍
清华与英伟达联合提出rCM方法,首次将连续时间一致性蒸馏用于大模型。它引入前向 - 反向散度联合优化,推理提速达50倍,兼顾生成质量与多样性,未来将用于NVIDIA Cosmos系列。>阅读原文
港中大平台让LLM学会造复杂机械
港中大团队推出BesiegeField平台,能让大模型在物理仿真世界设计机械。其将设计简化,通过闭环训练和强化学习提升模型能力,多模型测试中Gemini 2.5 Pro表现佳,有望拓展AI创造力边界。>阅读原文
论文:小模型借RL在推理任务展超强能力
论文指出大型语言模型在推理任务中使用外部工具是挑战,强化学习面临难题。通过数据、算法和推理模式的研究,提出实用方法,如真实数据、GRPO-TCR算法等,小模型DemyAgent-4B展现超强推理能力。>阅读原文
北航首创3D语义攻击框架,成功率暴涨119%
北航与中关村实验室团队提出InSUR框架,解决语义约束对抗样本生成难题。通过多维度创新,实现3D对抗物体生成,实验显示攻击性能提升,还可用于红队测试和对抗训练。>阅读原文
新加坡团队:Paper2Video 实现学术视频自动化
新加坡国立大学团队:提出 Paper2Video 基准为学术视频生成评估提供依据,推出 PaperTalker 框架实现自动化生产,实验表明其在多维度表现出色,效果接近人工。>阅读原文
ICLR投稿:OTV新范式提升模型推理性能
ICLR 2026投稿论文提出OTV新机制,构建在并行思考思路上,利用键值缓存和内部验证器判断推理路径。实验表明其准确率领先,能动态控成本,未来可在多方面拓展。>阅读原文
浙大Translution融合自注意力与卷积
浙大等校学者提出Translution,融合自注意力与卷积机制。它解决二者割裂问题,轻量化版α - Translution平衡性能与可训练性,实验显示其性能超Self - attention,提升源于相对建模机制。>阅读原文
腾讯优图:Training-Free GRPO让大模型RL优化变廉价
GRPO是常见RL算法,但训练成本高,中小团队玩不起。腾讯优图提出Training - Free GRPO,将其训练范式迁移到上下文学习,成本低、泛化好,在数学推理和网页搜索场景效果佳,已开源。>阅读原文
埃默里大学:LatentExplainer打开模型「黑箱」
埃默里大学团队:深度生成模型是「黑箱」,潜变量难理解。提出LatentExplainer框架,经三步流程为潜变量生成解释,在多指标上显著提升性能,为构建可信AI系统奠基。>阅读原文
</p>