AI日报：Meta AI大裁员，FAIR核心人物或离开; Karpathy盛赞DeepSeek - OCR，Claude Code助力跑通模型; 谷歌量子AI超算13000倍，登Nature

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-10-23 资讯日报

新闻资讯

Meta AI大裁员，FAIR核心人物或离开

Meta在AI部门裁员约600人，波及FAIR等团队。FAIR研究科学家总监田渊栋或离职，Meta正从开放式基础研究转向‘超级智能’，Lecun辞职威胁渐成现实。>阅读原文

Karpathy盛赞DeepSeek - OCR，Claude Code助力跑通模型

DeepSeek发布OCR新模型，Karpathy赞其或淘汰tokenizer，认为像素作输入或更优；Pleiasfr联合创始人称是里程碑。开发者Simon靠Claude Code让模型在NVIDIA Spark跑通，用时不到40分钟。>阅读原文

谷歌量子AI超算13000倍，登Nature封面

谷歌宣布量子计算机运行可验证算法，性能超传统超算13000倍，成果登Nature封面。这让实用量子计算机更进一步，但部分学者怀疑其实际应用价值，认为断言尚早。>阅读原文

陈怀达：AI时代竞争力非单一技术领先

中国移动陈怀达称，‘AI+’时代呈现‘三个加速融合’趋势。未来要关注建强数智基建、强化场景驱动、构建共融生态。中国移动依托优势构建‘VR+AI’融合体系，在多方面有实践成果。>阅读原文

Maxwell Labs：激光冷却芯片或破摩尔定律

Maxwell Labs提出光子冷却法，利用反斯托克斯冷却原理集成到光子冷板。相比传统散热，它能消除暗硅、提频、助力3D集成，预计2027年落地，2030年后推广至边缘计算。>阅读原文

Meta裁员：田渊栋团队一锅端

Meta AI大裁员，裁到资深科学家田渊栋头上且整组端。田渊栋成果丰厚，开发围棋AI、Dualformer等。此次裁员不简单，OpenAI等已排队抢人。>阅读原文

OpenAI秘密项目或让华尔街初级岗位洗牌

OpenAI秘密项目「Mercury」招募前投行精英训练财务模型，欲替代初级银行家工作。这或是其盈利关键一步，但也让从业者担心失业与成长问题，多位资深金融人表达担忧。>阅读原文

谷歌量子计算突破：比超算快13000倍

谷歌量子AI团队有重大突破，Willow芯片运行“量子回声”算法，实现可验证量子优势，比最快超算快13000倍，为医药、材料等领域应用奠基，未来应用值得期待。>阅读原文

企业热衷Agentic AI，领导层理解却滞后

Sauce Labs调查：97%公司用或计划用Agentic AI测试，可61%领导层不懂测试需求。团队与高管期望有差，跨行业采用速度和深度因行业而异，科技公司或率先采用。>阅读原文

谷歌量子回声算法提速13000倍登Nature

谷歌量子团队提出“量子回声”算法登Nature封面，解决量子计算结果难确认问题，计算提速13000倍。算法展现实用量子优势，在多领域有潜力，未来聚焦研发长寿命逻辑量子比特。>阅读原文

OpenAI推Atlas，挑战谷歌浏览器

OpenAI山姆・奥特曼表示AI为重新定义浏览器提供机遇，推出ChatGPT Atlas，欲挑战谷歌。其功能丰富，但实测被吐槽，且智能代理浏览器有安全隐患，新浏览器改变格局不易。>阅读原文

亚马逊6800万AI奖学金，多位华人学者入选

亚马逊推出6800万美元AI博士奖学金计划，为九所顶尖大学博士生提供资金、云资源和导师支持。目前，MIT、CMU、UC伯克利公布名单，多位华人学者上榜，该计划有望推动AI技术落地。>阅读原文

三大企业探讨AI时代可观测新边界

阿里云李也、字节跳动董善东、小红书王亚普等认为，AI与可观测技术双向赋能，传统算法与大模型优势互补。三到五年有望实现半自治运维，数据治理和标准化是可观测系统发挥价值的前提。>阅读原文

Vercel CEO：Kimi K2准确率超GPT - 5 50%

Vercel CEO称内部测试中Kimi K2运行速度和准确率超GPT - 5等。硅谷多家公司已接入或转用K2，因其性能强且价格低。K2 Agent能力也获检验，有不错表现。>阅读原文

Meta AI大裁600人，LeCun或辞职

Meta AI大裁600人，由首席AI官亚历山大王操刀，他称部门官僚化需重组。扎克伯格对AI进展焦虑。LeCun或辞FAIR职务，还撇清与Llama关系，新成立的TBD Lab未裁员还招人。>阅读原文

Meta推Vibes，AI视频或成新风口

Meta推出Vibes功能，改写短视频玩法，降低创作门槛，欲打造新内容循环。但它也带来版权、真伪和治理难题。AI视频或成新全民入口，这场变革机遇与挑战并存。>阅读原文

中际旭创高增长还能持续多久？

今年中际旭创股价飙升，市值逼近4600亿，但控股股东计划减持。市场争论其估值，实现250亿利润受北美大厂算力、竞争、CPO影响。不过行业人士认为光模块增长趋势还将持续1至2年。>阅读原文

毛波：营销 Agent 落地难题与未来机会

瓴羊副总裁毛波称，营销 Agent 虽热，但缺“精准+长期+体验”方案。友盟+推 A2A、MCP 协议及平台产品，激活私域数据。未来护城河在于掌握私域数据与多 Agent 协作，机会在利用数据协同。>阅读原文

OpenAI合作引AI泡沫之争

OpenAI与AMD、英伟达等达成“股权换订单”合作，引发行业对泡沫的担忧。有观点认为泡沫存在，集中在应用层等；也有人觉得这次不同，且科技公司资本支出增长，AI增长空间大。>阅读原文

谷歌：量子计算首次可验证登《Nature》

谷歌宣布量子计算重大突破，量子回声算法在 Willow 芯片运行，速度远超传统超级计算机，结果可验证。这朝量子计算实用迈进一步，有望用于药物研发和材料科学。>阅读原文

中国模型打服硅谷，ChatGPT被拒！

爱彼迎CEO Brian Chesky：依赖阿里Qwen，它又好又快又便宜，ChatGPT没准备好；Vercel创始人：Kimi K2比前沿闭源模型快5倍、准确率高50%；DeepSeek多项成果获海外认可。>阅读原文

产品应用

798节气海报借AI展现篆刻非遗魅力

2025年798节气海报以24节气和非遗工艺为主题用AI创作。中国篆刻有3000多年历史，已列入非遗名录。艺术家谷文达挑战传统技法边界，其《天象》系列有深刻思考。>阅读原文

百川M2 Plus：循证医疗大模型横扫医考

百川智能推出Baichuan - M2 Plus医疗大模型，通过六源循证范式避免幻觉，在多场景评测中幻觉率比Deepseek - R1低3倍，多国医考成绩领先人类医生，已上线APP并开放API。>阅读原文

黄叔：OpenAI Atlas浏览器细节惊艳

AI产品黄叔：OpenAI发布的Atlas浏览器细节拉满，负责人履历亮眼，团队人才密度高。它体验丝滑，与ChatGPT打通，有诸多便捷设计，但功能还不完善，更重用户体验。>阅读原文

Qwen深度研究升级，新模型识别手写体

Qwen版深度研究升级，能生成网页和音频播客，还省去给AI提供内容环节。新视觉语言模型Qwen3 VL可识别医生手写体。实测功能体验好，Qwen3-VL系列更新后性能超竞品。>阅读原文

Gemini 3.0联手谷歌AI Studio重塑前端

谷歌发布新版AI Studio，产品向可视化构建转变，目标降低搭建AI应用难度。有消息称Gemini 3.0将发布，其在前端开发测试中表现出色，谷歌借此参与AI竞赛，关乎企业级AI战略。>阅读原文

谷歌推免费工具，集成多 AI 功能

谷歌推出免费 Vibe Coding 工具，AI Studio Built 模式更新，可混合匹配 AI 功能。能自动连接模型和 API，无需了解 API 文档，可快速做 MVP，谷歌 AI API 免费（限速），期待 Gemini 3.0。>阅读原文

松延动力：万元级Bumi开启家用机器人时代

松延动力推出全球首款万元内高性能人形机器人Bumi，能跑跳、能编程教学。其团队多为清华背景，此前已有多款优秀机器人产品，让具身智能从概念走向家庭应用。>阅读原文

观猹：中文互联网谐音梗AI社区

观猹平台：名字谐音「观察」，是轻松社区；「猹馆」谐音「茶馆」，鼓励自由交流；活跃成员群名玩梗；「瓜棚」即商城，会持续上架好物，邀用户一起成长。>阅读原文

谷歌AI Studio更新：一键生成AI应用

谷歌AI Studio更新，推出vibe编程体验，可一键生成AI应用。基于Gemini API，构建问答游戏不到1分钟，有部署、分享等选项，还免费，有AI建议功能，适合编程小白。>阅读原文

黄益贺：Claude Skills或推动Agent发展

黄益贺：Claude Skills对Agent发展重要，是‘能力包’。Anthropic设计分层加载节省上下文，预设Skills可体验，开源且模块化，或形成Skills Market，Anthropic找对了方向。>阅读原文

阿里云：AI Agent任务规划应分场景而定

阿里云团队实测发现大模型自主规划AI Agent问题多，准确率低。企业注重稳定，人工规划更合适。他们提出混合规划，泛化场景大模型自主规划，垂直场景人工SOP驱动，让人与AI各司其职。>阅读原文

开源动态

Dexbotic开源，提升具身智能VLA性能

Dexmal原力灵机开源Dexbotic，构建VLA统一平台，预训练模型在多仿真器提升传统策略，还推出开源硬件DOS - W1。其架构创新，与LeRobot各有侧重，还鼓励用RoboChallenge评测。>阅读原文

0.9B的PaddleOCR-VL成最强OCR模型

作者介绍PaddleOCR-VL，它是百度开源的OCR新模型，参数仅0.9B却效果最佳。架构分两步，高效准确。实测处理扫描PDF、手写笔记等表现出色，已开源，可本地部署或用官方体验版。>阅读原文

伯克利开源kvcached，共享GPU内存

伯克利团队开源kvcached，解决大模型部署中GPU内存利用率低问题。它引入虚拟内存，按需分配，测试提升效率，安装简单、兼容性好，适用于多场景，或成未来AI基建标配。>阅读原文

百度开源0.9B级OCR模型PaddleOCR-VL

百度开源PaddleOCR-VL，参数量0.9B，对算力要求低。它在权威榜单屠榜，经测试，能精准识别发票、合同、图表等，还可处理医疗报告、古籍文字、数学公式等，适合本地部署。>阅读原文

字节开源 MineContext 开启上下文管理新玩法

字节 Viking 团队推出 MineContext 应用，是“三步走”开源策略一部分。它能自动记录活动、生成日报等，还可深度分析。其理念新颖，未来 OpenContext 开源，开发者可按需搭建应用。>阅读原文

复旦&美团：R - HORIZON揭示LRMs长链推理瓶颈

复旦与美团LongCat Team推出R - HORIZON，评测发现主流LRMs长链推理性能断崖式下降，存在有效推理长度受限、反思机制局部化、思考预算分配失衡三大瓶颈，训练后模型性能和推理机制均有改善。>阅读原文

港中文&快手发布运镜克隆框架CamCloneMaster

港中文&快手可灵团队：发布CamCloneMaster框架，引入新范式摆脱相机参数依赖，统一I2V和V2V任务，开源大规模数据集，性能超SOTA，推动AIGC视频创作发展。>阅读原文

KTransformers：异构推理成大模型新范式

趋境科技与清华团队联合研发的KTransformers，论文入选SOSP 2025。它创新异构推理架构，加入专家延迟机制，与SGLang合作推动架构融合，成广泛复用框架，未来想让AI能力普惠。>阅读原文

腾讯开源混元世界模型1.1，秒变3D世界

腾讯开源混元世界模型1.1，能从多视图或视频一键生成3D世界，单卡秒级推理。它支持多模态先验输入、多任务统一输出，性能超同行，打破技术壁垒，让3D重建人人可用。>阅读原文

Dexmal原力灵机开源一站式VLA代码库

Dexmal原力灵机开源Dexbotic，这是基于PyTorch的VLA代码库，面向具身智能研究者。它架构合理、特征突出，还推开源硬件，未来会持续投入生态建设，邀开发者共建。>阅读原文

蚂蚁开源 HumanSense，推动 AI 交互革新

蚂蚁与西安交大联合提出并开源 HumanSense，含评估基准与推理模型。研究发现顶尖模型与人类有差距，语音是交互关键信息。还提出强化训练等优化策略，配套项目推动 AI 成生活伙伴。>阅读原文

算法论文

清华英伟达联手：rCM让视频生成提速50倍

清华与英伟达联合提出rCM方法，首次将连续时间一致性蒸馏用于大模型。它引入前向 - 反向散度联合优化，推理提速达50倍，兼顾生成质量与多样性，未来将用于NVIDIA Cosmos系列。>阅读原文

港中大平台让LLM学会造复杂机械

港中大团队推出BesiegeField平台，能让大模型在物理仿真世界设计机械。其将设计简化，通过闭环训练和强化学习提升模型能力，多模型测试中Gemini 2.5 Pro表现佳，有望拓展AI创造力边界。>阅读原文

论文：小模型借RL在推理任务展超强能力

论文指出大型语言模型在推理任务中使用外部工具是挑战，强化学习面临难题。通过数据、算法和推理模式的研究，提出实用方法，如真实数据、GRPO-TCR算法等，小模型DemyAgent-4B展现超强推理能力。>阅读原文

北航首创3D语义攻击框架，成功率暴涨119%

北航与中关村实验室团队提出InSUR框架，解决语义约束对抗样本生成难题。通过多维度创新，实现3D对抗物体生成，实验显示攻击性能提升，还可用于红队测试和对抗训练。>阅读原文

新加坡团队：Paper2Video 实现学术视频自动化

新加坡国立大学团队：提出 Paper2Video 基准为学术视频生成评估提供依据，推出 PaperTalker 框架实现自动化生产，实验表明其在多维度表现出色，效果接近人工。>阅读原文

ICLR投稿：OTV新范式提升模型推理性能

ICLR 2026投稿论文提出OTV新机制，构建在并行思考思路上，利用键值缓存和内部验证器判断推理路径。实验表明其准确率领先，能动态控成本，未来可在多方面拓展。>阅读原文

浙大Translution融合自注意力与卷积

浙大等校学者提出Translution，融合自注意力与卷积机制。它解决二者割裂问题，轻量化版α - Translution平衡性能与可训练性，实验显示其性能超Self - attention，提升源于相对建模机制。>阅读原文

腾讯优图：Training-Free GRPO让大模型RL优化变廉价

GRPO是常见RL算法，但训练成本高，中小团队玩不起。腾讯优图提出Training - Free GRPO，将其训练范式迁移到上下文学习，成本低、泛化好，在数学推理和网页搜索场景效果佳，已开源。>阅读原文

埃默里大学：LatentExplainer打开模型「黑箱」

埃默里大学团队：深度生成模型是「黑箱」，潜变量难理解。提出LatentExplainer框架，经三步流程为潜变量生成解释，在多指标上显著提升性能，为构建可信AI系统奠基。>阅读原文

    </p>

官网：www.AiReadingHub.com