AI日报:美团年会:大咖共探机器人与具身智能; Karpathy、马斯克热议 AI 输入输出新趋势; 前Meta大神创业,PokeeResearch - 7B刷新SOTA

74 阅读4分钟

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。

2025-10-22 资讯日报

新闻资讯

美团年会:大咖共探机器人与具身智能

2025美团机器人研究院学术年会大咖云集。毛一年展示美团机器人进展,李一帆称机器人是中国机遇,王潜指出具身智能是基础模型。圆桌讨论围绕机器人原理、软硬件、数据与模型等展开。>阅读原文

Karpathy、马斯克热议 AI 输入输出新趋势

Karpathy 认为输入 LLM 内容应是图像非文本,文本 token 冗余,分词器必须消失。马斯克称 AI 主要交互是视觉。开发者实践显示图像输入有优势,但也有人质疑图像输入效果。>阅读原文

前Meta大神创业,PokeeResearch - 7B刷新SOTA

Pokee AI:AI已解决“生成内容”,未解决“执行任务”。其用强化学习打造PokeeResearch - 7B,靠AI反馈训练和推理框架,在基准测试中性能超越对手,产品已公开测试并与谷歌合作。>阅读原文

美团年会:学界业界具身智能观点统一

美团在IROS年会展示成果,其无人机配送初具规模。席宁提出GAT和非向量空间模型;王潜认为具身智能是基础模型;圆桌嘉宾探讨‘第一性原理’,学界业界对具身智能观点统一。>阅读原文

CVPR2026新规:强制披露算力成本并设认可奖

CVPR2026新规要求论文作者强制提交计算资源报告,不影响论文接收。目的是增加研究透明度和公平性,高效、高透明度论文可获三项认可奖,还汇总解答了常见问题。>阅读原文

清华团队凭小模型获大赛冠军估值2亿

清华万格智能团队获国际大学生创新大赛冠军。团队由三名本科生创立,估值2亿美元。他们的智人HRM模型摆脱概率束缚,在推理、小样本学习等方面表现出色,还研发出顶尖气候预测专家模型。>阅读原文

阿里云Aegaeon:狂砍82%英伟达GPU需求

阿里云与北大合作研究,周靖人带队推出Aegaeon系统。该系统针对GPU资源利用率低的痛点,用token级调度技术,降低扩缩容开销,实战中吞吐量最高提升9倍,已在百炼平台测试成功。>阅读原文

6G借助超表面让建筑「听懂」信号

新智元报道,5G基站功耗高、室内信号差,96%流量源于室内。6G探索借智能超表面和建筑无线友好性破局。东北大学张继良团队研究人类移动行为对超表面嵌入建筑信道的影响,成果被IEEE接收。>阅读原文

特朗普:H-1B签证申请费涨至10万美元

特朗普将H-1B签证申请费涨至10万美元,引发美国学界业界震动。高校担心人才短缺、费用难承,科技初创或受重创,不过有人觉得能筛出顶尖人才,此政策或面临法律挑战。>阅读原文

Jason Wei谈2025年AI发展三大思路

Jason Wei:2025年AI发展有三个核心思想。验证者定律指出AI将攻克易验证任务;智能商品化使智能成本趋近零,获取信息即时;智能的锯齿状边缘表明各任务发展不均衡。>阅读原文

哈佛AI数周破解「衰老密码」

哈佛团队用K - Dense在几周内完成衰老研究,揭示衰老分阶段运转。K - Dense科研能力强,在测试中表现超GPT - 5。此成果或量化长寿秘密,也引发科研伦理等问题讨论。>阅读原文

存储超级周期来临,兆易创新迎爆发

随着存储芯片第二波涨价潮开启,全球产业链企业股价狂欢。AI时代存储芯片需求外溢,超级周期来临,国产芯片龙头翻身。兆易创新存储产品线涨价,利基型芯片市场供应紧缺,公司有望提升份额。>阅读原文

Anthropic:Claude Code上线,还进军生命科学

Anthropic动作不断,推出Claude Code网页版和iOS预览版,有并行处理等亮点;还发布生命科学版,搭载Claude Sonnet 4.5,能完成多项科研任务,合作名单豪华。>阅读原文

Karpathy:DeepSeek - OCR或淘汰tokenizer

DeepSeek发布OCR新模型,Karpathy赞其或淘汰tokenizer;Pleiasfr联合创始人称它是基础型模型;开发者Simon用Claude Code让模型在N卡运行,不到40分钟成功,总结了成功要点。>阅读原文

OpenAI发布AI浏览器ChatGPT Atlas

OpenAI发布以ChatGPT为核心的浏览器ChatGPT Atlas,有内置ChatGPT、浏览器记忆等功能。智能体模式可完成任务,但有风险。AI浏览器竞争激烈,其大众影响力待检验。>阅读原文

宋紫薇创业,首款AI化妆镜产品曝光

前vivo“最美产品经理”宋紫薇创业,其公司薇光点亮瞄准AI化妆镜。智能化妆镜早有但不够智能,AI赋能或玩法升级,还能探索硬件及服务新模式,与她履历也相符。>阅读原文

ChatGPT缔造者联手攻坚高温超导

OpenAI前研究副总裁Liam Fedus与DeepMind的Ekin Cubuk创立Periodic Labs,获3亿美元种子轮融资。他们认为AI应推动科学,要构建自主实验室,攻坚高温超导,变革科研范式。>阅读原文

OpenAI发布AI浏览器ChatGPT Atlas

OpenAI发布ChatGPT Atlas浏览器,目前仅macOS版。它将ChatGPT接入,有记忆等功能,还具备智能体模式。虽有安全措施,但智能体存风险,建议用户谨慎提供信息。>阅读原文

IROS圆桌:模型驱动与数据驱动之争

在美团举办的学术年会上,嘉宾探讨具身智能。王兴兴等认为智能第一性原理待明确,软硬件相互迭代。赵明国等探讨模型与数据驱动利弊。大家还谈及机器人最终形态,鼓励年轻人投身行业。>阅读原文

专家共探AI Agent提效软件研发之路

多位专家认为AI Agent在软件研发中多起辅助作用,前端知识库有结构复杂等特点,自学习需人机协同。落地要重“人”因素,未来前端或围绕多模态爆发,运维或走向多agent协作。>阅读原文

LangChain 融资,估值达 12.5 亿美元

LangChain:完成新一轮融资,估值 12.5 亿美元。产品从单一包发展成平台,客户广泛。融资后发布多项更新,资金用于产品与平台建设,目标构建智能体工程平台。>阅读原文

ICCV最佳论文出炉,朱俊彦团队夺冠

10月22日ICCV揭晓奖项,卡耐基梅隆大学朱俊彦团队论文提出BrickGPT,可生成积木结构;以色列理工学院论文提出FlowEdit,实现高保真图像编辑,二者分别获最佳论文、最佳学生论文奖。>阅读原文

科大讯飞Q3财报:净利润暴涨202%

科大讯飞2025年Q3财报佳,营收、利润、现金流转正,归母净利润增202%。业绩得益于非经常性损益与核心业务,AI大模型成增长核心,技术、业务、生态成果好,还将融资加大研发。>阅读原文

ICCV 2025:何恺明等十年论文夺奖

ICCV 2025公布奖项,CMU团队BrickGPT获最佳论文,以色列理工学院FlowEdit获最佳学生论文。何恺明等十年前论文获Helmholtz Prize。大会规模超往届,超半作者来自中国。>阅读原文

前微软科学家用AI改造美国签证服务

前微软科学家Priyanka Kulkarni创办Casium,用AI重构移民服务,将签证申请材料准备期从3 - 6个月缩至10个工作日内。H-1B新政让成本增加,其服务需求凸显,已获500万美元融资。>阅读原文

产品应用

Anthropic新技能Claude Skills或引领新范式

作者认为Anthropic新推出的Claude Skills会引导第三方工具形态。它以笔记式形态降低学习门槛,结合代码与自然语言分工,实现AI自我进化,将学习成本从人转移到机器,是一种新范式。>阅读原文

HappyRobot:用AI革新物流沟通

三位欧洲创业者创办HappyRobot,为物流业打造AI-native平台,用Voice AI Agents替代人工。公司已完成6200万美元融资,估值5亿美元,与100多家公司合作,还想拓展到其他行业,但面临AI价值兑现不对称等挑战。>阅读原文

天猫:AI测试用例生成实践与突破

天猫技术团队探索AI赋能测试,采用“需求规范化 + Prompt工程 + 知识库RAG + 平台化集成”策略。部分领域提效明显,C端采纳率高,后续将深入AI能力、推进全流程自动化。>阅读原文

OpenAI发布首款AI浏览器ChatGPT Atlas

OpenAI推出首款AI浏览器ChatGPT Atlas,有总结内容、改写文本等功能,目前仅macOS版,后续推多版本。Agent模式付费预览,Plus等用户可用,操控网页软件效果一般。>阅读原文

阿里RecGPT:LLM推荐系统落地方案

阿里RecGPT推荐系统在召回和可解释性落地。召回用三塔结构,借LLM理解语义提升多样性;给出推荐归因,用离线预处理技巧。大模型微调分三步,评估用LLM as a Judge降低人力。>阅读原文

Vidu Q2:多图参考生视频的王者升级

作者认为Vidu Q2多图参考生视频是新范式,在一致性、表演和多风格表现上升级,如多主体同框、细腻表演、多样动画风格。价格实惠,APP有趣,多图参考生视频未来被看好。>阅读原文

小G:AI驱动的Blinko卡片笔记项目来袭

小G介绍Blinko项目,它是AI驱动的卡片笔记工具,有AI增强检索等特性,支持多平台与多种AI模型,采用开源模式,欢迎社区协作。>阅读原文

OpenAI推出浏览器ChatGPT Atlas

OpenAI推出ChatGPT Atlas浏览器,集成ChatGPT,有随行聊天、浏览器记忆、代理模式三大功能。能理解网页内容、自主操作网页。现面向macOS用户上线,更高级功能对付费用户开放,注重安全与用户控制。>阅读原文

Vidu Q2「参考生」上线,AI视频创作神器来袭

生数科技Vidu Q2「参考生」功能上线,APP改版。它有「视频延长」功能,最长5分钟,在一致性、速度、成本上表现佳,镜头语言和语义理解强,APP社交玩法丰富,引领AI视频发展。>阅读原文

OpenAI发布AI浏览器Atlas,剑指未来

池建强:OpenAI发布AI浏览器Atlas,集成ChatGPT,功能超Dia和Comet。它让ChatGPT读取网页数据、执行动作,或成AI操作系统接口,OpenAI凭模型、平台、用户优势入局。>阅读原文

推荐文章

微软工程师:AI 正颠覆编程行业

微软工程师 Paul Payne 有 30 多年编程经验,他认为 AI 工具发展迅速,Amplifier 让编程工作大幅减少。虽面临存在危机,但人类工程师将从底层解放,向更高价值升华。>阅读原文

报告剖析职业身份资本价值与策略

报告指出,当代职业人面临制度化与涌现性资本抉择。身份资本分五类,投入产出有别。成功关键是实现身份杠杆效应,AI时代要成AI增强型专家,构建平衡身份组合。>阅读原文

Andrej:模型与人都会‘认知坍塌’

Andrej Karpathy称,模型用合成数据训练会‘认知坍塌’,能力退化。他认为人类随年龄增长和经验固化,也会像模型一样,从无限可能收敛到固定思维模式,出现类似中年人的认知坍塌。>阅读原文

深度剖析GPU互联技术发展之路

文章指出GPU互联技术不断发展,早期SLI、CrossFire有局限,英伟达NVLink协议优势明显,历经多代升级带宽提升。DGX简易,HGX灵活,NVIDIA GB300 NVL72超节点性能强大。>阅读原文

众安信科:让AI Agent成企业业务专才

甲子光年:AI Agent从通才走向专才,市场关注“业务懂行”。众安信科深耕企业场景,构建闭环,其AI Agent在营销、理赔等场景展现实力,多智能体协同更具优势。>阅读原文

开源动态

上海AI Lab推MUSE框架,让智能体自我进化

上海人工智能实验室等推出MUSE框架,让智能体先做、反思、进化,解决长程任务难题。实验中,它用轻量级模型击败大模型,还具备持续进化等能力,未来可在记忆、经验、评估上优化。>阅读原文

HAMi 2.7.0发布:异构芯片调度升级

Dynamia密瓜智能:发布HAMi 2.7.0版,异构芯片支持全面拓展,调度器优化让资源计算更准、可观测性更强,应用层生态整合使开发部署体验提升,如vLLM兼容性增强等。>阅读原文

DeepSeek开源OCR模型挑战文本压缩极限

DeepSeek开源OCR模型,探讨1000字文档最少所需vision tokens。实验显示10倍压缩准确率97%,还能模拟人类遗忘。提供多种模式适配不同场景,开源推动领域发展。>阅读原文

DeepSeek - OCR:让AI看图思考的新思路

开源AI:DeepSeek - OCR不是传统OCR,不适合传统场景。它能解决大模型上下文长度问题,通过文字图片压缩解压提高处理速度,是让AI看图思考的新思路,目前难用上但未来潜力大。>阅读原文

DeepSeek开源3B OCR模型,处理文档超高效

DeepSeek开源DeepSeek - OCR模型,参数量30亿,A100单日处理20万页文档。采用视觉压缩思路,解决大模型算力难题,支持多任务,适用于RAG构建等场景,是多模态文档理解入口。>阅读原文

Karpathy赞DeepSeek新模型终结分词器时代

DeepSeek的DeepSeek - OCR在OCR任务表现出色,压缩率高、速度快。Karpathy赞其动摇文本核心地位,主张赶走分词器;马斯克猜想AI未来输入输出多为光子。>阅读原文

智源开源 EditScore 解锁图像编辑 RL 潜力

智源团队:为攻克图像编辑难题,发布 EditScore 系列模型并开源。它在 EditReward - Bench 表现优,可作重排序器和奖励信号,还揭示奖励模型训练和集成策略的关键要点。>阅读原文

算法论文

HumanLift:单图实现高保真数字人重建

中国科学院计算技术研究所等合作提出 HumanLift 技术。该技术融合三维视频扩散模型和人脸增强,输入单张人体图片,就能重建高逼真三维数字人,解决传统方法难题。>阅读原文

苹果AI:Mamba+工具在Agent任务胜Transformer

苹果研究团队:在Agent式任务中,Mamba效率与泛化能力超Transformer。虽Mamba有短板,但引入外部工具后性能提升,在多任务中表现优于Transformer。>阅读原文

清华、快手:AttnRL让大模型推理更高效

清华、快手团队:提出AttnRL框架,用注意力机制引导过程监督强化学习探索。它解决传统方法效率问题,在多数学推理基准测试中提升准确率,实现性能与效率双赢。>阅读原文

GRACE框架:让Embedding从黑箱变透明

多高校研究团队:推出GRACE框架,将对比学习变为强化学习,让模型先解释再学Embedding,在多任务测试中表现出色,实现强性能与高可解释性,是Embedding范式转变。>阅读原文

UC Berkeley团队:RL可突破模型推理边界

UC Berkeley等团队研究指出,RL能让模型发现新推理模式,前提是采用新训练方式。他们用DELTA框架验证,发现“RL grokking”现象,还总结RL两种模式,建议关注“硬核任务”。>阅读原文

Deg - Rag为GraphRAG图谱“提纯”效果佳

PaperRAG指出传统RAG能力受限,Graph - based RAG图谱噪音大。提出Deg - Rag方案,经实验,去噪后图谱平均砍40%实体、30 - 60%关系,QA胜率提升,验证“Less is More”。>阅读原文

温度缩放突破TTS瓶颈提升LLM推理性能

编辑部:传统TTS依赖增加样本数量提升性能有瓶颈,不同采样温度下模型能解决的问题子集不同。提出温度缩放新思路,实验平均提升7.3个百分点,还给出多温度投票算法降成本。>阅读原文

字节跳动发布LLM训练系统ByteRobust

字节跳动:推出LLM训练基础设施ByteRobust,含控制和数据平面。它优先快速隔离故障、考量人为错误,已部署超一年,能有效减少检测时间,提升恢复速度和ETTR。>阅读原文

港科大用法案提升AI模型守法率11%

香港科技大学KnowComp实验室从法律合规研究LLM安全,以《欧盟人工智能法案》等为标准构建benchmark,微调Qwen3 - 8B得推理模型,性能提升超10%,还能让现有安全数据对齐合规领域。>阅读原文

Flash - Searcher:革新Web Agent并行执行

OPPO团队提出Flash - Searcher,以DAG并行执行机制为核心,解决Web智能体顺序执行问题。它在多基准上刷新最优,减少执行步骤和时延,并行推理可迁移,代码已开源。>阅读原文

哈佛:纯采样算法让基础模型推理超越RL

哈佛论文指出,传统RL后训练有成本高、多样性下降等缺陷。其提出“幂采样”纯采样算法,在多任务评测中接近或超越GRPO,重新定义基础模型能力,为无训练推理提供新思路。>阅读原文

拓元智慧 DrDiff 革新长文本生成

拓元智慧等团队推出 DrDiff 框架,针对长文本生成难题,通过分层稀疏注意力等三个创新组件,实现效率与质量双提升。测试显示,它在多项任务表现佳,未来将探索更多应用。>阅读原文

    </p>
    

官网:www.AiReadingHub.com