AI日报：斯坦福博士出走xAI，押注AI共情力; 科大讯飞：为中国AI商业化“托底”; 宾大教授：AI正引发隐形阶层战

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-11-14 资讯日报

新闻资讯

斯坦福博士出走xAI，押注AI共情力

斯坦福博士Zelikman离开xAI创立Humans&，以40亿美元估值筹10亿打造有「情感智能」模型。他认为现有模型虽强大却冷漠，AI应学会理解人，资本也看好「情感AI」。>阅读原文

科大讯飞：为中国AI商业化“托底”

2025年中美AI发展路径分化，科大讯飞董事长刘庆峰给出AI发展四关键词。其用国产算力训练大模型，在教育、医疗等行业渗透，推出个性化产品。“项目制”有价值，还做平台、拓海外，为中国AI托底。>阅读原文

宾大教授：AI正引发隐形阶层战

宾大教授Ethan Mollick：AI正制造隐形社会分层，免费、20美元、200美元层级对应不同使用能力。思维差距是本质，未来关键是培养与AI协作直觉，学会用AI思考者将占优势。>阅读原文

李飞飞3D世界模型Marble开启公测

李飞飞团队的World Lab推出3D世界生成模型Marble并公测。用户能凭文本等生成专属3D世界，可编辑下载，还能VR体验。未来该模型将重点发力交互性。>阅读原文

V社连发三款游戏硬件构建生态

V社（Valve）：连发三款游戏硬件，VR头显Steam Frame可无线串流畅玩游戏，Steam Machine性能强，Steam Controller适合PC玩家，整合构建起闭环生态。>阅读原文

中国AI：反超美国的前夜

2025下半年中美AI圈有新变化，认可中国AI崛起，资本风险加剧。中国AI成本低、性能优、ROI达美国百倍。MiniMax商业化强、多模态领先，或成中国版OpenAI。>阅读原文

国产GLM - 4.6登顶Code Arena编码榜单

大模型编程竞争白热化，LMArena发布Code Arena评估系统。国产智谱GLM - 4.6登上榜首，此前其编码成功率高，还被Cerebras作为默认推荐，见证国产大模型从追赶到领跑。>阅读原文

百度文心5.0与OpenAI GPT - 5同日发力AI

2025年，OpenAI上线GPT - 5.1系列，百度发布文心5.0。它参数2.4万亿，评测领先，实测在多方面表现出色。其技术有多项突破，体现百度技术演进，助其重回AI竞争中心，将构建智能生态。>阅读原文

李彦宏：百度秀AI，称产业结构应转变

李彦宏称AI产业结构应从‘正金字塔’变为‘倒金字塔’，应用创造最大价值才健康。百度展示数字人、AI搜索等成果，发布文心大模型5.0和百度伐谋，还提及企业内化AI的方向。>阅读原文

百度发布文心大模型5.0，跻身世界第一梯队

2025百度世界大会发布新一代文心大模型5.0，采用全模态统一建模技术。它在LMArena榜单表现出色，能力进入世界第一梯队，具备原生全模态等优势，智能体能力也得到强化。>阅读原文

ICLR 2026分数滑坡，DeepMind研究员教你应对

ICLR 2026投稿量增质量降，平均分下滑。审稿人抱怨论文差，甚至有过激言论。DeepMind研究员称同行评审如‘随机数生成器’，还给出论文反驳指南，助投稿人绝地求生。>阅读原文

百度发布全球首个可商用自我演化智能体

李彦宏在百度世界大会称，AI产业结构应从‘正金字塔’变为‘倒金字塔’。百度展示多项成果，如数字人、重构搜索、更新秒哒等，还发布昆仑芯、文心大模型5.0和全球首个可商用自我演化智能体百度伐谋。>阅读原文

谷歌公开IMO金牌模型AlphaProof技术细节

谷歌DeepMind公开AlphaProof模型技术细节。团队小，核心成员提新方法。它将证明变游戏，训练用自动形式化。赛场靠TTRL突破，已开放使用，但处理新定义有瓶颈，数据生成待拓展。>阅读原文

文心5.0与GPT - 5.1同日登场，实力不俗

2025百度世界大会发布文心5.0，同日OpenAI推出GPT - 5.1。文心5.0是原生全模态模型，训练融合多模态数据。它在多模态理解、情绪安抚等方面表现佳，在LMArena成绩亮眼，实力不容小觑。>阅读原文

国产GPU企业技术商业路线大不同

国产 GPU 发展进入新阶段，企业路线各异。摩尔线程“高启动＋快扩张”，沐曦“厚积薄发＋服务高端”，壁仞聚焦云端，燧原只做训练加速卡，瀚博先做推理，格兰菲从底层搭建。>阅读原文

产品应用

字节TRAE升级：全流程开发AI协作平台

字节TRAE推出SOLO正式版，从IDE升级为AI协作平台。新增SOLO Coder智能体解决返工问题，三栏布局提升效率，让开发者享受AI便利又掌控项目，还开启上线福利。>阅读原文

英伟达ChronoEdit：破解图像编辑物理难题

英伟达和多伦多大学：提出ChronoEdit框架，把图像编辑看成拍微型电影，将难题转为视频生成问题，利用视频模型时间连续性知识，实验中性能出色，在物理一致性编辑上优势明显。>阅读原文

文心5.0发布，原生全模态实力惊人

百度发布文心5.0，主打原生全模态，支持全输入全输出。官方测试多维度表现优，LMArena排第二。实测理解强、抓细节，技术先进。这是百度又一次差异化突破，探索模型能力边界。>阅读原文

李飞飞推出可商用世界模型 Marble

李飞飞创业公司 World Labs 发布可商用世界模型 Marble，能多模态生成 3D 世界。李飞飞称空间智能是 AI 下一个前沿，当前 AI 缺乏空间概念，Marble 可降低 3D 创造门槛，助力多领域发展。>阅读原文

TRAE SOLO全量开放，成复杂开发好帮手

TRAE SOLO正式版全量开放，定位‘具备响应感知的编程智能体’。它新增功能，解决上下文管理等问题。实测中，它能从0到1构建项目，还可迭代修复，降低开发门槛，助力开发者向架构师转变。>阅读原文

Lumine：5小时通关《原神》的AI玩家登场

Lumine：作为强大AI玩家，能5小时通关《原神》主线，还能零训练玩其他游戏。它是开放式方案，靠少量数据和显卡让模型成智能体，有跨游戏泛化、指令执行等能力。>阅读原文

TRAE SOLO正式版上线，亮点多多等你来试

宝玉：TRAE SOLO正式版上线，模型能力提升。它打通‘行动➔验证’闭环，SubAgent管理上下文出色。正式版有多处升级，还分享用其打造浏览器插件的技巧，推荐试用。>阅读原文

宝玉分享提取讨论贴精华提示词

宝玉分享提示词助于提取 Hacker News 或 Reddit 讨论贴精华。最佳模型是 Gemini 2.5 Pro，介绍角色定位、工作流程，强调过滤噪音、提炼精华，还给出写作要求。>阅读原文

开源动态

新浪微博小模型超越近万亿参数模型

新浪微博发布并开源的VibeThinker - 1.5B模型，以15亿参数和不足8000美元成本，在数学等基准测试中超越近万亿参数模型。它采用频谱到信号原则训练，成本低且性能提升源于方法创新。>阅读原文

Character AI与耶鲁推出开源音视频模型OVI

Character AI和耶鲁大学推出OVI，打破闭源垄断。它架构对称，解决音画不同步难题，用旋转位置嵌入对齐时间，训练考究，生成效果好，升级后时长扩展，为开源音视频生成提供新思路。>阅读原文

Hulu - Med：开源医学大模型新范式

Hulu - Med团队提出通用医学视觉语言大模型Hulu - Med。该模型可统一理解医学多类数据，开源透明，降低成本，性能优异。未来将在多方面改进，邀请各界共同探索医学AI系统。>阅读原文

NVIDIA 开源工具：实时测试视觉语言模型

NVIDIA 开源 Live VLM WebUI，能实时用摄像头测试视觉语言模型。通过 WebRTC 处理视频流，支持多后端和平台，可用于模型对比等场景，安装方式多样，本地也能跑。>阅读原文

清华崔鹏团队开源 2M 表格理解模型 LimiX-2M

清华大学崔鹏团队开源 LimiX-2M 模型，仅 2M 参数量。它在 11 个权威评测中表现优异，能同时处理多任务，性能超经典模型，还具备低算力运行等优点，科研、落地潜力大。>阅读原文

算法论文

香港理工大：LinearRAG 革新 GraphRAG 图构建

香港理工大学团队指出，现有 GraphRAG 因图谱质量不佳，表现不如朴素 RAG。他们提出 LinearRAG 框架，有三大创新，在多数据集上超现有方法，代码和数据已开源，是实用之选。>阅读原文

LeCun离职Meta，发布最后一篇论文

LeCun在离职Meta当日提交新论文《LeJEPA》，介绍自监督学习方法。此前他推动JEPA架构发展，虽有争议，但他将筹资创业继续研究世界模型，65岁的他依旧充满闯劲。>阅读原文

北大团队：DemoHLM让机器人零样本上岗

北大与BeingBeyond团队：提出DemoHLM框架，采用分层控制和单演示数据生成，解决人形机器人移动操作难题，降低成本、提升泛化能力，虽有局限但为规模化应用提供路径。>阅读原文

UNCOMP：解锁 LLM 信息压缩新密码

论文 UNCOMP 被接收，引入截断矩阵熵解释 LLM 稀疏化，据此设计 UNCOMP 框架，通过层级、头级压缩优化 KV Cache，Prefill 阶段加速 60%，吞吐量提升 6.4 倍，极端压缩率下性能有保障。>阅读原文

VFM - VAE：加速扩散模型语义提取

近期，RAE 用预训练视觉表征提升扩散模型性能，同期西安交大与微软亚研院提出 VFM - VAE，结合 RAE 与 VAE，实验显示其性能优、训练效率高，未来将探索潜空间更多潜力。>阅读原文

GVE模型：155万视频练就9种检索技能

香港科技大学（广州）与阿里巴巴通义实验室合作，推出GVE模型。它用155万模拟视频训练，一次学会9种视频检索技能，在零样本下超越14个主流模型，为视频检索通用化提供方法论。>阅读原文

Rex - Omni：MLLM超越Grounding DINO成检测新希望

IDEA研究院团队：3B参数的Rex - Omni将视觉任务统一为‘下一个点预测’，结合4 - Token坐标编码与SFT + GRPO两阶段训练，在多基准超Grounding DINO，解决MLLM定位和行为缺陷，成下一代检测模型有力基线。>阅读原文

超对称公司提出宇宙尺度压缩构想

超对称公司基于BigBang - Proton提出宇宙尺度压缩构想。指出科学多任务学习是基石，Scaling Law可延伸至物理世界，还给出压缩计划和假设，有望推动科学发现范式转变，提高具身智能泛化能力。>阅读原文

快手可灵与中大推出GRPO卫兵缓解视觉过优化

中山大学、快手可灵等团队针对GRPO过度优化问题推出GRPO - Guard。它通过比率归一化和跨步梯度平衡，在多种任务中缓解过优化，保持生成质量，未来需构建更精确奖励模型。>阅读原文

谷歌DeepMind：AlphaProof IMO接近夺金

谷歌DeepMind的AlphaProof在2024年IMO获28分，接近金牌。它结合大模型与强化学习，用Lean语言证明，解出多道难题。虽有局限，但开启人机协作新篇，有望辅助攻克数学猜想。>阅读原文

    </p>

官网：www.AiReadingHub.com