All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-11-14 资讯日报
新闻资讯
斯坦福博士出走xAI,押注AI共情力
斯坦福博士Zelikman离开xAI创立Humans&,以40亿美元估值筹10亿打造有「情感智能」模型。他认为现有模型虽强大却冷漠,AI应学会理解人,资本也看好「情感AI」。>阅读原文
科大讯飞:为中国AI商业化“托底”
2025年中美AI发展路径分化,科大讯飞董事长刘庆峰给出AI发展四关键词。其用国产算力训练大模型,在教育、医疗等行业渗透,推出个性化产品。“项目制”有价值,还做平台、拓海外,为中国AI托底。>阅读原文
宾大教授:AI正引发隐形阶层战
宾大教授Ethan Mollick:AI正制造隐形社会分层,免费、20美元、200美元层级对应不同使用能力。思维差距是本质,未来关键是培养与AI协作直觉,学会用AI思考者将占优势。>阅读原文
李飞飞3D世界模型Marble开启公测
李飞飞团队的World Lab推出3D世界生成模型Marble并公测。用户能凭文本等生成专属3D世界,可编辑下载,还能VR体验。未来该模型将重点发力交互性。>阅读原文
V社连发三款游戏硬件构建生态
V社(Valve):连发三款游戏硬件,VR头显Steam Frame可无线串流畅玩游戏,Steam Machine性能强,Steam Controller适合PC玩家,整合构建起闭环生态。>阅读原文
中国AI:反超美国的前夜
2025下半年中美AI圈有新变化,认可中国AI崛起,资本风险加剧。中国AI成本低、性能优、ROI达美国百倍。MiniMax商业化强、多模态领先,或成中国版OpenAI。>阅读原文
国产GLM - 4.6登顶Code Arena编码榜单
大模型编程竞争白热化,LMArena发布Code Arena评估系统。国产智谱GLM - 4.6登上榜首,此前其编码成功率高,还被Cerebras作为默认推荐,见证国产大模型从追赶到领跑。>阅读原文
百度文心5.0与OpenAI GPT - 5同日发力AI
2025年,OpenAI上线GPT - 5.1系列,百度发布文心5.0。它参数2.4万亿,评测领先,实测在多方面表现出色。其技术有多项突破,体现百度技术演进,助其重回AI竞争中心,将构建智能生态。>阅读原文
李彦宏:百度秀AI,称产业结构应转变
李彦宏称AI产业结构应从‘正金字塔’变为‘倒金字塔’,应用创造最大价值才健康。百度展示数字人、AI搜索等成果,发布文心大模型5.0和百度伐谋,还提及企业内化AI的方向。>阅读原文
百度发布文心大模型5.0,跻身世界第一梯队
2025百度世界大会发布新一代文心大模型5.0,采用全模态统一建模技术。它在LMArena榜单表现出色,能力进入世界第一梯队,具备原生全模态等优势,智能体能力也得到强化。>阅读原文
ICLR 2026分数滑坡,DeepMind研究员教你应对
ICLR 2026投稿量增质量降,平均分下滑。审稿人抱怨论文差,甚至有过激言论。DeepMind研究员称同行评审如‘随机数生成器’,还给出论文反驳指南,助投稿人绝地求生。>阅读原文
百度发布全球首个可商用自我演化智能体
李彦宏在百度世界大会称,AI产业结构应从‘正金字塔’变为‘倒金字塔’。百度展示多项成果,如数字人、重构搜索、更新秒哒等,还发布昆仑芯、文心大模型5.0和全球首个可商用自我演化智能体百度伐谋。>阅读原文
谷歌公开IMO金牌模型AlphaProof技术细节
谷歌DeepMind公开AlphaProof模型技术细节。团队小,核心成员提新方法。它将证明变游戏,训练用自动形式化。赛场靠TTRL突破,已开放使用,但处理新定义有瓶颈,数据生成待拓展。>阅读原文
文心5.0与GPT - 5.1同日登场,实力不俗
2025百度世界大会发布文心5.0,同日OpenAI推出GPT - 5.1。文心5.0是原生全模态模型,训练融合多模态数据。它在多模态理解、情绪安抚等方面表现佳,在LMArena成绩亮眼,实力不容小觑。>阅读原文
国产GPU企业技术商业路线大不同
国产 GPU 发展进入新阶段,企业路线各异。摩尔线程“高启动+快扩张”,沐曦“厚积薄发+服务高端”,壁仞聚焦云端,燧原只做训练加速卡,瀚博先做推理,格兰菲从底层搭建。>阅读原文
产品应用
字节TRAE升级:全流程开发AI协作平台
字节TRAE推出SOLO正式版,从IDE升级为AI协作平台。新增SOLO Coder智能体解决返工问题,三栏布局提升效率,让开发者享受AI便利又掌控项目,还开启上线福利。>阅读原文
英伟达ChronoEdit:破解图像编辑物理难题
英伟达和多伦多大学:提出ChronoEdit框架,把图像编辑看成拍微型电影,将难题转为视频生成问题,利用视频模型时间连续性知识,实验中性能出色,在物理一致性编辑上优势明显。>阅读原文
文心5.0发布,原生全模态实力惊人
百度发布文心5.0,主打原生全模态,支持全输入全输出。官方测试多维度表现优,LMArena排第二。实测理解强、抓细节,技术先进。这是百度又一次差异化突破,探索模型能力边界。>阅读原文
李飞飞推出可商用世界模型 Marble
李飞飞创业公司 World Labs 发布可商用世界模型 Marble,能多模态生成 3D 世界。李飞飞称空间智能是 AI 下一个前沿,当前 AI 缺乏空间概念,Marble 可降低 3D 创造门槛,助力多领域发展。>阅读原文
TRAE SOLO全量开放,成复杂开发好帮手
TRAE SOLO正式版全量开放,定位‘具备响应感知的编程智能体’。它新增功能,解决上下文管理等问题。实测中,它能从0到1构建项目,还可迭代修复,降低开发门槛,助力开发者向架构师转变。>阅读原文
Lumine:5小时通关《原神》的AI玩家登场
Lumine:作为强大AI玩家,能5小时通关《原神》主线,还能零训练玩其他游戏。它是开放式方案,靠少量数据和显卡让模型成智能体,有跨游戏泛化、指令执行等能力。>阅读原文
TRAE SOLO正式版上线,亮点多多等你来试
宝玉:TRAE SOLO正式版上线,模型能力提升。它打通‘行动➔验证’闭环,SubAgent管理上下文出色。正式版有多处升级,还分享用其打造浏览器插件的技巧,推荐试用。>阅读原文
宝玉分享提取讨论贴精华提示词
宝玉分享提示词助于提取 Hacker News 或 Reddit 讨论贴精华。最佳模型是 Gemini 2.5 Pro,介绍角色定位、工作流程,强调过滤噪音、提炼精华,还给出写作要求。>阅读原文
推荐文章
网易:游戏研发的 AI 转型实践
网易游戏林香鑫分享大模型在游戏研发落地实践。团队打造超级助手,构建知识工程体系,应用多 Agent 赋能代码编写,用 AI 审查保障研发质量,未来想构建团队记忆系统,让团队 AI Agent 协同运作。>阅读原文
开源动态
新浪微博小模型超越近万亿参数模型
新浪微博发布并开源的VibeThinker - 1.5B模型,以15亿参数和不足8000美元成本,在数学等基准测试中超越近万亿参数模型。它采用频谱到信号原则训练,成本低且性能提升源于方法创新。>阅读原文
Character AI与耶鲁推出开源音视频模型OVI
Character AI和耶鲁大学推出OVI,打破闭源垄断。它架构对称,解决音画不同步难题,用旋转位置嵌入对齐时间,训练考究,生成效果好,升级后时长扩展,为开源音视频生成提供新思路。>阅读原文
Hulu - Med:开源医学大模型新范式
Hulu - Med团队提出通用医学视觉语言大模型Hulu - Med。该模型可统一理解医学多类数据,开源透明,降低成本,性能优异。未来将在多方面改进,邀请各界共同探索医学AI系统。>阅读原文
NVIDIA 开源工具:实时测试视觉语言模型
NVIDIA 开源 Live VLM WebUI,能实时用摄像头测试视觉语言模型。通过 WebRTC 处理视频流,支持多后端和平台,可用于模型对比等场景,安装方式多样,本地也能跑。>阅读原文
清华崔鹏团队开源 2M 表格理解模型 LimiX-2M
清华大学崔鹏团队开源 LimiX-2M 模型,仅 2M 参数量。它在 11 个权威评测中表现优异,能同时处理多任务,性能超经典模型,还具备低算力运行等优点,科研、落地潜力大。>阅读原文
算法论文
香港理工大:LinearRAG 革新 GraphRAG 图构建
香港理工大学团队指出,现有 GraphRAG 因图谱质量不佳,表现不如朴素 RAG。他们提出 LinearRAG 框架,有三大创新,在多数据集上超现有方法,代码和数据已开源,是实用之选。>阅读原文
LeCun离职Meta,发布最后一篇论文
LeCun在离职Meta当日提交新论文《LeJEPA》,介绍自监督学习方法。此前他推动JEPA架构发展,虽有争议,但他将筹资创业继续研究世界模型,65岁的他依旧充满闯劲。>阅读原文
北大团队:DemoHLM让机器人零样本上岗
北大与BeingBeyond团队:提出DemoHLM框架,采用分层控制和单演示数据生成,解决人形机器人移动操作难题,降低成本、提升泛化能力,虽有局限但为规模化应用提供路径。>阅读原文
UNCOMP:解锁 LLM 信息压缩新密码
论文 UNCOMP 被接收,引入截断矩阵熵解释 LLM 稀疏化,据此设计 UNCOMP 框架,通过层级、头级压缩优化 KV Cache,Prefill 阶段加速 60%,吞吐量提升 6.4 倍,极端压缩率下性能有保障。>阅读原文
VFM - VAE:加速扩散模型语义提取
近期,RAE 用预训练视觉表征提升扩散模型性能,同期西安交大与微软亚研院提出 VFM - VAE,结合 RAE 与 VAE,实验显示其性能优、训练效率高,未来将探索潜空间更多潜力。>阅读原文
GVE模型:155万视频练就9种检索技能
香港科技大学(广州)与阿里巴巴通义实验室合作,推出GVE模型。它用155万模拟视频训练,一次学会9种视频检索技能,在零样本下超越14个主流模型,为视频检索通用化提供方法论。>阅读原文
Rex - Omni:MLLM超越Grounding DINO成检测新希望
IDEA研究院团队:3B参数的Rex - Omni将视觉任务统一为‘下一个点预测’,结合4 - Token坐标编码与SFT + GRPO两阶段训练,在多基准超Grounding DINO,解决MLLM定位和行为缺陷,成下一代检测模型有力基线。>阅读原文
超对称公司提出宇宙尺度压缩构想
超对称公司基于BigBang - Proton提出宇宙尺度压缩构想。指出科学多任务学习是基石,Scaling Law可延伸至物理世界,还给出压缩计划和假设,有望推动科学发现范式转变,提高具身智能泛化能力。>阅读原文
快手可灵与中大推出GRPO卫兵缓解视觉过优化
中山大学、快手可灵等团队针对GRPO过度优化问题推出GRPO - Guard。它通过比率归一化和跨步梯度平衡,在多种任务中缓解过优化,保持生成质量,未来需构建更精确奖励模型。>阅读原文
谷歌DeepMind:AlphaProof IMO接近夺金
谷歌DeepMind的AlphaProof在2024年IMO获28分,接近金牌。它结合大模型与强化学习,用Lean语言证明,解出多道难题。虽有局限,但开启人机协作新篇,有望辅助攻克数学猜想。>阅读原文
</p>