All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-11-04 资讯日报
新闻资讯
英伟达:H100 GPU首入太空,太空数据中心要来了?
11月2日英伟达把H100 GPU送上太空。Starcloud公司认为太空数据中心能源成本低、少排温室气体,未来或大规模部署。还计划明年送更强数据中心入轨,2030年代初建40兆瓦数据中心。>阅读原文
英特尔或收SambaNova,陈立武身份引关注
英特尔考虑收购SambaNova,其CEO陈立武也是SambaNova执行董事长。英特尔此前GPU发展滞后,现重新发力AI芯片。SambaNova曾想融资,因英伟达压制或低价出售,目标是挑战英伟达。>阅读原文
马斯克与奥特曼新口水战,诉讼持续升级
马斯克与奥特曼因特斯拉预订款起新争执,马斯克指责奥特曼,还称OpenAI背离开源非营利初衷。两人多年矛盾不断、诉讼推进,此外马斯克回应收购推特、上市公司治理等争议。>阅读原文
Alpha Arena:Qwen夺冠,GPT - 5量化交易垫底
Nof1的Alpha Arena项目让六个顶尖LLM实盘量化交易。第一赛季Qwen夺冠、GPT - 5垫底。不同模型行为差异大,还暴露出操作脆弱性。第二赛季筹备近尾声,目标探索Agent理解市场的条件。>阅读原文
微软大量英伟达GPU因缺电吃灰
微软CEO纳德拉称,因缺电和机房空间,大量英伟达GPU闲置。奥特曼也指出行业面临能源与基础设施匹配问题。算力企业调整策略,微软不再囤单一代GPU。>阅读原文
llya证词曝光OpenAI“宫斗”,目标指向IPO
llya 52页证词曝光OpenAI“宫斗”,马斯克与奥特曼为此争吵。奥特曼回应不持股是因热爱,也有点后悔。llya称奥特曼撒谎、挑拨离间。OpenAI在营利和非营利间摇摆,目标是1万亿美元估值IPO。>阅读原文
OpenAI内斗,马斯克奥特曼恩怨不断
新智元报道,OpenAI内斗如甄嬛传。Ilya指控奥特曼,两人理念冲突。Ilya与Mira密谋除奥特曼,还错判员工反应。奥特曼想与马斯克和解,网友质疑OpenAI非营利性质,这场内斗结局难测。>阅读原文
OpenAI前员工创业,产品未出估值先飞
新智元报道,OpenAI前员工离职创业形成‘OpenAI黑手党’。如Angela Jiang的Worktrace AI无产品却获融资。资本看重‘OpenAI出身’,‘算法资本主义’下身份成货币。>阅读原文
B站搞笑诺奖:科研成果脑洞大开
B站超级科学晚成搞笑诺奖典礼,获奖研究超有趣。像音乐旋律有数学规律,泡泡稳定能用于多领域,大笑可治干眼症等,科研成果脑洞大且实用。>阅读原文
奥特曼:「AI腔」让人际互动「感觉很假」
自ChatGPT发布,「AI腔」受诟病。奥特曼吐槽Reddit上的AI腔调,担心失去人性。研究证实ChatGPT影响交流。有人反向调教AI,也有人指出AI弱点,强调人性不可被取代。>阅读原文
奥特曼喊话做空者,纳德拉揭秘投资内幕
奥特曼和纳德拉对话,揭秘微软与OpenAI合作内幕。奥特曼称可做空OpenAI,坚信技术与商业增长;纳德拉表示投资因代码补全功能从十亿提至百亿,还谈算力、监管等问题,对未来乐观。>阅读原文
揭秘向黄仁勋汇报的英伟达36人
英伟达有36人可直向黄仁勋汇报,硬件是基石,AI等成新支柱。还介绍了关键将领如吴新宙。公司管理模式或从扁平走向垂直,黄仁勋推崇高压文化,强调完成任务。>阅读原文
马斯克、奥特曼 X 上开撕,OpenAI 内幕曝光
马斯克、奥特曼在 X 上就 Tesla Roadster 退款及 OpenAI 性质问题开撕。Ilya 52 页证词曝光,指控 Sam Altman 不当行为致其被解雇,不过备忘录依赖二手信息,还披露了董事会动态及 Anthropic 并购提议。>阅读原文
OpenAI牵手亚马逊,380亿美元云计算大单落地
OpenAI与AWS达成7年380亿美元合作,AWS为其提供基础设施,支持AI工作负载。OpenAI能快速扩算力,双方CEO看好合作,此前已有开源模型合作,消息使亚马逊股价涨4%。>阅读原文
微软CEO:AI投资逻辑错,电力成瓶颈
微软CEO:AI行业投资逻辑错了,瓶颈是电力非芯片。微软H100因缺电闲置,投资回报受影响。早锁定电力协议的玩家是赢家,竞争护城河转向物理设施和能源准入。>阅读原文
马斯克擎天柱靠人类「演技」蹒跚学步
新智元报道,特斯拉为训练擎天柱,让近百号员工每日8小时重复动作收集数据。工作累、要求严,团队有人员裁撤。虽马斯克看好擎天柱前景,但专家指其演示或高估真实能力。>阅读原文
产品应用
Pixeltable:一张表搞定AI多模态流水线
Pixeltable:统一声明式框架,替代传统复杂架构处理多模态AI流水线。有数据管理等能力,适用于多模态RAG等场景,内置主流AI服务,多模态AI项目可尝试。>阅读原文
SkyReels新版:让普通人成AI视频导演
SkyReels新版重构AI创作生态,打通多模态全栈,集成多种功能与顶尖模型。其专家智能体可精准聚焦多领域,还能精确控制角色对话。它降低创作门槛,让普通人也能轻松产出高质量作品。>阅读原文
昆仑万维SkyReels:掀翻AI视频天花板
昆仑万维上线全新SkyReels平台,发布SkyReels V3模型。实测其功能玩法丰富,如无限画布、Agent等。该平台打通多模态边界,将巩固昆仑万维地位,加速实现人人专业创作。>阅读原文
寒武纪亮出软件全家桶叫板CUDA
寒武纪为AI大爆发提供底层算力,其基础软件平台Cambricon NeuWare成熟。在大模型与搜广推训推上成果多,各软件组件优化显著,还适配多种模型,推动产业智能化转型。>阅读原文
程一笑:快手借AI重塑内容与商业价值
2025年是AI深度应用关键年,快手展示AI与业务融合布局。程一笑强调结合AI与场景,快手构建技术栈,在多业务发力成果显著,形成技术创新到营收增长的良性循环。>阅读原文
Suno V5助力B站鬼畜区文艺复兴
作者称B站鬼畜区曾没落,Suno V5出现后爆款AI音乐鬼畜频出,如漫游会议室作品。介绍创作方法,强调鬼畜精神回归,小破站分享快乐的意义依旧,这是AI时代的浪漫文艺复兴。>阅读原文
华为Doc-Researcher确立多模态文档研究新范式
华为Doc-Researcher解决大模型处理复杂文档难题。采用深度多模态解析、系统级检索架构和多智能体研究流程,在M4DocBench评测中表现优异,适用于金融、法律等多领域。>阅读原文
20岁辍学生AI笔记应用半年吸500万用户
20岁辍学生创立的Turbo AI,半年用户达500万且盈利。它能上传多种资料生成笔记等,功能丰富,但也有被指套壳、价高、不适合理工科等问题,团队想让其成通用知识管理工具。>阅读原文
京东李岩:AIGC 驱动电商个性化变革
京东零售李岩称,电商 2.0 时代追求极致个性化体验。其介绍“千人千面”商品素材生成技术链路,涉及多模型协同。还发布焕新版京点点平台,将推批量素材、视频生成等新能力。>阅读原文
英伟达DLER让大模型推理短快准
英伟达研究院研究DLER解决大模型推理冗长问题。它用强化学习优化方法,使推理长度减超70%、准确率不变,还适用于大模型,将成推理模型落地关键技术。>阅读原文
Midscene.js:重塑UI自动化的AI利器
文章介绍Midscene.js,指出传统UI自动化工具痛点,其利用AI解决问题。结合Chrome插件试用,解析源码和工作流程,还提及使用问题及业务落地思考,如新手引导、智能营销等。>阅读原文
文心APP:一句话生成完整剧情漫画
文心APP上线魔法漫画功能,用户上传照片、输入文字,两分钟就能生成多图多页漫画。支持自定义角色和风格,能续写、改编,降低创作门槛,让AI普惠成为现实。>阅读原文
推荐文章
陈然:AI奖励“最不专业”的创业者
陈然:AI发展如洪水逐级淹没人类技能,先替代简单工作。高精尖专家因工作复杂难见AI价值;创业者被琐碎事务困住,AI能大幅提升效率。打工人应跳出舒适区,用AI创造价值。>阅读原文
Sean Goedecke:AI爱用破折号或因纸质扫描书
Sean Goedecke分析AI爱用破折号的原因,认为“训练数据混入大量纸质扫描书”最靠谱,因这些书破折号使用率高。不过他也指出自己观点有猜测成分,成因尚无共识。>阅读原文
实现可自我进化的ACE智能体原型
文章基于ACE论文实现智能体原型。借助ReAct范式,各模块分工明确,如Playbook存储策略,Generator执行任务。虽验证有效果,但存在LLM波动大等问题,后续可异步反思、领域调优等。>阅读原文
宝玉揭秘AI爱用破折号的真相
宝玉分析AI爱用破折号原因,指出‘delve’源于非洲导师打分偏好,但破折号不同。这一现象在GPT - 4后凸显,或因AI公司用旧书训练,继承旧时代风格,此推测较有说服力。>阅读原文
TileLang核心编程抽象深入解析
文章指出写kernel有多种方式,TileLang是折中的工具,提供三层编程抽象。介绍其JIT工作流、不同执行后端特点,还有性能优化和基准测试方法,通过GEMM示例对比三层抽象,给出不同情境下使用建议。>阅读原文
开源动态
Kimi Linear:线性注意力性能效率双突破
月之暗面团队Kimi Linear模型,以Kimi Delta Attention为核心,解决线性注意力的记忆问题。实验中多任务表现优异,长上下文性能突出,还开源资源推动高效长上下文模型研究。>阅读原文
字节Seed团队发布Ouro循环语言模型
字节Seed团队联合推出循环语言模型Ouro,它另辟蹊径将推理能力构建到预训练阶段。对照实验显示其性能提升源于高效推理能力,还降低有害性,实现2 - 3倍参数效率提升。>阅读原文
美团开源龙猫模型,性能直逼 Gemini
美团开源全模态模型 LongCat-Flash-Omni,具真正全模态能力,采用创新架构和训练范式。基准测试表现佳,部分指标超 Gemini-2.5-Flash,网友热议,凸显开源模型优势。>阅读原文
抖音团队推出SAIL - Embedding,提效推荐场景
抖音SAIL团队联合港中文MMLab推出SAIL - Embedding。它可处理全模态输入,用新策略提升训练稳定,经多阶段训练。实测表现卓越,在抖音业务提效,未来还将探索VLMs与推荐系统融合。>阅读原文
constraint-cache:解决大模型重复推理难题
winkrun分享constraint-cache工具,它用确定性规范化算法,将语义相似查询转为统一缓存键。测试显示,能达99.9%缓存命中率,降成本、提速度,适合客服机器人等场景。>阅读原文
Meta 发布 Docusaurus 3.9,新增 AI 搜索功能
Meta 发布 Docusaurus 3.9,亮点是引入 AI 搜索,支持 DocSearch v4 让用户对话查内容。还提高 Node.js 要求、改进 i18n 配置等,多数网站更新依赖项即可升级。>阅读原文
达摩院ReasonMed:革新医学推理数据生成
达摩院孙雨、徐挺洋等:推出多智能体框架ReasonMed,构建医学推理数据生成新范式,开源ReasonMed370K数据集。基于此训练的小模型效果佳,‘推理 + 总结’策略优,还降低成本,有跨领域应用潜力。>阅读原文
Eclipse 开源方案,JVM 上搞定 AI 代理
Eclipse 基金会在 Eclipse LMOS 开源平台推出 ADL,可免代码定义 AI 行为。LMOS 前身是德电实践,适配 JVM 生态,避免企业弃旧用 Python。其双线策略含 LMOS 平台和 ADL,有望构建代理系统。>阅读原文
智源发布Emu3.5,开启多模态世界新纪元
2025年‘世界模型’竞争激烈,谷歌、李飞飞团队等积极布局。北京智源研究院发布Emu3.5,用790年长视频训练,采用统一架构和第三种Scaling范式,推理快,能力强,还公开技术邀全球探索。>阅读原文
AutoDeco:终结LLM手动调参解码
腾讯AI Lab与港中大(深圳)团队推出AutoDeco架构,解决LLM手动调参难题。它引入预测头让模型动态调参,经创新训练策略优化,在多模型实验表现优,已开源助力迈向AGI新时代。>阅读原文
快手HiPO框架:让LLM思考更智能
快手与南大团队:HiPO框架为LLM装‘思考开关’。它用混合数据冷启动和奖励系统,让模型自主决策。实验表明,该框架降成本、提效率,准确率也同步提升,还具强泛化性。>阅读原文
Qwen3预览版AIME 25满分,超GPT - 5!
Qwen3“超大杯”推理版早期预览版在AIME 25和HMMT25达100%准确率,超越GPT - 5系列。可在Qwen Chat免费试用,API上线阿里云,官方称训练继续会更新版本。>阅读原文
算法论文
小红书团队提出布局控制新算法InstanceAssemble
小红书智创AIGC团队:提出InstanceAssemble框架,架构上引入级联结构、用LoRA模块适配,构建新数据集和评测指标,在复杂布局下表现卓越,有跨风格创作潜力,推动布局图像生成发展。>阅读原文
斯坦福7B智能体超越GPT - 4o登顶HF
斯坦福等团队提出AgentFlow框架,将推理任务分解给专门化智能体模块,用Flow - GRPO算法解决信用分配问题。实验显示,小参数模型在多任务上超越大模型,证明系统架构创新和高效训练法更值得探索。>阅读原文
港理工团队提出LT - PINN优化工程拓扑
香港理工大学周原野等提出LT - PINN框架,将显式几何与可微分物理求解器耦合。实验显示其在PDE求解和几何边界清晰度上优于隐式PINN,还能无监督生成拓扑结构,未来将拓展到三维场景。>阅读原文
新加坡国立大学提出深度伪造检测新方法
新加坡国立大学等团队为解决现有深度伪造检测方法的问题,提出 FractalForensics 方法。它基于分形水印,可实现检测与定位,在常见图像处理和伪造方法中表现良好,检测效果优。>阅读原文
思维链劫持攻击,推理模型安全新危机
Jianli Zhao团队:思维链劫持攻击在HarmBench上对多模型攻击成功率超90%,思维链推理虽提升准确性却引入安全漏洞,现有防御不足,有效防御待探索。>阅读原文
VFMTok:更少token实现优质AI绘画
香港大学、阶跃星辰等推出VFMTok方法,借助预训练视觉基础模型,将图像生成从像素死记硬背转为语义理解。实验显示,它用更少token实现更好图像生成,摆脱对复杂引导技巧的依赖。>阅读原文
</p>