All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-12-15 资讯日报
新闻资讯
2025:GenAI成主流,ChatGPT跻身前五
Similarweb报告显示:GenAI平台访问量大增、用户年龄层拓宽。ChatGPT成全球前五网站,与谷歌形成互补。赛道走向多元,AI成互联网嵌入层,未来谁掌控AI能力很关键。>阅读原文
2025股权投资:GP与LP思维碰撞
嘉宾们认为当下股权投资从“规模扩张”转向“质量重塑”,DPI和“耐心资本”成高频词。面对LP多重诉求,GP分享找“最大公约数”等策略。未来,有政策理解力、技术判断力和人才梯队的机构才能长青。>阅读原文
黄仁勋:36人团队引领英伟达AI浪潮
新智元报道,英伟达黄仁勋直管36位高管,减少层级让信息流动。其团队有元老、技术大拿、商业运营中坚和新战线拓荒者。虽管理模式有质疑,但英伟达战绩证明其高效,未来将保持活力。>阅读原文
近期AI行业热点大汇总
近期AI行业热点不断:摩尔线程拟用75亿闲置募资理财;Meta砍元宇宙投入转AI;豆包手机回应隐私质疑;宇树发布人形机器人应用商店;阿里、腾讯等大厂也有新动作,如阿里成立千问C端事业群,腾讯翻倍薪资挖角字节。>阅读原文
北大发布SUPERChem,GPT - 5化学推理仅本科生水平
北大团队发布SUPERChem化学基准。测试表明,前沿模型如GPT - 5准确率仅38.5%,与低年级本科生水平相当,且在高阶推理环节有短板,不同模型推理一致性有差异,为模型优化提供方向。>阅读原文
布林:发完Transformer论文,我们太不当回事
谷歌创始人布林在斯坦福对谈时表示,八年前发Transformer论文后未足够重视,投资不足。他认为学生仍可选计算机专业,大学未来或突破地理限制,学术应做更具探索性研究,材料科学潜力大。>阅读原文
具身智能元年已至,商业化路径渐明
甲子引力盛典上,嘉宾热议具身智能。杨继峰等认为机器人在特定场景落地但泛化不足;肖立称产业有泡沫但十年后10%家庭或有人形机器人;多位觉得中国具身智能产业元年已到。>阅读原文
JetBrains弃Fleet,推Air抢AI编程王座
JetBrains 宣布停掉 Fleet,投入新开发环境 Air。原因是维持两条产品线分散精力,且 Fleet 难取代 IntelliJ IDEA。Air 基于 Fleet 演化,不过说服开发者迁移并非易事。>阅读原文
前DeepMind老将:AI指挥官降成本创新高
Poetiq团队(由6位前DeepMind成员组成):搭建元系统可自动生成策略和模型组合,让大模型解决复杂问题,成本减半。其Gemini 3 Pro优化技术在ARC - AGI - 2上成绩亮眼。>阅读原文
GPT - 5.2降智,OpenAI年终之战失利
OpenAI推出GPT - 5.2,却不敌谷歌Gemini 3 Pro。多项基准测试中,GPT - 5.2表现不佳,可信度下降,遭开发者吐槽。OpenAI调整策略,暂停部分项目,但仍未摆脱被动局面。>阅读原文
OpenAI:Sora 85%代码由AI完成
OpenAI 4人团队28天完成安卓版Sora APP搭建,约85%代码由Codex完成。Codex能自我迭代,擅长读懂代码库、写测试等,但需人类指导。团队分享协作经验,希望启发更多开发者。>阅读原文
2025黄仁勋:从刷厕所到AI帝国掌舵人
2025年黄仁勋成FT年度人物,英伟达市值登顶。他早年经历苦难,形成务实与危机意识。带领英伟达多次转型,管理风格反常规。2025年重新定义公司,还展现外交能力,让英伟达持续发展。>阅读原文
产品应用
宝玉:揭秘西游记版AI视频制作法
宝玉分享互联网黑话西游记版AI视频制作法:与AI共创剧本,以西游记场景结合黑话;让AI依剧本和人物图生成分镜脚本、首帧图;按脚本用工具制作视频,不满意反复生成后拼接。>阅读原文
实测GPT-5.2:写代码表现欠佳
GPT-5.2发布后,作者用Cursor测试它与Gemini 3 pro。在烟花效果、Paper分析、代码重构等测试中,GPT-5.2表现差强人意,如Paper分析执行失败、代码重构未理解意图,写代码得慎重。>阅读原文
AutoDev Xiuper 3.0:全平台 AI 编程助手登场
AutoDev Xiuper 3.0.0-alpha 问世,它是全生命周期 AI 编程助手。开发不止编码,AI 应自然“存在”于流程。Xiuper 寓意无处不在、能力放大,覆盖全流程各阶段,支持全平台。>阅读原文
Gemini 3.0:生成超火3D粒子交互案例
近期用Gemini 3.0或GPT 5.2做3D粒子交互案例爆火,像生成能手势操控的圣诞老人、圣诞树等。过去写代码耗时久,现在与AI对话即可,还给出基础提示词和代码获取方式。>阅读原文
谷歌Gemini 2.5:让AI实现拟人化交互
谷歌发布Gemini 2.5 Flash原生音频模型,无需文字中转,能保留语气实时翻译,还有持续监听等功能。开发者可用其构建高效AI客服。另外,实验产品Disco能理解需求生成专属App。>阅读原文
孙志敏:Hexstrike AI渗透测试总结
孙志敏对Hexstrike AI做多次渗透测试后总结,不同工具与模型组合表现各异,如Claude desktop+Sonnet 4.5只完成初级任务,MCP类服务更适合辅助,LLM辅助渗透测试路还长。>阅读原文
Claude Skills:让Agent成领域专家
今年10月Anthropic推出Claude Skills,是向Agent注入知识的标准化方案。它与MCP协同,前者提供领域知识,后者提供外部工具。还给出实现方法,以及构建智能导购AI助手的思路。>阅读原文
推荐文章
对谈解析波德里亚“拟像”理论
豆瓣读书组织对谈,嘉宾探讨波德里亚《拟像与拟真》。指出波德里亚“拟像”理论有前瞻性,从哲学、社会学、新闻传播学等角度解析概念,以《黑客帝国》《迪士尼乐园》为例说明,也反思其理论与现实的差距。>阅读原文
Polymarket:精准预测AI模型发布的平台
作者分享Web3平台Polymarket,它能精准预测AI模型发布等事件。基于群体智慧,参与者用钱下注,价格反映概率。作者认为它比KOL分析靠谱,还能让人对信息判断更理性。>阅读原文
IC测试座与HBM:AI芯片幕后英雄
芯片技术与工艺作者Taylor指出,IC测试座是芯片测试桥梁,HBM是AI芯片加速器。HBM测试有挑战,需专门技术设备。IC测试座高频性能和可靠性提升,未来将高频化、智能化、环保化。>阅读原文
开源动态
OpenAI开源新模型,或让MoE模型没落
OpenAI开源新模型,运用Circuit Sparsity技术,砍断99.9%连接让模型计算可拆解。该思路或使MoE模型没落,但Circuit Sparsity算力成本高,团队正研究降本方法。>阅读原文
智谱GLM 4.6V让图文混排Agent起飞
作者介绍智谱多模态开源周的图文并排应用,上传PDF论文能生成优质图文混排解读。作者复刻代码发现GLM 4.6V有知道图片精确位置、一次输入几十张图片、基于裁剪结果持续迭代等能力。>阅读原文
banana - slides:基于Nano Banana的PPT神器
banana - slides:一款GitHub上火爆的PPT生成神器,走Vibe PPT路线,不套模板,有灵活创作路径等多种功能,适合多类人群,助有内容的人轻松做PPT。>阅读原文
新国大与Lowart AI:OmniPSD实现图像分层输出
新加坡国立大学和Lowart AI:推出OmniPSD,利用Diffusion Transformer实现分层图像生成与拆解,输出可编辑PSD文件,解决AI图像难编辑问题,有潜力改变设计流程。>阅读原文
蚂蚁数科:霸榜SQL榜单后高调开源
蚂蚁数科在第二届CCF中国数据大会开源Agentar - SQL系列。此前其霸榜全球权威SQL榜单超两月,在金融场景表现出色,能力外溢到公交、能源等领域,还按效果付费,获市场认可。>阅读原文
算法论文
AAAI 2026:AI学会“导演 - 演员”配音协作
内蒙古大学刘瑞教授团队在AAAI 2026提出Authentic - Dubber框架,模拟真实配音流程。通过三大机制让AI学会“先理解,再表达”,实验显示其情感表达远超主流模型,提升了AI配音竞争维度。>阅读原文
1100多个模型权重收敛至通用子空间
约翰斯・霍普金斯大学研究:1100多个神经网络权重收敛到共享低维子空间,架构比数据影响大。能解释现象、开辟应用,但结论待严格验证,成因有谱偏好等多种推论。>阅读原文
快手与港科大团队发布视频生成模型UnityVideo
港科大等团队提出UnityVideo框架,通过统一训练多模态,使模型更懂物理规律、视频生成更优,实现零样本泛化,在多任务表现出色,为视频生成领域开辟新路径。>阅读原文
CMU:揭秘RL对推理语言模型的影响
卡耐基梅隆大学研究者:仅预训练有提升空间且RL数据针对能力边界时,RL才有增益;情境泛化需少量预训练;中期训练能提升性能;过程级奖励可减少奖励破解。>阅读原文
陈羽田团队:低帧率相机实现高速4D重建
香港中文大学陈羽田团队提出“异步采集 + 视频扩散模型修复”方案,突破传统相机速度瓶颈,解决稀疏视角问题,在公开数据集和真实环境测试中超越多种顶尖方法。>阅读原文
普林斯顿:大模型与人类大脑共享语言时钟
普林斯顿大学等研究:大语言模型层级计算与人类大脑处理语言时间动态高度一致,如GPT - 2 XL和Llama - 2能映射大脑高级语言区域时间动态,凸显深度学习模型优势,也指出其局限。>阅读原文
1100多个模型指向「通用子空间」
约翰斯・霍普金斯大学研究表明,1100多个神经网络权重收敛到共享低维子空间。研究为“通用性”提供实证,有模型压缩等意义,但有人提醒结论需更严格验证,任务多样性和跨架构比较待加强。>阅读原文
西安交大:分层神经网络融合多保真度数据
西安交通大学海春龙等提出OMA - HNN框架,含MA - HNN和在线渐进采样。前者融合多保真数据,后者含LAS和MDAL策略。经15个算例和实际应用验证,该方法在工业场景潜力大。>阅读原文
</p>