All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-12-16 资讯日报
新闻资讯
AI手指难题翻车,暴露Transformer缺陷
新智元报道,网友用含六指手的图测试AI,Nano Banana Pro、GPT - 5.2等均答错。这暴露当前模型思考机械、依赖数据先验等问题,凸显Transformer弱点,解决需新架构和多样数据。>阅读原文
Claude CLI频成“系统杀手”引开发者痛斥
开发者用Claude CLI清理软件包,系统被清空。Claude自查是执行含“~/”命令所致。“删库”成AI工具通病,专家孙涛建议使用沙箱、容器等,强化安全操作意识。>阅读原文
马斯克力荐太空数据中心,能耗优势大
马斯克带头带货太空数据中心,称其能耗低、成本未来或低于地球。因地球能源有限,太空可解决能源与散热难题。美初创企业已实验,国内也推进相关建设,AI竞技场转向太空。>阅读原文
邹支农:从农村青年到江西首富
出身农村的邹支农37岁创立天孚通信,攻克陶瓷套管技术难题后上市。他预判趋势布局高速光引擎,使公司绑定英伟达。2025年三季报业绩大增,市值达1600亿,逆袭靠技术与战略。>阅读原文
GAIR 2025分论坛激辩AI演进路径
GAIR 2025分论坛聚焦数据与“一脑多形”。戴若犁、佟显乔等谈具身智能数据挑战与机遇;高飞、金鑫等展示“一脑多形”成果。嘉宾认为行业尚处探索期,落地需平衡技术与现实。>阅读原文
陈天桥团队成立实验室探索脑机共生
天桥脑科学研究院创始人雒芊芊宣布成立尖峰智能实验室,由李国齐教授领衔。该实验室是‘发现式智能’理念落地载体,将借鉴人脑特性研发类脑大模型,推动AI与脑科学双向赋能。>阅读原文
小米科学家:AI进化像生物,不开源慢千倍
小米语音首席科学家Daniel Povey称,AI演进似生物进化,要不断试错。开源是进化加速器,没它行业进化或慢千倍。大公司应两手抓,利用Transformer赋能产品,探索未知。其团队正研发Zapformer。>阅读原文
直播聚焦多模态模型现状与未来
从GPT - 4o到Gemini,AI跨模态能力提升,统一多模态基础模型是核心。但开源社区构建有挑战,南大等研究团队梳理超750篇论文构建技术视图,还将直播分享。>阅读原文
Gemini 3屠榜CFA考试,AI要砸金融「金饭碗」?
最新研究显示,Gemini 3等推理模型轻松通过CFA三级考试,部分接近满分。但媒体人认为会考试≠能干活,高盛博士称AI还不能替代分析师,应合理利用,发挥其优势。>阅读原文
布林:谷歌低估Transformer,被OpenAI抢先机
谷歌创始人布林演讲称,谷歌曾低估Transformer,被OpenAI抓住机会。他建议大学生利用AI、重视编码,创业者别过早商业化。他还反思退休决定,现投入Gemini研发。>阅读原文
Anthropic:AI访谈揭示职业对AI态度差异
Anthropic的Interviewer工具与1250人深度访谈,能自动完成流程并生成情绪雷达图。研究发现普通职场人、创作者、科学家对AI态度不同,源于职业结构、评价体系与生存方式差异。>阅读原文
韦氏词典:“slop”成AI垃圾内容代名词
韦氏词典:“slop”当选2025年度词汇,指AI低质量内容。当下AI生成网络文章占比超半,催生“slop经济”,不过AI内容会优胜劣汰,关键是引导技术向有价值方向发展。>阅读原文
方汉:通用Agent是伪命题,AI Office有空间
昆仑万维方汉认为,Agent本质是过程自动化,非通用AI。它先落地AI Office,垂类场景缺好数据集。通用Agent或为伪命题,AI Office仍有空间。Agent将重写公司组织,人类成过程架构师。>阅读原文
缔零科技融资,欲成AI时代安全顾问
缔零科技获融资,专注认知安全。已推「缔零智数」和「缔零法则」,前者助模型对齐,后者把控推理。现阶段ToB业务为主,未来有ToC规划,想成用户信任的安全助手。>阅读原文
卓世科技:大模型竞争在业务闭环与行业落地
卓世科技赵策:大模型商业化步入新阶段,竞争焦点转向模型、终端与业务流闭环。真正跑通商业化需技术自研、产品标准化、商业模式创新。该司已在多行业实现大模型落地应用。>阅读原文
OpenRouter报告:LLM使用模式重大转折
OpenRouter报告分析超100万亿个token的LLM交互数据,弥补证据不足。揭示2024年o1推理模型发布后,LLM领域从文本生成转向多步骤、面向Agent的推理,报告涵盖多方面发现。>阅读原文
摩尔线程拟75亿募资理财,将办开发者大会
摩尔线程拟用不超75亿IPO闲置资金理财,相关负责人称项目分阶段投入,此举为提升资金效率,不影响募投。12月20 - 21日将办大会,将阐述战略、发布架构等。>阅读原文
Grok在悉尼枪击案上大规模造谣
新智元报道:马斯克的Grok在悉尼光明节枪击案中状况百出,错认英雄、混淆事件。这暴露生成式AI处理实时信息时的「幻觉」缺陷,可能放大混乱,威胁真相。>阅读原文
上海具身智能产业有望复刻“超级工厂”奇迹
马斯克称排名2 - 10的机器人公司或都在中国。中国在AI领域大步发展,学术、人才、制造优势明显。上海具身智能产业有大模型、生态链、应用场景等优势,正推动其走向实用。>阅读原文
Claude CLI频当‘系统杀手’,开发者心血付之东流!
Claude CLI频出问题,开发者用它清理软件包时致Mac系统清空。‘删库’成AI工具通病,此前谷歌Gemini CLI等也有类似情况。专家建议使用时强化安全意识,采取沙箱化等措施。>阅读原文
姚欣:Agent Infra将成AI时代新操作系统
PPIO姚欣称AI正从生成式迈向Agent时代,真正智能体需新架构。他认为Agent Infra是AI时代操作系统,核心是Runtime。PPIO构建AI云能力,发布Agent沙箱助厂商落地。>阅读原文
AI翻译遇文化难题,人机协作是出路
新智元:文化差异让AI翻译遇难题,通用大模型数据失衡,低资源语言数据少。AI会产生幻觉,且因无肉身难理解隐喻。2033年实现多语言翻译需人机协作。>阅读原文
OpenAI偷装Anthropic Skills实锤
近日开发者发现 OpenAI 支持 Claude 的 Agent Skills 机制,已植入 ChatGPT 和 Codex。该机制与 Anthropic 相似,Skills 可解决传统工具缺陷,与 MCP 互补,未来有多种发展方向。>阅读原文
Andrej Karpathy:未来 LLM 审视当下行为
Andrej Karpathy 用现在视角为十年前 Hacker News 帖子打分并开源代码。他多篇文章探讨 LLM,认为未来 LLM 会审视当下行为,还启动 Eureka Labs 做教育产品。>阅读原文
拾象:80%命中率的 AI 预测复盘
拾象团队复盘 2025 年 AI 预测,多数应验,如微软投资、Google 逆转等。也有过于乐观处,像对技术进步等。2026 年 AI 有积极信号,但市场期待更高,团队将组织相关讨论。>阅读原文
北京AIGC创新中心推动视听产业发展
北京AIGC视听产业创新中心多方共建,首创郎园运营。通过六大服务平台推动产业发展,截至2025年8月有60多家伙伴,首创郎园业务从北京拓展到多地。>阅读原文
非标准创业者:AI创业不问出身
谢扬13岁编程,创立Authing后推行动型浏览器Fellou;秦天与邓杰14岁离家,后推主动式AI产品Proactor AI。不同出身在AI创业交汇,早期机会不问出身,奖赏先出发者。>阅读原文
产品应用
Paper2Slides:一键将论文变PPT
GitHubStore推荐Paper2Slides,它能几分钟内把论文等文档转成PPT和海报。支持多格式,有多种特色功能,实测效果好,还有网页版,适用于答辩、汇报等场景。>阅读原文
TOON:让LLM Token成本降30-60%
CourseAI介绍TOON格式,它专为LLM交互优化,比JSON节省30 - 60%的Token。其特性简洁友好,安装使用方便,适用于LLM API调用等场景,能显著提升效率。>阅读原文
商汤Seko 2.0:国产芯片跑AI视频生成
自Sora 2发布,科技厂商展开视频生成模型竞争。商汤12月15日上线Seko 2.0,实现AI短剧高效创作。其LightX2V框架做到实时生成,适配国产芯片,有望带来视频创作生产力变革。>阅读原文
前美团高管创业,让物理世界成AI提示词
Looki创始人孙洋团队:打造AI原生多模态可穿戴设备Looki L1,将自动驾驶逻辑用于生活,构建用户专属数据飞轮,让AI基于物理反馈从被动问答进化为主动共鸣,成生活‘第二大脑’。>阅读原文
Thinking Machines产品更新:多模型微调与视觉支持
Thinking Machines Lab的Tinker API更新,取消候选名单全用户可用。可微调Kimi K2 Thinking,新增OpenAI API接口和Qwen3 - VL视觉支持,降低训练门槛,小样本图像分类Qwen3 - VL表现佳。>阅读原文
商汤Seko 2.0让AI短剧创作降本增效
商汤Seko 2.0解决AI视频生成难题,实现创编一体,引入核心技术保障角色一致性与口型同步。降低成本、提升效率,适配国产芯片,还在多领域孵化爆款,拓展内容生态。>阅读原文
Refly.AI:Vibe Workflow 让搭流程更简单
Refly.AI:让普通人搭 Workflow,Vibe Workflow 用 Agent 节点替代传统节点,降低搭建门槛。虽牺牲部分稳定性,但适用于内容生成,还能迁移其他平台数据,借模型提升发展。>阅读原文
Medeo 1.0:高效智能的视频生成利器
歸藏的AI工具箱:Medeo 1.0版本进步大,能用简短或超长提示词生成多样视频,支持自然语言修改。演示多个案例及提示词,还解释其兼顾质量与灵活度的原因,产品即将全量上线。>阅读原文
低代码平台复刻NotebookLM PPT生成体验
作者用低代码平台BISHENG复刻NotebookLM功能,实现文档上传、问答及PPT生成。PPT生成结合LLM、生图模型与MCP,采用HITL提升成功率。低代码平台扩展性强、调试方便,但仍有完善空间。>阅读原文
猫超Matra:AI知识库建设之路
猫超Matra项目为解决数据治理难题,探索AI知识库建设。先经钉钉文档快速维护,后产品化。用GraphRAG建知识图谱,设计Agent框架。未来将提升召回准度、实现知识保鲜和拓展能力。>阅读原文
推荐文章
大厂垃圾代码频出,根源在人才调度?
Sean Goedecke认为,大厂垃圾代码频出,是因多数代码变更由菜鸟完成,他们经验不足。老手虽强但过度依赖有问题。大厂为调度人才牺牲代码质量,在AI时代隐患更大。>阅读原文
神经符号AI:融合复古与前沿引爆AI革命
当前神经网络缺乏逻辑推理能力,神经符号AI融合老式符号与现代神经网络崛起。虽在多领域有潜力,但面临技术挑战,学界对此看法不一,发展还需解决沟通等难题。>阅读原文
冯富秋、向阳:LLM Agent 将成运维标配
阿里云冯富秋和云杉网络向阳探讨 LLM for AIOps。指出传统 AIOps 有瓶颈,“OS + LLM Agent” 带来新可能。还谈及降幻觉、数据平衡等破局点,认为未来 LLM Agent 会成标配。>阅读原文
LangGraph:破解AI Agent自主操控风险
腾讯程序员:随着LLM驱动的Agent走向应用,其可靠性等成关键挑战。LangGraph通过interrupt机制实现人工干预,有持久化状态等特点,还有四大经典模式,能提高应用的可靠性、安全性和准确性。>阅读原文
黄益贺:2025年AI使用的两大转变
科技博主黄益贺分享2025年使用AI收获。系统上,从RAG旧体系转向以Coding Assistant为核心新体系;工具上,拥抱Google生态,C端看好Google,B端看好Anthropic,不看好多线作战的OpenAI。>阅读原文
GPU取代CPU成计算领域新王者
曾经CPU是计算核心,如今GPU凭借并行处理优势崛起。在人工智能、大数据等领域,GPU展现强大能力,软件支持使其普及,未来或与CPU融合,应用于更多领域。>阅读原文
开源动态
TEN VAD:开源语音检测神器来袭
开源君:TEN VAD是面向实时语音流的轻量级检测器,低延迟、高准确率、轻量低功耗,能跨平台部署,已被Kaldi集成,适合语音开发项目。>阅读原文
Nanbeige4-3B开源,硬刚Qwen3小模型逆袭
Boss直聘南北阁大模型实验室发布Nanbeige4 - 3B小模型,通过数据与算法优化,在多维度表现优异,超越同体量及部分大模型,开源代码及报告,展现小模型以小博大潜力。>阅读原文
Nanbeige4 - 3B开源,硬刚大模型Qwen3
Boss直聘南北阁实验室:发布Nanbeige4 - 3B小模型。它经精心训练,在与Qwen3系列对比中表现出色,多个指标超越大模型,开源后有望推动AI普惠。>阅读原文
OpenObserve:程序员自建监控新选择
小华推荐 OpenObserve,这一开源观测平台能一站式搞定日志、指标、链路等监控,解决传统监控难题,存储成本低,功能丰富,适合开发者自建监控系统。>阅读原文
PaperDebugger:开源学术版Cursor
PaperDebugger:开源学术写作助手,基于MCP编排引擎,模拟学术流程,提供多步骤推理、评论及修改建议,有聊天、插入等功能,只读取不修改项目。>阅读原文
郑炳南:开源实现Claude Skills系统
Claude推出Skills系统解决AI开发核心矛盾。郑炳南在Minion框架开源实现,支持多LLM后端,有声明式定义等亮点,未来将建技能市场等,让更多开发者参与。>阅读原文
阿里开源 TTS+ASR,支持跨语种音色克隆
阿里 FunAudioLLM 团队开源 Fun - CosyVoice3 0.5B 和 Fun - ASR - Nano 0.8B,前者实时 TTS,支持多语言和音色克隆;后者轻量级 ASR,能识别 31 种语言,适用于复杂场景,可搭建多种语音应用。>阅读原文
算法论文
Mamba作者用压缩原理挑战预训练模式
Mamba作者Albert Gu团队在CompressARC研究中提出最小描述长度理论。一个76K参数、无预训练模型在ARC - AGI - 1基准表现出色,获ARC Prize 2025第三,挑战了智能源于大规模预训练的假设。>阅读原文
TIDE:开启扩散模型可解释且不降质新思路
香港中文大学与上海人工智能实验室团队:提出TIDE框架,让扩散模型可解释且不降质,还能基于语义因子构建新图像编辑方式,未来有望推动多方向发展。>阅读原文
清华与蚂蚁数科:Dual - Flow挑战AI安全
清华大学和蚂蚁数科联合提出Dual - Flow框架,它能从图像数据学规律,对多模型、多类别黑盒攻击。通过独特结构和训练方法,提升迁移成功率,降低成本,已用于蚂蚁数科产品优化。>阅读原文
23 款视频大模型综合评测结果出炉
合肥工业大学与清华团队推出 Trust-videoLLMs 评测 23 款视频大模型。发现闭源优于开源,模型规模并非性能唯一决定因素,还存在安全、公平、隐私等问题,团队开源评测框架等促发展。>阅读原文
DeepMind用Veo模拟机器人世界做评估
Google DeepMind团队:提出基于视频模型Veo的机器人策略评估系统,经1600余次实验验证有效,能实现策略泛化与安全评估,还可做红队测试。>阅读原文
南洋理工:通用LLM处理病历胜医学模型
南洋理工大学团队:构建EHRStruct评测基准,发现通用大模型处理电子病历优于医学专用模型,数据驱动任务表现更好。提出EHRMaster框架,与Gemini联合超越现有模型。>阅读原文
北航团队VBF++刷新多模态视频推荐SOTA
北航等团队提出VBF++框架用于多模态视频推荐,以“不确定性建模”革新融合范式。其含三大创新组件,在多数据集测试中超越14种基线方法,兼顾推荐多样性与准确性。>阅读原文
何恺明组本科生领衔突破Flow模型瓶颈
何恺明团队提出BiFlow框架解决归一化流局限。解耦前后向过程,有三项关键技术。实验中生成质量刷新SOTA,推理速度提升两个数量级,还能实现图像编辑,三位一作是本科生。>阅读原文
</p>