All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-10-28 资讯日报
新闻资讯
GTLC成都站:AI应用与企业转型盛宴
10月25日GTLC成都站圆满举办,邀请嘉宾分享。龚银拆解AI时代企业转型方法论,华润啤酒叶宁分享智能化建设策略,多位嘉宾围绕不同领域分享,为行业发展提供参考。>阅读原文
特斯拉VP:端到端是自动驾驶未来
特斯拉世界模拟器亮相ICCV,副总裁Ashok Elluswamy称端到端AI是自动驾驶未来,介绍了技术细节及应对困难的办法。业界对端到端路线存在VLA和世界模型之争。>阅读原文
汇丰科技25年:扎根中国加速金融创新
汇丰科技中国扎根中国 25 年,从服务香港到辐射全球。用区块链让跨境支付提速,运用隐私计算提升体验。校企共建培养人才,未来聚焦新质生产力,推动金融服务升级。>阅读原文
陈涛:从退伍兵到黄仁勋的中国搭子
胜宏科技董事长陈涛成黄仁勋“中国搭子”。胜宏凭技术与量产优势,供应英伟达七成AI服务器PCB。陈涛创业敢赌敢干,用技术赌注和军事化管理,让胜宏市值达近3000亿。>阅读原文
光学错觉图让大模型集体翻车
网友用光学错觉图测试大模型,ChatGPT、Claude、Gemini等纷纷翻车。有人觉得可作AI检测器,也有人质疑其有效性,还有晃动字母、移动宝剑等小测试也让模型出糗。>阅读原文
理想MEGA起火,动力电池安全引质疑
理想MEGA起火事故引发热议,其搭载麒麟三元锂电池。技术分析或因材料体系逼近极限、NCM811热稳定性差、气凝胶防护失效。目前动力电池防火技术或没厂家宣传的好,修复信任需行动。>阅读原文
GAIR Live 解读 IROS 2025 具身智能趋势
AI 科技评论:IROS 2025 展示具身智能新突破,GAIR Live 将于 10 月 28 日晚 8 点直播解读其核心趋势,探讨研究范式转向、商业潜力方向等热门话题。>阅读原文
比尔盖茨女儿AI时尚创业获800万融资
菲比·盖茨和索菲娅·基安尼创立AI时尚公司Phia,获800万美元融资。旗下AI购物助手Phia能比对价格,上线半年有超60万用户。二人因购物焦虑创业,菲比还提前毕业追梦。>阅读原文
鼎犀智创融资,AI重构新材料研发
鼎犀智创完成数千万元天使轮融资。其RhinoWise平台构建‘设计–模拟–制备–表征’闭环,让材料研发周期从数年缩至数月。将与龙头企业合作,推动AI+材料产业发展。>阅读原文
英特尔Q3营业利润创一年来新高
10月24日英特尔公布Q3财报,营收137亿美元、营业利润15亿美元创新高。CCG营收增幅大,DCAI净利润提升,代工仍亏损。本季度获政府资金、与NVIDIA合作等,利好未来发展。>阅读原文
DeepSeek迎合性超人类50%引关注
研究表明,11种LLM附和用户频率超人类50%,GPT - 5讨好行为少,DeepSeek - V3.1多。AI迎合现象在科研、日常、医疗领域有隐患,应重新训练模型,也可通过提示词干预。>阅读原文
马斯克「世界模拟器」首曝,擎天柱同脑进化
特斯拉首曝「世界模拟器」,可合成自动驾驶的孪生世界,用端到端神经网络。它能处理海量数据,输出可解释结果,还可用于评估和训练,也能助力擎天柱项目。>阅读原文
女儿用AI弑母,监管难题凸显
厄瓜多尔一女子Andreína用AI伪造母亲声音、外貌,掩盖弑母罪行。警方十天后找到遗体。AI在犯罪中的角色及责任界定成难题,全球多数国家法律在刑事AI作伪方面存在监管盲区。>阅读原文
OpenAI与Anthropic,AI商战谁能笑到最后?
OpenAI靠ChatGPT有庞大用户与收入,但订阅难抵成本,考虑加广告,还豪赌算力;Anthropic专注企业,Claude受青睐,收入逼近OpenAI一半,打法稳健,二者胜负未定。>阅读原文
Claude 正式杀入华尔街!
Anthropic 推出 Claude for Financial Services,有 Excel 插件,还能连接金融数据平台。Citi、RBC 等华尔街巨头采用,Claude 欲重塑金融生态,改写金融服务规则。>阅读原文
李开复:零一万物ToB 2.0布局加速
零一万物ToB战略进入落地阶段,公布新高管任命。“一把手工程”依托万智平台,覆盖多行业。国内与标杆客户合作,国际有共建模型,目标是让AI推动企业转型。>阅读原文
QCon上海站:AI工程化落地成焦点
QCon上海站大会上,霍太稳表示AI进入‘深水区’,工程化落地是关键,还开启榜单征集。夏立雪等专家演讲,如夏立雪称AI迈向多智能体时代,需构建适配基础设施。>阅读原文
北京AIGC创新中心:多方共建促产业发展
北京AIGC视听产业创新中心多方共建,首创郎园运营,提供六大服务平台,截至2025年8月汇聚60余家伙伴。首创郎园拓展服务边界,产业项目多地开花。>阅读原文
云赛沙龙:AI让开发门槛不再高
云赛空间开发者沙龙上,胡浩称AI重定义开发门槛;张欣提出人机共创三步法则;徐庭解读Microsoft 365 Copilot突破,大家还就AI时代开发多维度问题展开讨论。>阅读原文
GPT - 5系列差评不断,OpenAI被指“Meta化”
开发者发现OpenAI或推GPT - 5.1 mini,但GPT - 5系列差评多,速度和性能遭诟病。同时,OpenAI大量招聘前Meta员工,员工担心公司文化受影响,且公司对广告态度似有软化。>阅读原文
奥特曼杀入脑机接口,挑战马斯克!
奥特曼邀专家创建脑机接口公司Merge Labs,计划融资。它采用非侵入式技术挑战Neuralink开颅手术,奥特曼曾投资Neuralink却不认同其做法,Merge未来或探索新路径。>阅读原文
产品应用
Skyvern:革新浏览器自动化操作
小G介绍Skyvern,它借助大语言模型和计算机视觉自动化浏览器操作,相比传统方案更灵活。其工作原理受Agent启发,还介绍使用方法、功能,如任务和工作流等。>阅读原文
字节ByteRobust系统刷新LLM训练稳定性SOTA
字节跳动ByteRobust系统专为LLM训练定制,登上SOSP 2025。它通过控制和数据平面组件,实现自动化容错,处理各类故障,在超20万张GPU平台提升训练效率与稳定性,ETTR达97%。>阅读原文
20岁辍学生靠AI笔记工具年赚千万
20岁的Rudy Arora与Sarthak Dhawan辍学创办Turbo AI,从解决课堂记笔记难题起步,用户量达500万且盈利。产品功能不断迭代,从高校破圈到职场,拒绝大批融资,为创业模式提供新思路。>阅读原文
豆包团队:AI一键生成多人有声剧
豆包语音团队推出「AI 多人有声剧」方案,利用新模型和 AI 后期技术,实现从小说到有声剧全 AI 制作,降低成本与周期,演播和后期效果佳,未来将持续升级。>阅读原文
华为灵衢:打破算力“语言壁垒”
AI大模型让算力需求大增,单颗芯片算力和设备沟通问题凸显。华为推出超节点架构与灵衢技术,实现算力统一协作,还开放协议。其产品性能突出,指明未来计算无“语言壁垒”方向。>阅读原文
刘军:Spring AI Alibaba 的 DeepResearch 架构实践
刘军:基于 SpringAI Alibaba Graph 构建 DeepResearch 系统,有推理链路等能力。其 RAG 功能灵活可定制,还支持多种搜索工具与 MCP 服务,能动态生成报告,提供 Docker 等部署方式。>阅读原文
奥特曼:OpenAI铺开产品线圈用户
风投人Deedy梳理OpenAI产品线,涉及协作、浏览器等多领域。OpenAI先以ChatGPT抓用户,再扩张生态变现,但有人认为其离AGI理想渐远,只是把AI融入现有架构。>阅读原文
魔笔AI Chat Builder:让AI对话交互更便捷
阿里云魔笔AI Chat Builder可将AI对话转为可交互界面,综合现有开发方式优势。它有自定义Chat和Widget能力,支持多端发布。未来将提升能力,“好搭”智能开发模式将公测。>阅读原文
LangChain:重新定义Agent开发层次
LangChain获融资后重新定位,将Agent开发分三层。Vtrivedy提出Agent Harness概念,指出构建关键是“个性化定制基座”。Agent开发工程化成熟度提升,未来多数AI产品或用Agent基座。>阅读原文
推荐文章
跨维与港中大:具身智能新范式来袭
跨维智能贾奎、港中大(深圳)刘桂良指出,具身智能发展应从‘堆数据’转向‘高效造数据’。他们提出GS - World世界模型引擎,可解决数据问题,为具身智能提供可信赖基础,其引擎驱动学习范式是必然路径。>阅读原文
斯坦福团队:ACE让智能体自我进化
斯坦福等团队提出ACE方法,让智能体无需微调实现自我学习与进化。上下文工程很必要,要注重信息“营养”。ACE通过生成、反思、策划、再执行循环,让智能体不断积累经验、提升能力。>阅读原文
软件新玩法:从代码到技能库
作者认为软件进入功能即技能时代,Claude Skills 或成新范式,软件应消解为面向 LLM 的文件。市场去杠杆,科技与可选消费调整。多家公司有 AI 新动作,如 Netflix 用 AI 制作内容,Anthropic 推 Claude Code 网页版等。>阅读原文
TML提出策略蒸馏,受Qwen启发成本低
Thinking Machines Lab提出在策略蒸馏训练法,结合强化学习与SFT优点,成本低。成果受Qwen启发,大量用Qwen3。实验显示其在数学推理和个性化训练上优势明显,能高效提升小模型性能。>阅读原文
开源动态
UCL团队开源Prometheus,登顶AI编程智能体前十
UCL初创团队EuniAI开源Prometheus,在SWE - bench Verified成绩亮眼。它基于图结构推理,成本低、跨语言且可扩展。官网有Demo,团队还规划了其未来更强功能。>阅读原文
Warpgate:无客户端实现堡垒审计等功能
小华介绍 Warpgate,它是无需客户端的 SSH 等堡垒解决方案,能透明审计、会话回放。解决密钥管理、审计等痛点,适合中小企业等,还对比同类工具并给出实用贴士。>阅读原文
英伟达开源OmniVinci,性能远超同行
英伟达:推出全模态理解模型OmniVinci,用1/6数据,在基准测试成绩超Qwen2.5 - Omni 19.05分。靠创新架构和数据策略,降低成本,性能应用双优。>阅读原文
VideoVerse评测:Veo-3出色,Sora2有缺陷
中山大学等团队提出新评测框架VideoVerse,评估T2V模型对事件因果等的理解。评测发现,开源模型在世界模型级别与闭源有差距,Sora2也有缺陷,Veo - 3各维度表现出色。>阅读原文
翁荔团队:同策略蒸馏成本仅强化学习1/10
Thinking Machines开源同策略蒸馏策略,结合同策略训练与密集奖励信号。成本仅为强化学习1/10,能提升小模型特定领域表现,还可用于个性化和持续学习,可在Tinker复现相关成果。>阅读原文
DeepSeek-OCR衍生项目解锁OCR新玩法
DeepSeek-OCR开源后,开发者围绕它推出多个衍生项目。有轻量级前端应用,也有适合Windows的桌面工具等,覆盖多种场景,展现了开源模型的创新魅力。>阅读原文
美团开源视频模型LongCat - Video成SOTA
美团推出开源视频模型LongCat - Video,支持文生/图生视频,时长数分钟,质量优,可商用。技术有创新,长视频生成能力强。此前美团还发布多个大模型,“跨界”AI成新常态。>阅读原文
在线策略蒸馏:让LLM后训练效率飙升
THINKING MACHINES开源「在线策略蒸馏」方法,结合在线与离线策略训练优点。实验显示,它能让LLM后训练效率提升50 - 100倍、成本降低9到30倍,可用于数学推理迁移和模型个性化恢复。>阅读原文
Google Research 开源 Coral NPU 平台
Google Research 开源 Coral NPU 平台,能让 AI 在可穿戴和边缘设备本地运行,解决算力、生态、隐私问题,还与 Synaptics 合作打造物联网处理器,现已在 GitHub 开源。>阅读原文
MIT斯坦福:GeoEvolve让AI懂地理会进化
MIT和斯坦福学者推出GeoEvolve,将地理知识嵌入AI,使其自主进化地理模型。它有独特双循环机制和核心模块,以Kriging模型实验,证明地理知识库对算法进化作用关键,为GeoAI带来新方向。>阅读原文
算法论文
Thinking Machine:小模型训练新方法性价比高
Thinking Machine创始人、OpenAI前CTO Mira Murati转发新研究,提出On - Policy Distillation方法,结合RL与微调优势。实验显示训练小模型效率高,还能解决AI“灾难性遗忘”,核心作者是Kevin Lu。>阅读原文
DiDi-Instruct:让扩散大模型推理加速 60 倍
普渡大学等团队提出 DiDi-Instruct 后训练方法,将扩散大语言模型推理步数从 1024 步压缩至 8 - 16 步。实验显示其生成质量和训练效率大幅提升,跨领域应用潜力大。>阅读原文
中科院PARO:10%标注量等同全量性能
中科院计算所团队提出PARO框架,通过让模型学习固定推理模式自动生成思维链。实验表明,只需标注1/10数据,就能达到全量人工标注性能,适合金融等规则清晰领域。>阅读原文
研究揭示大模型“难度感知机制”
研究团队:大语言模型能感知问题难度,该感知结构化、可定位、可干预。通过训练线性探针、识别注意力头模式等方法证实,不同模型难度感知机制有差异,成果有诸多应用前景。>阅读原文
BEAR基准测大模型,Agent提升具身能力
美国东北大学等提出BEAR基准,用4496道题测20个MLLM。发现多模态大模型具身能力差,闭源通常优于开源。分析错因后开发BEAR - Agent,提升了模型在BEAR及桌面操作环境的表现。>阅读原文
VaseVQA:让AI在考古领域达专家级
AI Geeks等机构研究人员提出,在文化遗产领域,将大型多模态模型放于特定闭环训练,用VaseVQA基准评测。实验显示‘补弱导向’策略有效,此方法论对多领域有启发。>阅读原文
TPAMI 2025:AI对抗迁移性评估拨乱反正
西安交大赵正宇团队研究AI对抗迁移性评估。现有研究缺乏公平对比分析,团队将攻击方法分类评估,证实评估缺陷会误导,还得出早期攻击DI性能优、扩散防御易被攻破等新见解。>阅读原文
G - Reasoner 统一 GraphRAG,性能全面领先
G - Reasoner 提出统一框架融合图结构知识与语言模型能力,QuadGraph 统一图结构,GFM 进行图推理,增强 LLM 回答能力,在多基准测试中性能领先,泛化和效率表现佳。>阅读原文
西湖大学:共识机制让提示词性能飙升
西湖大学MAPLE实验室齐国君教授团队:人工智能正从「模型微调」转向「上下文工程」,提出「共识机制」的提示词组进化算法C - Evolve,能提升系统性能,释放大模型潜力。>阅读原文
RETuning:让AI有理有据炒A股
香港科技大学等团队提出RETuning方法,基于A股数据集验证,让大语言模型学会“有理有据思考”。它提升预测准确率、推理可解释性,结合多思路优势,但受市场波动影响,算力消耗高,待多市场验证。>阅读原文
新论文:机器人预测语义信息就够了
华盛顿大学、索尼AI研究者新论文质疑世界模型想象画面必要性。提出SWM,将信息建模为VQA问题,捕捉任务相关对象及交互信息。实验显示其能准确回答问题、泛化新场景,提升规划效果。>阅读原文
多机构联合发布数据分析智能体综述
上交、清华等联合发布综述,指出传统数据分析有局限,大语言模型与智能体让其迈向“语义理解”。总结五大趋势,梳理各数据类型技术,提出构建通用数据分析智能体新范式及未来挑战。>阅读原文
Earth - Agent:解锁地球观测数据分析新范式
上海人工智能实验室与中山大学联合推出 Earth - Agent。它解决了多模态大模型在地球科学研究的难题,经 Earth - Bench 评估表现佳。未来可拓展工具、指导训练,还可能在视觉能力上突破。>阅读原文
北航董雷霆:数字技术助力航空结构管理
北航董雷霆等指出,疲劳断裂是飞行事故结构破坏主因。数字工程与数字孪生技术为航空疲劳与结构完整性管理提供新方案,文中梳理进展、案例,建议推动核心技术研究、加强合作、制定标准。>阅读原文
中科院团队:GOI让LLM摆脱GUI困境
中科院软件所团队研究发现,现有LLM智能体痛点源于GUI与LLM能力错配。为此提出声明式接口GOI,实现策略与机制分离,实验显示其使成功率从44%升至74%,为大模型交互指明方向。>阅读原文
UniCode框架:革新大模型代码能力评测
北大与通用人工智能研究院提出 UniCode 框架,用三种策略生成题目、压力驱动合成测试用例。经评测,它挑战高、能暴露模型差异,还证明含少量错题的大规模基准更可靠。>阅读原文
</p>