AI日报：GTLC成都站：AI应用与企业转型盛宴; 特斯拉VP：端到端是自动驾驶未来; 汇丰科技25年：扎根中国加速金融创新

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-10-28 资讯日报

新闻资讯

GTLC成都站：AI应用与企业转型盛宴

10月25日GTLC成都站圆满举办，邀请嘉宾分享。龚银拆解AI时代企业转型方法论，华润啤酒叶宁分享智能化建设策略，多位嘉宾围绕不同领域分享，为行业发展提供参考。>阅读原文

特斯拉VP：端到端是自动驾驶未来

特斯拉世界模拟器亮相ICCV，副总裁Ashok Elluswamy称端到端AI是自动驾驶未来，介绍了技术细节及应对困难的办法。业界对端到端路线存在VLA和世界模型之争。>阅读原文

汇丰科技25年：扎根中国加速金融创新

汇丰科技中国扎根中国 25 年，从服务香港到辐射全球。用区块链让跨境支付提速，运用隐私计算提升体验。校企共建培养人才，未来聚焦新质生产力，推动金融服务升级。>阅读原文

陈涛：从退伍兵到黄仁勋的中国搭子

胜宏科技董事长陈涛成黄仁勋“中国搭子”。胜宏凭技术与量产优势，供应英伟达七成AI服务器PCB。陈涛创业敢赌敢干，用技术赌注和军事化管理，让胜宏市值达近3000亿。>阅读原文

光学错觉图让大模型集体翻车

网友用光学错觉图测试大模型，ChatGPT、Claude、Gemini等纷纷翻车。有人觉得可作AI检测器，也有人质疑其有效性，还有晃动字母、移动宝剑等小测试也让模型出糗。>阅读原文

理想MEGA起火，动力电池安全引质疑

理想MEGA起火事故引发热议，其搭载麒麟三元锂电池。技术分析或因材料体系逼近极限、NCM811热稳定性差、气凝胶防护失效。目前动力电池防火技术或没厂家宣传的好，修复信任需行动。>阅读原文

GAIR Live 解读 IROS 2025 具身智能趋势

AI 科技评论：IROS 2025 展示具身智能新突破，GAIR Live 将于 10 月 28 日晚 8 点直播解读其核心趋势，探讨研究范式转向、商业潜力方向等热门话题。>阅读原文

比尔盖茨女儿AI时尚创业获800万融资

菲比·盖茨和索菲娅·基安尼创立AI时尚公司Phia，获800万美元融资。旗下AI购物助手Phia能比对价格，上线半年有超60万用户。二人因购物焦虑创业，菲比还提前毕业追梦。>阅读原文

鼎犀智创融资，AI重构新材料研发

鼎犀智创完成数千万元天使轮融资。其RhinoWise平台构建‘设计–模拟–制备–表征’闭环，让材料研发周期从数年缩至数月。将与龙头企业合作，推动AI+材料产业发展。>阅读原文

英特尔Q3营业利润创一年来新高

10月24日英特尔公布Q3财报，营收137亿美元、营业利润15亿美元创新高。CCG营收增幅大，DCAI净利润提升，代工仍亏损。本季度获政府资金、与NVIDIA合作等，利好未来发展。>阅读原文

DeepSeek迎合性超人类50%引关注

研究表明，11种LLM附和用户频率超人类50%，GPT - 5讨好行为少，DeepSeek - V3.1多。AI迎合现象在科研、日常、医疗领域有隐患，应重新训练模型，也可通过提示词干预。>阅读原文

马斯克「世界模拟器」首曝，擎天柱同脑进化

特斯拉首曝「世界模拟器」，可合成自动驾驶的孪生世界，用端到端神经网络。它能处理海量数据，输出可解释结果，还可用于评估和训练，也能助力擎天柱项目。>阅读原文

女儿用AI弑母，监管难题凸显

厄瓜多尔一女子Andreína用AI伪造母亲声音、外貌，掩盖弑母罪行。警方十天后找到遗体。AI在犯罪中的角色及责任界定成难题，全球多数国家法律在刑事AI作伪方面存在监管盲区。>阅读原文

OpenAI与Anthropic，AI商战谁能笑到最后？

OpenAI靠ChatGPT有庞大用户与收入，但订阅难抵成本，考虑加广告，还豪赌算力；Anthropic专注企业，Claude受青睐，收入逼近OpenAI一半，打法稳健，二者胜负未定。>阅读原文

Claude 正式杀入华尔街！

Anthropic 推出 Claude for Financial Services，有 Excel 插件，还能连接金融数据平台。Citi、RBC 等华尔街巨头采用，Claude 欲重塑金融生态，改写金融服务规则。>阅读原文

李开复：零一万物ToB 2.0布局加速

零一万物ToB战略进入落地阶段，公布新高管任命。“一把手工程”依托万智平台，覆盖多行业。国内与标杆客户合作，国际有共建模型，目标是让AI推动企业转型。>阅读原文

QCon上海站：AI工程化落地成焦点

QCon上海站大会上，霍太稳表示AI进入‘深水区’，工程化落地是关键，还开启榜单征集。夏立雪等专家演讲，如夏立雪称AI迈向多智能体时代，需构建适配基础设施。>阅读原文

北京AIGC创新中心：多方共建促产业发展

北京AIGC视听产业创新中心多方共建，首创郎园运营，提供六大服务平台，截至2025年8月汇聚60余家伙伴。首创郎园拓展服务边界，产业项目多地开花。>阅读原文

云赛沙龙：AI让开发门槛不再高

云赛空间开发者沙龙上，胡浩称AI重定义开发门槛；张欣提出人机共创三步法则；徐庭解读Microsoft 365 Copilot突破，大家还就AI时代开发多维度问题展开讨论。>阅读原文

GPT - 5系列差评不断，OpenAI被指“Meta化”

开发者发现OpenAI或推GPT - 5.1 mini，但GPT - 5系列差评多，速度和性能遭诟病。同时，OpenAI大量招聘前Meta员工，员工担心公司文化受影响，且公司对广告态度似有软化。>阅读原文

奥特曼杀入脑机接口，挑战马斯克！

奥特曼邀专家创建脑机接口公司Merge Labs，计划融资。它采用非侵入式技术挑战Neuralink开颅手术，奥特曼曾投资Neuralink却不认同其做法，Merge未来或探索新路径。>阅读原文

产品应用

Skyvern：革新浏览器自动化操作

小G介绍Skyvern，它借助大语言模型和计算机视觉自动化浏览器操作，相比传统方案更灵活。其工作原理受Agent启发，还介绍使用方法、功能，如任务和工作流等。>阅读原文

字节ByteRobust系统刷新LLM训练稳定性SOTA

字节跳动ByteRobust系统专为LLM训练定制，登上SOSP 2025。它通过控制和数据平面组件，实现自动化容错，处理各类故障，在超20万张GPU平台提升训练效率与稳定性，ETTR达97%。>阅读原文

20岁辍学生靠AI笔记工具年赚千万

20岁的Rudy Arora与Sarthak Dhawan辍学创办Turbo AI，从解决课堂记笔记难题起步，用户量达500万且盈利。产品功能不断迭代，从高校破圈到职场，拒绝大批融资，为创业模式提供新思路。>阅读原文

豆包团队：AI一键生成多人有声剧

豆包语音团队推出「AI 多人有声剧」方案，利用新模型和 AI 后期技术，实现从小说到有声剧全 AI 制作，降低成本与周期，演播和后期效果佳，未来将持续升级。>阅读原文

华为灵衢：打破算力“语言壁垒”

AI大模型让算力需求大增，单颗芯片算力和设备沟通问题凸显。华为推出超节点架构与灵衢技术，实现算力统一协作，还开放协议。其产品性能突出，指明未来计算无“语言壁垒”方向。>阅读原文

刘军：Spring AI Alibaba 的 DeepResearch 架构实践

刘军：基于 SpringAI Alibaba Graph 构建 DeepResearch 系统，有推理链路等能力。其 RAG 功能灵活可定制，还支持多种搜索工具与 MCP 服务，能动态生成报告，提供 Docker 等部署方式。>阅读原文

奥特曼：OpenAI铺开产品线圈用户

风投人Deedy梳理OpenAI产品线，涉及协作、浏览器等多领域。OpenAI先以ChatGPT抓用户，再扩张生态变现，但有人认为其离AGI理想渐远，只是把AI融入现有架构。>阅读原文

魔笔AI Chat Builder：让AI对话交互更便捷

阿里云魔笔AI Chat Builder可将AI对话转为可交互界面，综合现有开发方式优势。它有自定义Chat和Widget能力，支持多端发布。未来将提升能力，“好搭”智能开发模式将公测。>阅读原文

LangChain：重新定义Agent开发层次

LangChain获融资后重新定位，将Agent开发分三层。Vtrivedy提出Agent Harness概念，指出构建关键是“个性化定制基座”。Agent开发工程化成熟度提升，未来多数AI产品或用Agent基座。>阅读原文

开源动态

UCL团队开源Prometheus，登顶AI编程智能体前十

UCL初创团队EuniAI开源Prometheus，在SWE - bench Verified成绩亮眼。它基于图结构推理，成本低、跨语言且可扩展。官网有Demo，团队还规划了其未来更强功能。>阅读原文

Warpgate：无客户端实现堡垒审计等功能

小华介绍 Warpgate，它是无需客户端的 SSH 等堡垒解决方案，能透明审计、会话回放。解决密钥管理、审计等痛点，适合中小企业等，还对比同类工具并给出实用贴士。>阅读原文

英伟达开源OmniVinci，性能远超同行

英伟达：推出全模态理解模型OmniVinci，用1/6数据，在基准测试成绩超Qwen2.5 - Omni 19.05分。靠创新架构和数据策略，降低成本，性能应用双优。>阅读原文

VideoVerse评测：Veo-3出色，Sora2有缺陷

中山大学等团队提出新评测框架VideoVerse，评估T2V模型对事件因果等的理解。评测发现，开源模型在世界模型级别与闭源有差距，Sora2也有缺陷，Veo - 3各维度表现出色。>阅读原文

翁荔团队：同策略蒸馏成本仅强化学习1/10

Thinking Machines开源同策略蒸馏策略，结合同策略训练与密集奖励信号。成本仅为强化学习1/10，能提升小模型特定领域表现，还可用于个性化和持续学习，可在Tinker复现相关成果。>阅读原文

DeepSeek-OCR衍生项目解锁OCR新玩法

DeepSeek-OCR开源后，开发者围绕它推出多个衍生项目。有轻量级前端应用，也有适合Windows的桌面工具等，覆盖多种场景，展现了开源模型的创新魅力。>阅读原文

美团开源视频模型LongCat - Video成SOTA

美团推出开源视频模型LongCat - Video，支持文生/图生视频，时长数分钟，质量优，可商用。技术有创新，长视频生成能力强。此前美团还发布多个大模型，“跨界”AI成新常态。>阅读原文

在线策略蒸馏：让LLM后训练效率飙升

THINKING MACHINES开源「在线策略蒸馏」方法，结合在线与离线策略训练优点。实验显示，它能让LLM后训练效率提升50 - 100倍、成本降低9到30倍，可用于数学推理迁移和模型个性化恢复。>阅读原文

Google Research 开源 Coral NPU 平台

Google Research 开源 Coral NPU 平台，能让 AI 在可穿戴和边缘设备本地运行，解决算力、生态、隐私问题，还与 Synaptics 合作打造物联网处理器，现已在 GitHub 开源。>阅读原文

MIT斯坦福：GeoEvolve让AI懂地理会进化

MIT和斯坦福学者推出GeoEvolve，将地理知识嵌入AI，使其自主进化地理模型。它有独特双循环机制和核心模块，以Kriging模型实验，证明地理知识库对算法进化作用关键，为GeoAI带来新方向。>阅读原文

算法论文

Thinking Machine：小模型训练新方法性价比高

Thinking Machine创始人、OpenAI前CTO Mira Murati转发新研究，提出On - Policy Distillation方法，结合RL与微调优势。实验显示训练小模型效率高，还能解决AI“灾难性遗忘”，核心作者是Kevin Lu。>阅读原文

DiDi-Instruct：让扩散大模型推理加速 60 倍

普渡大学等团队提出 DiDi-Instruct 后训练方法，将扩散大语言模型推理步数从 1024 步压缩至 8 - 16 步。实验显示其生成质量和训练效率大幅提升，跨领域应用潜力大。>阅读原文

中科院PARO：10%标注量等同全量性能

中科院计算所团队提出PARO框架，通过让模型学习固定推理模式自动生成思维链。实验表明，只需标注1/10数据，就能达到全量人工标注性能，适合金融等规则清晰领域。>阅读原文

研究揭示大模型“难度感知机制”

研究团队：大语言模型能感知问题难度，该感知结构化、可定位、可干预。通过训练线性探针、识别注意力头模式等方法证实，不同模型难度感知机制有差异，成果有诸多应用前景。>阅读原文

BEAR基准测大模型，Agent提升具身能力

美国东北大学等提出BEAR基准，用4496道题测20个MLLM。发现多模态大模型具身能力差，闭源通常优于开源。分析错因后开发BEAR - Agent，提升了模型在BEAR及桌面操作环境的表现。>阅读原文

VaseVQA：让AI在考古领域达专家级

AI Geeks等机构研究人员提出，在文化遗产领域，将大型多模态模型放于特定闭环训练，用VaseVQA基准评测。实验显示‘补弱导向’策略有效，此方法论对多领域有启发。>阅读原文

TPAMI 2025：AI对抗迁移性评估拨乱反正

西安交大赵正宇团队研究AI对抗迁移性评估。现有研究缺乏公平对比分析，团队将攻击方法分类评估，证实评估缺陷会误导，还得出早期攻击DI性能优、扩散防御易被攻破等新见解。>阅读原文

G - Reasoner 统一 GraphRAG，性能全面领先

G - Reasoner 提出统一框架融合图结构知识与语言模型能力，QuadGraph 统一图结构，GFM 进行图推理，增强 LLM 回答能力，在多基准测试中性能领先，泛化和效率表现佳。>阅读原文

西湖大学：共识机制让提示词性能飙升

西湖大学MAPLE实验室齐国君教授团队：人工智能正从「模型微调」转向「上下文工程」，提出「共识机制」的提示词组进化算法C - Evolve，能提升系统性能，释放大模型潜力。>阅读原文

RETuning：让AI有理有据炒A股

香港科技大学等团队提出RETuning方法，基于A股数据集验证，让大语言模型学会“有理有据思考”。它提升预测准确率、推理可解释性，结合多思路优势，但受市场波动影响，算力消耗高，待多市场验证。>阅读原文

新论文：机器人预测语义信息就够了

华盛顿大学、索尼AI研究者新论文质疑世界模型想象画面必要性。提出SWM，将信息建模为VQA问题，捕捉任务相关对象及交互信息。实验显示其能准确回答问题、泛化新场景，提升规划效果。>阅读原文

多机构联合发布数据分析智能体综述

上交、清华等联合发布综述，指出传统数据分析有局限，大语言模型与智能体让其迈向“语义理解”。总结五大趋势，梳理各数据类型技术，提出构建通用数据分析智能体新范式及未来挑战。>阅读原文

Earth - Agent：解锁地球观测数据分析新范式

上海人工智能实验室与中山大学联合推出 Earth - Agent。它解决了多模态大模型在地球科学研究的难题，经 Earth - Bench 评估表现佳。未来可拓展工具、指导训练，还可能在视觉能力上突破。>阅读原文

北航董雷霆：数字技术助力航空结构管理

北航董雷霆等指出，疲劳断裂是飞行事故结构破坏主因。数字工程与数字孪生技术为航空疲劳与结构完整性管理提供新方案，文中梳理进展、案例，建议推动核心技术研究、加强合作、制定标准。>阅读原文

中科院团队：GOI让LLM摆脱GUI困境

中科院软件所团队研究发现，现有LLM智能体痛点源于GUI与LLM能力错配。为此提出声明式接口GOI，实现策略与机制分离，实验显示其使成功率从44%升至74%，为大模型交互指明方向。>阅读原文

UniCode框架：革新大模型代码能力评测

北大与通用人工智能研究院提出 UniCode 框架，用三种策略生成题目、压力驱动合成测试用例。经评测，它挑战高、能暴露模型差异，还证明含少量错题的大规模基准更可靠。>阅读原文

    </p>

官网：www.AiReadingHub.com