AI Daily | AI日报：RSS 2025 奖项公布，多项研究成果亮眼; 何恺明：加盟谷歌DeepMind搞科研; 华为云：具身智能聚焦生产力协同

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-06-26 资讯日报

新闻资讯

RSS 2025 奖项公布，多项研究成果亮眼

机器人顶会 RSS 2025 公布多个奖项。杰出 Demo 奖研究提出 MuJoCo Playground 框架简化流程；杰出系统奖研究提出 SBA 公式等；杰出学生奖提出 Def - MARL 算法；杰出论文奖推出 FEAST 进餐辅助系统。>阅读原文

何恺明：加盟谷歌DeepMind搞科研

AI大牛何恺明拿下MIT终身教职后，兼职加盟谷歌DeepMind任杰出科学家。他是CV领域传奇，与谷歌早有合作，此次是老熟人强强联手。>阅读原文

华为云：具身智能聚焦生产力协同

华为云计算 CEO 张平安：华为云目标是让联网本体成具身智能机器人。实践表明，具身智能产业应聚焦生产力，不同形态机器人可共存协作，产业竞赛关键是打造群体智能协同。>阅读原文

DeepMind：AlphaGenome直击疾病根源

谷歌DeepMind推出AlphaGenome，可精准预测基因变异，已向非商业研究开放。它有长序列高分辨率等四大优势，在疾病理解等多领域有潜力，但也存在超远距离调控元件捕捉难等局限。>阅读原文

React 被指成 Vercel 附庸，核心成员回应遭群嘲

React 生态核心参与者 Mark Erikson 称，外界质疑 Vercel 主导 React 发展是误解，实际是 React 团队主导 Next.js。RSC 需与框架集成，虽推荐用框架，但社区对此有分歧，生态现分裂。>阅读原文

迪士尼、环球起诉Midjourney AI版权侵权

迪士尼和环球影业起诉Midjourney，指控其未经授权用版权作品训练模型、分发含其角色图像。版权法对AI训练版权界定不明，此案或成关键先例，好莱坞或可考虑与AI公司合作。>阅读原文

美法院：AI可用合法购书训练，无需作者同意

美国法院裁定，Anthropic可未经许可用合法购书训练AI，因属“转化性使用”。此前Google Books、GitHub Copilot也有类似诉讼，Open AI和Meta案尚在审理，此次裁决或有影响。>阅读原文

何恺明兼职加入谷歌DeepMind

网友爆料何恺明加入谷歌，后确认其兼职任谷歌DeepMind杰出科学家。他近期研究关注生成模型端到端训练。何恺明履历耀眼，成果丰硕，如ResNet等，期待他在谷歌有新突破。>阅读原文

Snowflake：企业AI投资回报率达41%

Snowflake调查显示，已部署生成式AI的企业平均ROI达41%，应用于多领域。但企业面临数据与模型管理挑战，不同行业和区域表现不同，不过98%企业仍计划增加相关预算。>阅读原文

小米小爱同学：探索端侧大模型落地之路

小米小爱同学端侧AI负责人杨永杰称，端侧大模型商业化受设备资源和模型更新限制。团队自研推理框架，实现高性能推理。未来突破方向在硬件提升和模型架构演进，如Linear Attention架构。>阅读原文

Delphi靠AI数字分身获红杉1600万融资

Delphi团队获红杉1600万美元融资。产品源于创始人复活中风祖父的想法，上线后反响好，有人年入百万。它打破传统信息连接限制，未来想服务更多有智慧者，扩展其影响力。>阅读原文

奥特曼回应OpenAI硬件“抄袭门”

奥特曼回应OpenAI硬件“抄袭门”，称IYO投资没谈拢就诉讼，是“愚蠢的”。双方各执一词，邮件证据曝光。同时，OpenAI为ChatGPT设计新功能，与办公工具竞争。>阅读原文

郭奕彤：AI夺不走艺术灵魂

AI绘画风大，有人称人类要失业。郭奕彤用《合成图像家庭》回击，以碳笔勾勒形象让AI辅助，还为电视装系统定制影像，展现人类在艺术创作中不可替代。>阅读原文

LangChain：上下文工程在AI时代火了

机器之心报道：AI时代，随着应用复杂度增加，单纯依赖提示词无法满足需求，上下文工程应运而生，它能为LLM提供合适信息和工具，正成为AI工程师重要技能。>阅读原文

杨宝嵩：通义千问国际化与Scaling策略

阿里杨宝嵩称，通义千问从项目启动就重视多语言能力，面向全球市场。多语言推理难题待解，采用折中策略。他认为扩大模型规模和数据量仍重要，合成数据可延续Scaling Law，使用时要控制比例。>阅读原文

何恺明入职谷歌DeepMind！

何恺明入职谷歌DeepMind任杰出科学家，保留MIT终身副教授身份。他是CV领域传奇，成果众多、奖项无数，今年还不断有新研究，将为DeepMind的AGI发展助力。>阅读原文

沐曦冲刺“国产GPU第一股”

6月23日沐曦完成IPO辅导，准备A股上市。它专注高性能GPU，产品丰富且与大模型合作。此前有裁员传闻，已完成8轮融资。国产GPU厂商扎堆IPO，适配DeepSeek为国产芯片带来发展新思路。>阅读原文

2025 AI Cloud 100 China榜单发布

6月22日，靖亚资本等发布2025 AI Cloud 100 China榜单，34家新上榜。报告显示全球AI融资火热，中国AI Cloud市场资金流向特定赛道。预测未来AI应用升级、环境智能等五大趋势。>阅读原文

英伟达官宣RTX 5050，网友却不买账

英伟达推出RTX 5050桌面/笔记本GPU，7月上市，国内2099元起。其性能提升大，不过显存配置“新旧混搭”。网友觉得能耗高、性价比低，买不买还得看参数。>阅读原文

产品应用

谷歌发布免费开源AI编程神器Gemini CLI

谷歌发布开源AI编程神器Gemini CLI，个人免费，用Gemini 2.5 Pro模型，有大上下文窗口和高免费额度。它是全能助手，功能强大，与VS Code无缝切换，GitHub获9k+ Star。>阅读原文

TRAE：未来AI IDE要构建「AI工程师」

TRAE产品经理Leon：未来AI Coding是「AI+工具」模式，推出Solo模式。TRAE有代码补全等功能，月活超百万。虽AI能助力开发，但当前还需人在不同AI间切换，未来想打造统一工作空间。>阅读原文

出门问问发布999元智能体AI硬件TicNote

出门问问推出全球首款智能体AI硬件TicNote，支持录音转写等多种功能，方便携带。海外上市后国内版也已上线，售价999元起。出门问问坚持软硬结合，未来Shadow AI将拓展到更多硬件。>阅读原文

AI癌症筛查：半年挽救6条生命

作者分享用AI对抗癌症故事。阿里达摩院发布胃癌早筛模型GRAPE、胰腺癌早筛模型PANDA。作者体验PANDA筛查，医生业余投入项目，半年救6人，作者盼技术普及。>阅读原文

出门问问TicNote：AI录音神器体验揭秘

作者深度体验出门问问TicNote，它硬件轻薄，录音稳定，软件强大，支持多语种和方言，能自动总结、生成思维导图等。价格999元或1499元，适合职场人士、创作者、学生等。>阅读原文

高通Nuvia架构：自研CPU的新突破

高通收购Nuvia强化自研CPU技术，减少对ARM依赖，拓展多市场。Oryon CPU架构应用于Snapdragon X Elite，设计独特，缓存和执行单元出色，还具备安全功能，性能和能效有优势，不过面临Arm法律诉讼。>阅读原文

达摩院AI：提前半年揪出胃癌病灶

达摩院联合浙肿研发出胃癌AI模型DAMO GRAPE，“平扫CT+AI”模式可提前6个月发现胃癌，提升检出率。此前还有筛查胰腺癌的DAMO PANDA，未来将探索“一扫多查”。>阅读原文

AI让世界名画复活走秀，网友泪崩

国外ODDY工作室用AI打造《名作艺术秀》视频，让梵高、达利等艺术大师和其名作化身“T台模特”。视频不仅画面精美，还有“幕后故事”，实现艺术界“时空旅行”，网友被深深打动。>阅读原文

宝玉：解析AI播客原理与提示词玩法

宝玉介绍用豆包AI播客生成英文长文播客的便捷。解析其原理，涉及提示词工程与文字转语音技术。分享提示词写作优化过程及长文处理法，推荐豆包和Google NotebookLM。>阅读原文

英伟达B30与H20对比及国产替代解析

媒体报道英伟达为中国研发B30芯片。与H20比，B30单卡性能弱，但集群性价比高，适多场景。不过面临国产替代挑战，华为昇腾910B、寒武纪思元590各有优势，美技术封锁难阻中国芯片发展。>阅读原文

OceanBase：OB Cloud助力企业AI落地

大模型热潮下企业AI落地难，OceanBase的OB Cloud支持多类型向量数据，助数十家企业落地AI。它有多云原生优势，一体化架构处理数据，还提供工具降门槛，代表云数据库未来形态。>阅读原文

DataV - Note：揭秘数据分析报告评估体系

阿里部门推出DataV - Note平台，面临缺乏统一评估标准等问题。为此构建评估模型，确立目标，设计模型，建立纵向和横向评估标准，未来计划接入自动化和利用评估模型提升准确度。>阅读原文

字节上线「探饭」，AI推荐美食

字节跳动上线「探饭」AI产品，在抖音小程序可体验。能智能推荐餐厅，有AI评价总结、点菜等功能，餐厅信息全，支持团购外卖，还能餐厅PK。>阅读原文

开源动态

谷歌开源Gemini CLI，Github狂揽9000星

谷歌：凌晨开源AI Agent框架Gemini CLI，可调用多模型，集成MCP等功能。还集成超强编程助手，支持多语言。刚开源Github就超9000星，开发者可按需使用不同模式。>阅读原文

字节跳动开源项目助力AI Agent破痛点

字节跳动在原动力大会开源开发者日上，探讨开源为AI Agent带来的技术改变。嘉宾分享多个开源项目经验，如veRL提升强化学习能力、UI-TARS实现多模态与跨平台支持等，解决行业痛点。>阅读原文

Claudia：开源GUI拯救Claude Code体验

Claude Code命令行操作不便，开源的Claudia GUI工具解决了使用体验问题。它将操作转化为图形界面，支持会话管理、检查点回滚等，还具备多模态交互功能，跨平台可用。>阅读原文

Google：Gemini CLI开源免费，改写AI编程规则

Google发布开源免费的Gemini CLI，免费用户有高请求额度。它是功能完整的AI代理，能接入搜索等，还与Gemini Code Assist配合，或改变AI编程工具格局，开发者可抓紧薅羊毛。>阅读原文

361k+ star！免费编程资源宝藏项目来袭

开源君推荐GitHub项目free-programming-books，汇聚海量免费编程资源，涵盖主流技术与小众领域。资源更新快、结构清晰、支持多语言，使用便捷，是编程者的宝藏库。>阅读原文

港大黄超团队开源多模态RAG - Anything系统

香港大学黄超教授团队开源RAG - Anything系统，突破传统RAG技术文本局限，能处理多模态文档。它有创新架构和技术亮点，提供便捷部署方式与多场景应用模式，未来在推理和应用场景拓展上有潜力。>阅读原文

快手Keye-VL开源，视频理解能力爆表！

快手发布多模态大语言模型Kwai Keye-VL并开源。它基于Qwen3-8B，能深度融合多模态信息，在视频理解、视觉感知和推理上表现佳。通过多阶段训练提升能力，在多个评测中领先。>阅读原文

谷歌：首发具身离线模型，断网操控机器人

谷歌推出首个具身机器人本地离线运行的VLA模型Gemini Robotics On-Device，无网络也稳定。它基于Gemini 2.0，泛化性能强，谷歌还开源SDK，推动具身智能迈向实用。>阅读原文

Portkey：3行代码接入1600+ LLM的开源网关

Portkey AI Gateway：可3行代码接入超1600款模型，解决模型集成适配、成本、合规等痛点，功能强大，与同类相比优势明显，是生产阶段重要AI基础设施。>阅读原文

新型Python打包神器PyFuze登场！

PyFuze是刚开源的Python打包工具，基于cosmopolitan和uv构建，有三种打包模式，兼容GUI应用、跨平台运行。它比PyInstaller兼容性更好、打包更快，能让Python分发像Go一样简单。>阅读原文

谷歌开源免费编程Agent Gemini CLI

谷歌推出开源免费的Gemini CLI，提供业界最高免费限额。它能力丰富，可在命令行用自然语言指挥写代码、Debug，支持百万上下文、多模态和MCP，还给出安装及使用示例。>阅读原文

阿里达摩院DDColor：黑白图上色神器

阿里达摩院推出DDColor图像自动着色模型，基于双解码器设计，能实现黑白图转彩色图，兼容多类型图片。它色彩还原准确、丰富，推理快，成本低，适用于历史修复、影像美化等场景。>阅读原文

ScienceBoard：开启智能体科研评测新时代

香港大学等团队推出ScienceBoard评测环境，评估智能体科研能力。实验显示，当前最强模型在科研工作流中成功率低，将规划与执行解耦可提升成功率，未来应让智能体‘理解科学’。>阅读原文

算法论文

北大腾讯：RewardAnything突破奖励模型瓶颈

北大联合腾讯等机构提出RewardAnything，它采用创新技术，在RM - Bench和RABench评测中表现优异，能通过自然语言原则规避偏见，还能定制AI行为，降低了AI系统对齐的门槛。>阅读原文

北大团队：AI开始掌握人类创造力

北大团队研究指出，AI开始掌握人类创造力核心机制，通过IEI框架评估发现，GPT - 4等在创意理解上超普通人，但深层语义解读不及专家，框架优化能提升AI创意输出质量。>阅读原文

清华团队：让大模型从“浅对齐”迈向“深思熟虑”

清华团队：大模型“浅对齐”脆弱，提出STAIR框架，分三步提升模型安全与性能；还推出RealSafe - R1模型，在提升开源DeepSeek - R1安全性时保持推理能力。>阅读原文

LC - R1：让大模型推理精准“瘦身”

论文指出当前大模型推理冗长，存在‘无效思考’，浪费大量计算资源。提出解决原则和LC - R1方法，经测试，该方法能砍半推理长度，精度仅降约2%，揭示精准思考才是关键。>阅读原文

8B 模型靠 ParallelComp 超 GPT - 4o

香港大学博士生熊璟提出 ParallelComp 方法，通过并行分块、KV 缓存压缩和注意力偏差校准，让 8B 模型在超长文本任务性能接近甚至超 GPT - 4o 等，为 LLM 落地带来新范式。>阅读原文

OMEGA基准揭示LLM数学推理深层瓶颈

UC Berkeley团队提出OMEGA基准评估LLM数学泛化能力。实验发现复杂度让模型性能崩塌，存在计算回避，RL泛化有局限，指出LLM机械重复易、创新组合难，给出短长期改进方向。>阅读原文

    </p>

官网：www.AiReadingHub.com