AI Daily | AI日报:RSS 2025 奖项公布,多项研究成果亮眼; 何恺明:加盟谷歌DeepMind搞科研; 华为云:具身智能聚焦生产力协同

331 阅读4分钟

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。

2025-06-26 资讯日报

新闻资讯

RSS 2025 奖项公布,多项研究成果亮眼

机器人顶会 RSS 2025 公布多个奖项。杰出 Demo 奖研究提出 MuJoCo Playground 框架简化流程;杰出系统奖研究提出 SBA 公式等;杰出学生奖提出 Def - MARL 算法;杰出论文奖推出 FEAST 进餐辅助系统。>阅读原文

何恺明:加盟谷歌DeepMind搞科研

AI大牛何恺明拿下MIT终身教职后,兼职加盟谷歌DeepMind任杰出科学家。他是CV领域传奇,与谷歌早有合作,此次是老熟人强强联手。>阅读原文

华为云:具身智能聚焦生产力协同

华为云计算 CEO 张平安:华为云目标是让联网本体成具身智能机器人。实践表明,具身智能产业应聚焦生产力,不同形态机器人可共存协作,产业竞赛关键是打造群体智能协同。>阅读原文

DeepMind:AlphaGenome直击疾病根源

谷歌DeepMind推出AlphaGenome,可精准预测基因变异,已向非商业研究开放。它有长序列高分辨率等四大优势,在疾病理解等多领域有潜力,但也存在超远距离调控元件捕捉难等局限。>阅读原文

React 被指成 Vercel 附庸,核心成员回应遭群嘲

React 生态核心参与者 Mark Erikson 称,外界质疑 Vercel 主导 React 发展是误解,实际是 React 团队主导 Next.js。RSC 需与框架集成,虽推荐用框架,但社区对此有分歧,生态现分裂。>阅读原文

迪士尼、环球起诉Midjourney AI版权侵权

迪士尼和环球影业起诉Midjourney,指控其未经授权用版权作品训练模型、分发含其角色图像。版权法对AI训练版权界定不明,此案或成关键先例,好莱坞或可考虑与AI公司合作。>阅读原文

美法院:AI可用合法购书训练,无需作者同意

美国法院裁定,Anthropic可未经许可用合法购书训练AI,因属“转化性使用”。此前Google Books、GitHub Copilot也有类似诉讼,Open AI和Meta案尚在审理,此次裁决或有影响。>阅读原文

何恺明兼职加入谷歌DeepMind

网友爆料何恺明加入谷歌,后确认其兼职任谷歌DeepMind杰出科学家。他近期研究关注生成模型端到端训练。何恺明履历耀眼,成果丰硕,如ResNet等,期待他在谷歌有新突破。>阅读原文

Snowflake:企业AI投资回报率达41%

Snowflake调查显示,已部署生成式AI的企业平均ROI达41%,应用于多领域。但企业面临数据与模型管理挑战,不同行业和区域表现不同,不过98%企业仍计划增加相关预算。>阅读原文

小米小爱同学:探索端侧大模型落地之路

小米小爱同学端侧AI负责人杨永杰称,端侧大模型商业化受设备资源和模型更新限制。团队自研推理框架,实现高性能推理。未来突破方向在硬件提升和模型架构演进,如Linear Attention架构。>阅读原文

Delphi靠AI数字分身获红杉1600万融资

Delphi团队获红杉1600万美元融资。产品源于创始人复活中风祖父的想法,上线后反响好,有人年入百万。它打破传统信息连接限制,未来想服务更多有智慧者,扩展其影响力。>阅读原文

奥特曼回应OpenAI硬件“抄袭门”

奥特曼回应OpenAI硬件“抄袭门”,称IYO投资没谈拢就诉讼,是“愚蠢的”。双方各执一词,邮件证据曝光。同时,OpenAI为ChatGPT设计新功能,与办公工具竞争。>阅读原文

郭奕彤:AI夺不走艺术灵魂

AI绘画风大,有人称人类要失业。郭奕彤用《合成图像家庭》回击,以碳笔勾勒形象让AI辅助,还为电视装系统定制影像,展现人类在艺术创作中不可替代。>阅读原文

LangChain:上下文工程在AI时代火了

机器之心报道:AI时代,随着应用复杂度增加,单纯依赖提示词无法满足需求,上下文工程应运而生,它能为LLM提供合适信息和工具,正成为AI工程师重要技能。>阅读原文

杨宝嵩:通义千问国际化与Scaling策略

阿里杨宝嵩称,通义千问从项目启动就重视多语言能力,面向全球市场。多语言推理难题待解,采用折中策略。他认为扩大模型规模和数据量仍重要,合成数据可延续Scaling Law,使用时要控制比例。>阅读原文

何恺明入职谷歌DeepMind!

何恺明入职谷歌DeepMind任杰出科学家,保留MIT终身副教授身份。他是CV领域传奇,成果众多、奖项无数,今年还不断有新研究,将为DeepMind的AGI发展助力。>阅读原文

沐曦冲刺“国产GPU第一股”

6月23日沐曦完成IPO辅导,准备A股上市。它专注高性能GPU,产品丰富且与大模型合作。此前有裁员传闻,已完成8轮融资。国产GPU厂商扎堆IPO,适配DeepSeek为国产芯片带来发展新思路。>阅读原文

2025 AI Cloud 100 China榜单发布

6月22日,靖亚资本等发布2025 AI Cloud 100 China榜单,34家新上榜。报告显示全球AI融资火热,中国AI Cloud市场资金流向特定赛道。预测未来AI应用升级、环境智能等五大趋势。>阅读原文

英伟达官宣RTX 5050,网友却不买账

英伟达推出RTX 5050桌面/笔记本GPU,7月上市,国内2099元起。其性能提升大,不过显存配置“新旧混搭”。网友觉得能耗高、性价比低,买不买还得看参数。>阅读原文

产品应用

谷歌发布免费开源AI编程神器Gemini CLI

谷歌发布开源AI编程神器Gemini CLI,个人免费,用Gemini 2.5 Pro模型,有大上下文窗口和高免费额度。它是全能助手,功能强大,与VS Code无缝切换,GitHub获9k+ Star。>阅读原文

TRAE:未来AI IDE要构建「AI工程师」

TRAE产品经理Leon:未来AI Coding是「AI+工具」模式,推出Solo模式。TRAE有代码补全等功能,月活超百万。虽AI能助力开发,但当前还需人在不同AI间切换,未来想打造统一工作空间。>阅读原文

出门问问发布999元智能体AI硬件TicNote

出门问问推出全球首款智能体AI硬件TicNote,支持录音转写等多种功能,方便携带。海外上市后国内版也已上线,售价999元起。出门问问坚持软硬结合,未来Shadow AI将拓展到更多硬件。>阅读原文

AI癌症筛查:半年挽救6条生命

作者分享用AI对抗癌症故事。阿里达摩院发布胃癌早筛模型GRAPE、胰腺癌早筛模型PANDA。作者体验PANDA筛查,医生业余投入项目,半年救6人,作者盼技术普及。>阅读原文

出门问问TicNote:AI录音神器体验揭秘

作者深度体验出门问问TicNote,它硬件轻薄,录音稳定,软件强大,支持多语种和方言,能自动总结、生成思维导图等。价格999元或1499元,适合职场人士、创作者、学生等。>阅读原文

高通Nuvia架构:自研CPU的新突破

高通收购Nuvia强化自研CPU技术,减少对ARM依赖,拓展多市场。Oryon CPU架构应用于Snapdragon X Elite,设计独特,缓存和执行单元出色,还具备安全功能,性能和能效有优势,不过面临Arm法律诉讼。>阅读原文

达摩院AI:提前半年揪出胃癌病灶

达摩院联合浙肿研发出胃癌AI模型DAMO GRAPE,“平扫CT+AI”模式可提前6个月发现胃癌,提升检出率。此前还有筛查胰腺癌的DAMO PANDA,未来将探索“一扫多查”。>阅读原文

AI让世界名画复活走秀,网友泪崩

国外ODDY工作室用AI打造《名作艺术秀》视频,让梵高、达利等艺术大师和其名作化身“T台模特”。视频不仅画面精美,还有“幕后故事”,实现艺术界“时空旅行”,网友被深深打动。>阅读原文

宝玉:解析AI播客原理与提示词玩法

宝玉介绍用豆包AI播客生成英文长文播客的便捷。解析其原理,涉及提示词工程与文字转语音技术。分享提示词写作优化过程及长文处理法,推荐豆包和Google NotebookLM。>阅读原文

英伟达B30与H20对比及国产替代解析

媒体报道英伟达为中国研发B30芯片。与H20比,B30单卡性能弱,但集群性价比高,适多场景。不过面临国产替代挑战,华为昇腾910B、寒武纪思元590各有优势,美技术封锁难阻中国芯片发展。>阅读原文

OceanBase:OB Cloud助力企业AI落地

大模型热潮下企业AI落地难,OceanBase的OB Cloud支持多类型向量数据,助数十家企业落地AI。它有多云原生优势,一体化架构处理数据,还提供工具降门槛,代表云数据库未来形态。>阅读原文

DataV - Note:揭秘数据分析报告评估体系

阿里部门推出DataV - Note平台,面临缺乏统一评估标准等问题。为此构建评估模型,确立目标,设计模型,建立纵向和横向评估标准,未来计划接入自动化和利用评估模型提升准确度。>阅读原文

字节上线「探饭」,AI推荐美食

字节跳动上线「探饭」AI产品,在抖音小程序可体验。能智能推荐餐厅,有AI评价总结、点菜等功能,餐厅信息全,支持团购外卖,还能餐厅PK。>阅读原文

推荐文章

Addy Osmani:程序员提示工程实战指南

Addy Osmani指出,提示工程是使用AI代码助手的必备技能。通过提供上下文、明确目标等原则,能构建有效提示。介绍调试、重构、实现新功能的提示模式,还提醒避免常见反模式,与AI迭代沟通。>阅读原文

A16z:揭秘AI产品突围与护城河构建

a16z认为当下是创业者好时机。AI公司突围,要重视产品化,应对高增长标准;开发成本降低将催生新应用;速度很关键;可通过成记录系统等方式建护城河。>阅读原文

专家共探大模型 Infra 工程师实战难题

华为 ZOMI 酱、蚂蚁马介悦、SGLang 尹良升探讨大模型工程。指出训练有稳定性等问题,推理有性能和运行时错误。版本迭代要平衡新旧特性,成本优化可从部署、缓存和资源利用入手,开源需做好社区运营。>阅读原文

AI Agents年中总结:复杂工作助手加速到来

前沿AI频道总结AI Agent年中趋势:未来是能自主处理复杂工作的助手。如Ambient Agents崛起,训练进入RL时代,工具需标准化,记忆功能待完善,转变正在加速。>阅读原文

杨一溪:AI时代增长要抓住用户需求

杨一溪:AI时代人们有解决问题的工具,却失定义‘真问题’的耐心。增长要从用户需求出发,如AI PPT针对宝妈群体;设定北极星指标要基于用户洞察;还分享数据分析、拉新、留存、召回等方法。>阅读原文

程路:AI引领能源行业变革

新奥能源程路:能源转型正处变革节点,AI是引领能源行业关键。泛能网构建数字能源运营系统,提出“能源领域的自动驾驶”概念,采用“选用训生”打造能碳产业大模型,为行业提供智能化方案。>阅读原文

开源动态

谷歌开源Gemini CLI,Github狂揽9000星

谷歌:凌晨开源AI Agent框架Gemini CLI,可调用多模型,集成MCP等功能。还集成超强编程助手,支持多语言。刚开源Github就超9000星,开发者可按需使用不同模式。>阅读原文

字节跳动开源项目助力AI Agent破痛点

字节跳动在原动力大会开源开发者日上,探讨开源为AI Agent带来的技术改变。嘉宾分享多个开源项目经验,如veRL提升强化学习能力、UI-TARS实现多模态与跨平台支持等,解决行业痛点。>阅读原文

Claudia:开源GUI拯救Claude Code体验

Claude Code命令行操作不便,开源的Claudia GUI工具解决了使用体验问题。它将操作转化为图形界面,支持会话管理、检查点回滚等,还具备多模态交互功能,跨平台可用。>阅读原文

Google:Gemini CLI开源免费,改写AI编程规则

Google发布开源免费的Gemini CLI,免费用户有高请求额度。它是功能完整的AI代理,能接入搜索等,还与Gemini Code Assist配合,或改变AI编程工具格局,开发者可抓紧薅羊毛。>阅读原文

361k+ star!免费编程资源宝藏项目来袭

开源君推荐GitHub项目free-programming-books,汇聚海量免费编程资源,涵盖主流技术与小众领域。资源更新快、结构清晰、支持多语言,使用便捷,是编程者的宝藏库。>阅读原文

港大黄超团队开源多模态RAG - Anything系统

香港大学黄超教授团队开源RAG - Anything系统,突破传统RAG技术文本局限,能处理多模态文档。它有创新架构和技术亮点,提供便捷部署方式与多场景应用模式,未来在推理和应用场景拓展上有潜力。>阅读原文

快手Keye-VL开源,视频理解能力爆表!

快手发布多模态大语言模型Kwai Keye-VL并开源。它基于Qwen3-8B,能深度融合多模态信息,在视频理解、视觉感知和推理上表现佳。通过多阶段训练提升能力,在多个评测中领先。>阅读原文

谷歌:首发具身离线模型,断网操控机器人

谷歌推出首个具身机器人本地离线运行的VLA模型Gemini Robotics On-Device,无网络也稳定。它基于Gemini 2.0,泛化性能强,谷歌还开源SDK,推动具身智能迈向实用。>阅读原文

Portkey:3行代码接入1600+ LLM的开源网关

Portkey AI Gateway:可3行代码接入超1600款模型,解决模型集成适配、成本、合规等痛点,功能强大,与同类相比优势明显,是生产阶段重要AI基础设施。>阅读原文

新型Python打包神器PyFuze登场!

PyFuze是刚开源的Python打包工具,基于cosmopolitan和uv构建,有三种打包模式,兼容GUI应用、跨平台运行。它比PyInstaller兼容性更好、打包更快,能让Python分发像Go一样简单。>阅读原文

谷歌开源免费编程Agent Gemini CLI

谷歌推出开源免费的Gemini CLI,提供业界最高免费限额。它能力丰富,可在命令行用自然语言指挥写代码、Debug,支持百万上下文、多模态和MCP,还给出安装及使用示例。>阅读原文

阿里达摩院DDColor:黑白图上色神器

阿里达摩院推出DDColor图像自动着色模型,基于双解码器设计,能实现黑白图转彩色图,兼容多类型图片。它色彩还原准确、丰富,推理快,成本低,适用于历史修复、影像美化等场景。>阅读原文

ScienceBoard:开启智能体科研评测新时代

香港大学等团队推出ScienceBoard评测环境,评估智能体科研能力。实验显示,当前最强模型在科研工作流中成功率低,将规划与执行解耦可提升成功率,未来应让智能体‘理解科学’。>阅读原文

算法论文

北大腾讯:RewardAnything突破奖励模型瓶颈

北大联合腾讯等机构提出RewardAnything,它采用创新技术,在RM - Bench和RABench评测中表现优异,能通过自然语言原则规避偏见,还能定制AI行为,降低了AI系统对齐的门槛。>阅读原文

北大团队:AI开始掌握人类创造力

北大团队研究指出,AI开始掌握人类创造力核心机制,通过IEI框架评估发现,GPT - 4等在创意理解上超普通人,但深层语义解读不及专家,框架优化能提升AI创意输出质量。>阅读原文

清华团队:让大模型从“浅对齐”迈向“深思熟虑”

清华团队:大模型“浅对齐”脆弱,提出STAIR框架,分三步提升模型安全与性能;还推出RealSafe - R1模型,在提升开源DeepSeek - R1安全性时保持推理能力。>阅读原文

LC - R1:让大模型推理精准“瘦身”

论文指出当前大模型推理冗长,存在‘无效思考’,浪费大量计算资源。提出解决原则和LC - R1方法,经测试,该方法能砍半推理长度,精度仅降约2%,揭示精准思考才是关键。>阅读原文

8B 模型靠 ParallelComp 超 GPT - 4o

香港大学博士生熊璟提出 ParallelComp 方法,通过并行分块、KV 缓存压缩和注意力偏差校准,让 8B 模型在超长文本任务性能接近甚至超 GPT - 4o 等,为 LLM 落地带来新范式。>阅读原文

OMEGA基准揭示LLM数学推理深层瓶颈

UC Berkeley团队提出OMEGA基准评估LLM数学泛化能力。实验发现复杂度让模型性能崩塌,存在计算回避,RL泛化有局限,指出LLM机械重复易、创新组合难,给出短长期改进方向。>阅读原文

    </p>
    

官网:www.AiReadingHub.com