AI Daily | AI日报：西工大徐韬：昇腾赋能AI创新; ACM公布博士论文奖成果; 谷歌：Gemini新版发布就被越狱

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。

2025-06-06 资讯日报

新闻资讯

西工大徐韬：昇腾赋能AI创新

西工大徐韬团队与昇腾平台合作，从算子研究开启硬仗，开发出抑郁症初筛等系统。昇腾还用于教学，提升学生实践能力。徐韬希望更多人参与国产AI源头创新。>阅读原文

ACM公布博士论文奖成果

ACM公布2024博士论文奖：Ashish Sharma论文聚焦人机协作支持心理健康；Alexander Kelley研究伪随机分布揭示计算局限；Sewon Min探讨大模型数据利用及发展方向。>阅读原文

谷歌：Gemini新版发布就被越狱

谷歌更新Gemini 2.5 Pro新版本（0605），在代码、推理等任务表现出色，超o3，Elo评分提升。不过发布两小时就被越狱，部分指标还不如早期版本，令人意外。>阅读原文

AI改写《死海古卷》成书时间

科学家用AI模型Enoch重构《死海古卷》时间线，发现许多古卷成书更早。首创AI定年法超越传统古文字学，还可能揭示圣经作者线索，研究结果挑战了一些历史假设。>阅读原文

CVPR 2025探讨视频生成潜力

CVPR 2025 Tutorial将探讨视频生成相关问题，如能否成世界模型桥梁等。可灵、Sora等模型发展显示，视频生成或成感知-推理一体化世界模型入口，为相关研究提供方向。>阅读原文

微软：GUI Agent新范式吊打大模型

微软发布GUI - Actor新范式，解决传统Agent定位、空间感和兼容性问题。小参数少数据，7B吊打72B模型，省数据算力，未来可用于手机助手、办公、无障碍技术等。>阅读原文

Anthropic：人才吸引力超OpenAI

风险投资公司SignalFire报告称，Anthropic顶尖AI人才留存率达80%，吸引OpenAI等公司人才能力强，秘诀是精准挖角、文化独特、产品受青睐，AI人才争夺白热化。>阅读原文

Karpathy：传统软件将在AI时代‘灭绝’

Andrej Karpathy：不开放、不脚本化的传统软件在AI时代‘活不下去’，像Adobe全家桶等高风险。未来赢家是‘天生文本化、可脚本化’产品，软件‘可AI协作性’是生死线。>阅读原文

OpenAI：关注AI对人类情感影响

OpenAI的Joanne Jang：与其纠结AI是否有意识，不如关注其对人类情感福祉的影响。要平衡模型亲和力与不暗示内在生命，未来会扩展评估、深化研究并公开成果。>阅读原文

具身智能公司估值与投资现状

投资人朱红称23年后成立的具身智能创业公司第一梯队估值25 - 30亿。市场分野，硬件守门员是宇树，软件未知。VC认为应回归商业本质，投资人担心港股上市规则。>阅读原文

池建强：五年内家用机器人将成熟

作者池建强期待家用机器人突破，认为具身智能已具备落地条件。特斯拉Optimus可视频学技能，1X今年将售产品。他预计五年内人形机器人成熟，未来可接管家务。>阅读原文

Duolingo“AI优先”引用户不满

Duolingo CEO Luis von Ahn发“AI优先”全员信，引发网友愤怒。此前公司弃志愿者体系改用AI生成内容，小语种问题严重。公司用搞笑视频公关未奏效，股价未波动，但账号评论仍负面居多。>阅读原文

寒武纪49.8亿定增申请受理

寒武纪49.8亿元定增申请获受理，是上市五年最大融资。2024年业绩增长，董事长陈天石称2025年加强研发，定增资金用于芯片和软件平台项目，提升竞争力。>阅读原文

可逆芯片或降AI能耗10倍

OpenAI CEO萨姆·奥特曼：AI成本终将等于能源成本。可逆计算可避免删除数据减少热量，有望降AI能耗10倍，Vaire Computing正开发商用芯片，或成延续计算进步关键。>阅读原文

景鲲：AGI 将至，AI 影响巨大

Genspark 创始人景鲲：AI 将影响 99% 人的工作，白领或消失，应届毕业生可能毕业即失业。基于使用近千种 AI 产品的经验，他认为 AGI 即将到来，建议大家与 AI 共存并学习。>阅读原文

DeepMind CEO：AI重塑就业格局

DeepMind CEO Hassabis：AI会引发职业洗牌，虽可能淘汰重复性工作，但会创造新岗位。他强调学STEM、玩AI工具，也提醒AI缺监管，未来或让人类不那么自私。>阅读原文

Karpathy炮轰复杂UI应用未来

Karpathy：只有复杂UI无文本交互的应用将淘汰，Adobe等首当其冲；批判大模型编程‘重生成轻判别’，指出非专业人士对编程有认知偏差，自己正研发减验证负担的工作流。>阅读原文

华为老兵创业芯片获亿元投资

为旌科技创始人郑军：中国汽车芯片或仅三四家存活；轻量化大模型是趋势；御行VS919芯片可降低成本；芯片公司应专注底层，靠多产品线支撑。>阅读原文

Manus 推文生视频叫板 OpenAI

Manus AI 推出文本转视频服务，对标 OpenAI Sora 等竞品，计划面向所有用户开放。此前推出 AI Agent 工具崭露头角，母公司获投资，系统能自主完成复杂任务，无需人类持续干预。>阅读原文

产品应用

Cursor 1.0更新，功能大升级

Aitrainee：Cursor 1.0正式版更新，带来BugBot代码审查、后台Agent开放等功能，提升开发效率，但新设置界面待优化，远程开发mcp配置有麻烦。>阅读原文

华为：一张卡干俩活突破算力瓶颈

新智元报道，RL后训练成大模型性能突破关键，但算力浪费、集群效率低。华为团队用RL Fusion和StaleSync两大黑科技破局，实现训推共卡，资源利用率翻倍，训练速度提50%。>阅读原文

Cursor 1.0发布，砸程序员饭碗

Cursor：1.0版本硬核发布！集成主流技术，有BugBot审查代码、Background Agent开放等功能，支持Jupyter Notebook，聊天界面优化，程序员生产力或大幅提升。>阅读原文

Cursor 1.0：AI编程新利器

Cursor 1.0发布：BugBot揪漏洞，后台智能体开放，集成Jupyter Notebook，还有记忆功能，高效编码新体验！>阅读原文

用AI 5分钟打造个人网站

Aitrainee：别用简历，用Bolt、Lovable、Cursor 5分钟就能打造吸睛个人网站。按四步法则操作，提示词越精细效果越好，还给出完整模板，分享打造思路和内容方向。>阅读原文

Cursor 1.0上线，功能大升级

Cursor 1.0：自动代码审查、后台智能体等功能上线，还集成Jupyter Notebook、引入记忆系统。在对手被封杀时升级，能否领先待用户检验。>阅读原文

Luma AI：小视频秒变特效大片

Luma AI推出Modify Video玩法，可将抽象小视频变特效大片，保留原视频精髓，还能精准控制角色、场景等。可进行视频动捕、风格迁移等操作，性能超同行Runway。>阅读原文

SQL实现多模态AI检索

当下AI检索系统难题多，传统搜索也难满足需求。本文给出破局思路，基于PolarDB创新融合AI引擎，用标准SQL调用多模态AI服务，无需迁移数据，还介绍了部署方法和资源清理。>阅读原文

Cursor 1.0.0版功能大更新

花叔：2025年6月5日Cursor推出1.0.0版，功能更新幅度大，如上线Bugbot、开放后台代理等。虽能提升开发效率，但部分功能需付费，且产品复杂度增加，对新手不友好。>阅读原文

开源动态

清华蚂蚁开源全异步RL破SOTA

清华蚂蚁联合：开源的AReaL-boba²实现全异步强化学习，解耦流程提升GPU利用率，14B模型性能逼近235B，还解决了异步训练算法挑战，代码等全开源。>阅读原文

LEXam评测：大模型法律推理待提升

LEXam团队：发布多语言法律推理基准数据集LEXam，现有大模型应对法律推理任务困难，专门推理型模型表现更好，模型性能受语言、法律领域等因素影响，多选题测试结果需谨慎处理。>阅读原文

Qwen3开源文本表征新系列

Qwen3团队：深夜开源Embedding系列文本表征模型，有三种尺寸，8B版性能超商业API，训练有新方法，还发布排序模型，常与Embedding模型结合用。>阅读原文

Google开源全栈Deep Research

谷歌：开源Deep Research全栈应用，前端用React等，后端用LangGraph，搭配Google Gemini等，还给出Agent执行流程，代码可在GitHub查看。>阅读原文

12306-mcp项目解析

司木源：GitHub上的12306 - mcp项目基于MCP协议，可让大模型查询12306购票信息。介绍其功能、架构、原理及配置流程，给出项目地址，提醒仅作学习参考。>阅读原文

腾讯交大：难题让模型证明能力飙升

腾讯与上海交大团队推出DeepTheorem，含12.1万道IMO级难度数学题。“特训”后模型定理证明性能大涨，7B模型比肩或超现有开源和商业模型，为AI数学推理开辟新思路。>阅读原文

谷歌AI应用离线运行超火

开源君：Google的AI Edge Gallery超火，已获9.1K star。它能让手机离线运行AI，功能强大，安装简单。虽处Alpha阶段有不足，但让手机成AI工作站可期。>阅读原文

agentic-doc：复杂文档数据提取神器

LandingAI的agentic-doc库封装文档提取API，简化设置、自动处理大文件与错误。能并行解析多文档，可拆分合并1000+页PDF，还能保存定位、可视化结果，配置灵活。>阅读原文

上海AI实验室造出「通才」大脑

上海AI实验室：提出通用具身智能大脑框架VeBrain，集成多能力。它统一任务范式、有适配器和优质数据集，性能超其他框架，在多模态、空间推理和真机控制上表现佳。>阅读原文

LandingAI开源文档处理神器

LandingAI：开源Python库Agentic - Doc，专为复杂文档提取结构化数据。支持多格式，能自动分割并行处理100 + 页PDF，精准提取内容，输出JSON + Markdown，提升文档处理效率。>阅读原文

阿里开源Qwen3模型霸榜

阿里：凌晨开源Qwen3系列两款新模型，在多语言文本表征和排序任务中表现优异，采用创新架构、训练方法与数据合成策略，满足不同场景需求。>阅读原文

Mila团队开源Ctrl - Crash模拟事故

Mila团队：为解决车辆碰撞真实场景生成难题，提出Ctrl - Crash可控碰撞视频生成模型，支持反事实场景生成，虽在指标上达SOTA水平，但也有初始条件冲突等局限。>阅读原文

Qwen3-Embedding系列模型登场

Qwen团队：今日发布Qwen3-Embedding系列模型，在文本表征等任务表现出色，已开源。有泛化性好、架构灵活等特点，后续将提升训练效率、拓展多模态体系。>阅读原文

Meta方案加速Llama 4推理

Meta提出MetaShuffling方案加速Llama 4 MoE推理。通过避免Padding、激进kernel优化等提升性能，还展示不同并行化设计及性能测试，开源计算kernel，望社区提升服务Llama 4效率。>阅读原文

算法论文

华为 DeepDiver 7B 媲美 671B 模型

华为诺亚方舟实验室：提出 Pangu DeepDiver 模型，通过 Search Intensity Scaling 实现新交互范式。用真实互联网数据训练，7B 模型媲美 671B DeepSeek - R1，多方面表现优异，也指出后续研究方向。>阅读原文

Qwen&清华：20%token训练大模型更佳

Qwen与清华团队：大模型强化学习用20%高熵token，效果超全量token，还发现RLVR是微调，高熵token或与泛化能力有关，clip - higher方法更优。>阅读原文

浙大&腾讯：大模型行为调控新方法

浙大&腾讯团队：提出STA方法，深入模型内部干预关键神经元，抑制有害行为且不损通用性能，在多模型实验效果好，还将部分方法开源推动安全可控大模型探索。>阅读原文

浙大等团队推出前馈3DGS压缩神器

ZIP Lab和Monash团队：现有前馈3DGS模型存在信息过载问题，引入信息瓶颈原理打造的ZPressor模块，能将多视图输入高效压缩，减少推理时间和显存占用，提升模型性能。>阅读原文

新方法遏制大模型强化学习熵塌缩

上海人工智能实验室等机构研究者：大模型强化学习中策略熵塌缩致性能停滞，提出 Clip - Cov 与 KL - Cov 遏制熵塌缩，在 AIME24/25 等数据集提升性能，突破强化学习需破熵最小化局限。>阅读原文

阿里推出图像评估智能体CIGEval

阿里国际AI团队：推出CIGEval图像评估智能体框架，用工具链式推理和任务拆解提升评估效果，经实验验证表现优异，还能迁移至轻量模型，有望推动多模态生成任务发展。>阅读原文

趣丸：Playmate精准控人脸表情

趣丸科技：提出肖像驱动框架Playmate，结合音频和控制条件生成肖像视频，可精准控制表情姿态。成果被ICML 2025收录，在多指标上表现优，未来有望拓展应用。>阅读原文

Video - Bench实现视频精准评估

上海交大等团队：推出Video - Bench评估框架，构建双维度体系，用链式查询和少样本评分技术，实现与人类判断高相关，为视频生成模型优化助力，还揭示了提升自动评估效果的潜力。>阅读原文

其他

1. 子茹：RAG 技巧与代码剖析

子茹：本文教你用 Python 基础库构建 RAG 系统，还介绍多种优化技巧。如上下文增强检索提供更完整信息，添加上下文块标题提高检索相关性，查询改写等技术提升检索效果，反馈机制让系统越用越准。>阅读原文

    </p>

官网：www.AiReadingHub.com