AI Daily | AI日报:西工大徐韬:昇腾赋能AI创新; ACM公布博士论文奖成果; 谷歌:Gemini新版发布就被越狱

143 阅读4分钟

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。

2025-06-06 资讯日报

新闻资讯

西工大徐韬:昇腾赋能AI创新

西工大徐韬团队与昇腾平台合作,从算子研究开启硬仗,开发出抑郁症初筛等系统。昇腾还用于教学,提升学生实践能力。徐韬希望更多人参与国产AI源头创新。>阅读原文

ACM公布博士论文奖成果

ACM公布2024博士论文奖:Ashish Sharma论文聚焦人机协作支持心理健康;Alexander Kelley研究伪随机分布揭示计算局限;Sewon Min探讨大模型数据利用及发展方向。>阅读原文

谷歌:Gemini新版发布就被越狱

谷歌更新Gemini 2.5 Pro新版本(0605),在代码、推理等任务表现出色,超o3,Elo评分提升。不过发布两小时就被越狱,部分指标还不如早期版本,令人意外。>阅读原文

AI改写《死海古卷》成书时间

科学家用AI模型Enoch重构《死海古卷》时间线,发现许多古卷成书更早。首创AI定年法超越传统古文字学,还可能揭示圣经作者线索,研究结果挑战了一些历史假设。>阅读原文

CVPR 2025探讨视频生成潜力

CVPR 2025 Tutorial将探讨视频生成相关问题,如能否成世界模型桥梁等。可灵、Sora等模型发展显示,视频生成或成感知-推理一体化世界模型入口,为相关研究提供方向。>阅读原文

微软:GUI Agent新范式吊打大模型

微软发布GUI - Actor新范式,解决传统Agent定位、空间感和兼容性问题。小参数少数据,7B吊打72B模型,省数据算力,未来可用于手机助手、办公、无障碍技术等。>阅读原文

Anthropic:人才吸引力超OpenAI

风险投资公司SignalFire报告称,Anthropic顶尖AI人才留存率达80%,吸引OpenAI等公司人才能力强,秘诀是精准挖角、文化独特、产品受青睐,AI人才争夺白热化。>阅读原文

Karpathy:传统软件将在AI时代‘灭绝’

Andrej Karpathy:不开放、不脚本化的传统软件在AI时代‘活不下去’,像Adobe全家桶等高风险。未来赢家是‘天生文本化、可脚本化’产品,软件‘可AI协作性’是生死线。>阅读原文

OpenAI:关注AI对人类情感影响

OpenAI的Joanne Jang:与其纠结AI是否有意识,不如关注其对人类情感福祉的影响。要平衡模型亲和力与不暗示内在生命,未来会扩展评估、深化研究并公开成果。>阅读原文

具身智能公司估值与投资现状

投资人朱红称23年后成立的具身智能创业公司第一梯队估值25 - 30亿。市场分野,硬件守门员是宇树,软件未知。VC认为应回归商业本质,投资人担心港股上市规则。>阅读原文

池建强:五年内家用机器人将成熟

作者池建强期待家用机器人突破,认为具身智能已具备落地条件。特斯拉Optimus可视频学技能,1X今年将售产品。他预计五年内人形机器人成熟,未来可接管家务。>阅读原文

Duolingo“AI优先”引用户不满

Duolingo CEO Luis von Ahn发“AI优先”全员信,引发网友愤怒。此前公司弃志愿者体系改用AI生成内容,小语种问题严重。公司用搞笑视频公关未奏效,股价未波动,但账号评论仍负面居多。>阅读原文

寒武纪49.8亿定增申请受理

寒武纪49.8亿元定增申请获受理,是上市五年最大融资。2024年业绩增长,董事长陈天石称2025年加强研发,定增资金用于芯片和软件平台项目,提升竞争力。>阅读原文

可逆芯片或降AI能耗10倍

OpenAI CEO萨姆·奥特曼:AI成本终将等于能源成本。可逆计算可避免删除数据减少热量,有望降AI能耗10倍,Vaire Computing正开发商用芯片,或成延续计算进步关键。>阅读原文

景鲲:AGI 将至,AI 影响巨大

Genspark 创始人景鲲:AI 将影响 99% 人的工作,白领或消失,应届毕业生可能毕业即失业。基于使用近千种 AI 产品的经验,他认为 AGI 即将到来,建议大家与 AI 共存并学习。>阅读原文

DeepMind CEO:AI重塑就业格局

DeepMind CEO Hassabis:AI会引发职业洗牌,虽可能淘汰重复性工作,但会创造新岗位。他强调学STEM、玩AI工具,也提醒AI缺监管,未来或让人类不那么自私。>阅读原文

Karpathy炮轰复杂UI应用未来

Karpathy:只有复杂UI无文本交互的应用将淘汰,Adobe等首当其冲;批判大模型编程‘重生成轻判别’,指出非专业人士对编程有认知偏差,自己正研发减验证负担的工作流。>阅读原文

华为老兵创业芯片获亿元投资

为旌科技创始人郑军:中国汽车芯片或仅三四家存活;轻量化大模型是趋势;御行VS919芯片可降低成本;芯片公司应专注底层,靠多产品线支撑。>阅读原文

Manus 推文生视频叫板 OpenAI

Manus AI 推出文本转视频服务,对标 OpenAI Sora 等竞品,计划面向所有用户开放。此前推出 AI Agent 工具崭露头角,母公司获投资,系统能自主完成复杂任务,无需人类持续干预。>阅读原文

产品应用

Cursor 1.0更新,功能大升级

Aitrainee:Cursor 1.0正式版更新,带来BugBot代码审查、后台Agent开放等功能,提升开发效率,但新设置界面待优化,远程开发mcp配置有麻烦。>阅读原文

华为:一张卡干俩活突破算力瓶颈

新智元报道,RL后训练成大模型性能突破关键,但算力浪费、集群效率低。华为团队用RL Fusion和StaleSync两大黑科技破局,实现训推共卡,资源利用率翻倍,训练速度提50%。>阅读原文

Cursor 1.0发布,砸程序员饭碗

Cursor:1.0版本硬核发布!集成主流技术,有BugBot审查代码、Background Agent开放等功能,支持Jupyter Notebook,聊天界面优化,程序员生产力或大幅提升。>阅读原文

Cursor 1.0:AI编程新利器

Cursor 1.0发布:BugBot揪漏洞,后台智能体开放,集成Jupyter Notebook,还有记忆功能,高效编码新体验!>阅读原文

用AI 5分钟打造个人网站

Aitrainee:别用简历,用Bolt、Lovable、Cursor 5分钟就能打造吸睛个人网站。按四步法则操作,提示词越精细效果越好,还给出完整模板,分享打造思路和内容方向。>阅读原文

Cursor 1.0上线,功能大升级

Cursor 1.0:自动代码审查、后台智能体等功能上线,还集成Jupyter Notebook、引入记忆系统。在对手被封杀时升级,能否领先待用户检验。>阅读原文

Luma AI:小视频秒变特效大片

Luma AI推出Modify Video玩法,可将抽象小视频变特效大片,保留原视频精髓,还能精准控制角色、场景等。可进行视频动捕、风格迁移等操作,性能超同行Runway。>阅读原文

SQL实现多模态AI检索

当下AI检索系统难题多,传统搜索也难满足需求。本文给出破局思路,基于PolarDB创新融合AI引擎,用标准SQL调用多模态AI服务,无需迁移数据,还介绍了部署方法和资源清理。>阅读原文

Cursor 1.0.0版功能大更新

花叔:2025年6月5日Cursor推出1.0.0版,功能更新幅度大,如上线Bugbot、开放后台代理等。虽能提升开发效率,但部分功能需付费,且产品复杂度增加,对新手不友好。>阅读原文

推荐文章

RL+Agent重塑AI编程世界

作者:AI编程赛道竞争激烈。RL训练面临奖励信号稀疏等难题;AI编程体验进化涉及记忆、长上下文、工具演进;cursor 1.0有新功能;未来AI编程工具将成开发者助手。>阅读原文

工程师:AI 编程体验与开发教训

大厂工程师:3 个月用 AI 写 5 万行代码,验证 Vibe Coding 可行。Coding Agent 关键技术是模型、上下文和工具,结合 MCP 是新自动化方式。开发 Agent 别过度植入人类经验,否则锁死产品上限。>阅读原文

AI Agent曝光0day漏洞“生产线”

腾讯悟空团队:AI Agent通过多智能体协作系统打造0day漏洞“生产线”。经测试,其在复杂代码和大型项目中表现超传统工具,提升了漏洞识别效率与准确性,推动网络安全智能化。>阅读原文

专家共探企业数据智能应用

专家们认为,企业数据构建要重质量、适配场景;DeepResearch 是 RAG 向多阶段推理的质变;ChatBI 落地要关注底层数据适配;数据智能落地需业务与技术融合,组织协同很关键。>阅读原文

AI眼镜百镜大战,阿里高通成赢家

量子位智库报告显示,AI眼镜「百镜大战」开启,通义千问、DeepSeek等成大模型赢家,高通骁龙AR1受厂商青睐。AI拍摄眼镜出货领先,未来AI眼镜或重塑人机交互。>阅读原文

开源动态

清华蚂蚁开源全异步RL破SOTA

清华蚂蚁联合:开源的AReaL-boba²实现全异步强化学习,解耦流程提升GPU利用率,14B模型性能逼近235B,还解决了异步训练算法挑战,代码等全开源。>阅读原文

LEXam评测:大模型法律推理待提升

LEXam团队:发布多语言法律推理基准数据集LEXam,现有大模型应对法律推理任务困难,专门推理型模型表现更好,模型性能受语言、法律领域等因素影响,多选题测试结果需谨慎处理。>阅读原文

Qwen3开源文本表征新系列

Qwen3团队:深夜开源Embedding系列文本表征模型,有三种尺寸,8B版性能超商业API,训练有新方法,还发布排序模型,常与Embedding模型结合用。>阅读原文

Google开源全栈Deep Research

谷歌:开源Deep Research全栈应用,前端用React等,后端用LangGraph,搭配Google Gemini等,还给出Agent执行流程,代码可在GitHub查看。>阅读原文

12306-mcp项目解析

司木源:GitHub上的12306 - mcp项目基于MCP协议,可让大模型查询12306购票信息。介绍其功能、架构、原理及配置流程,给出项目地址,提醒仅作学习参考。>阅读原文

腾讯交大:难题让模型证明能力飙升

腾讯与上海交大团队推出DeepTheorem,含12.1万道IMO级难度数学题。“特训”后模型定理证明性能大涨,7B模型比肩或超现有开源和商业模型,为AI数学推理开辟新思路。>阅读原文

谷歌AI应用离线运行超火

开源君:Google的AI Edge Gallery超火,已获9.1K star。它能让手机离线运行AI,功能强大,安装简单。虽处Alpha阶段有不足,但让手机成AI工作站可期。>阅读原文

agentic-doc:复杂文档数据提取神器

LandingAI的agentic-doc库封装文档提取API,简化设置、自动处理大文件与错误。能并行解析多文档,可拆分合并1000+页PDF,还能保存定位、可视化结果,配置灵活。>阅读原文

上海AI实验室造出「通才」大脑

上海AI实验室:提出通用具身智能大脑框架VeBrain,集成多能力。它统一任务范式、有适配器和优质数据集,性能超其他框架,在多模态、空间推理和真机控制上表现佳。>阅读原文

LandingAI开源文档处理神器

LandingAI:开源Python库Agentic - Doc,专为复杂文档提取结构化数据。支持多格式,能自动分割并行处理100 + 页PDF,精准提取内容,输出JSON + Markdown,提升文档处理效率。>阅读原文

阿里开源Qwen3模型霸榜

阿里:凌晨开源Qwen3系列两款新模型,在多语言文本表征和排序任务中表现优异,采用创新架构、训练方法与数据合成策略,满足不同场景需求。>阅读原文

Mila团队开源Ctrl - Crash模拟事故

Mila团队:为解决车辆碰撞真实场景生成难题,提出Ctrl - Crash可控碰撞视频生成模型,支持反事实场景生成,虽在指标上达SOTA水平,但也有初始条件冲突等局限。>阅读原文

Qwen3-Embedding系列模型登场

Qwen团队:今日发布Qwen3-Embedding系列模型,在文本表征等任务表现出色,已开源。有泛化性好、架构灵活等特点,后续将提升训练效率、拓展多模态体系。>阅读原文

Meta方案加速Llama 4推理

Meta提出MetaShuffling方案加速Llama 4 MoE推理。通过避免Padding、激进kernel优化等提升性能,还展示不同并行化设计及性能测试,开源计算kernel,望社区提升服务Llama 4效率。>阅读原文

算法论文

华为 DeepDiver 7B 媲美 671B 模型

华为诺亚方舟实验室:提出 Pangu DeepDiver 模型,通过 Search Intensity Scaling 实现新交互范式。用真实互联网数据训练,7B 模型媲美 671B DeepSeek - R1,多方面表现优异,也指出后续研究方向。>阅读原文

Qwen&清华:20%token训练大模型更佳

Qwen与清华团队:大模型强化学习用20%高熵token,效果超全量token,还发现RLVR是微调,高熵token或与泛化能力有关,clip - higher方法更优。>阅读原文

浙大&腾讯:大模型行为调控新方法

浙大&腾讯团队:提出STA方法,深入模型内部干预关键神经元,抑制有害行为且不损通用性能,在多模型实验效果好,还将部分方法开源推动安全可控大模型探索。>阅读原文

浙大等团队推出前馈3DGS压缩神器

ZIP Lab和Monash团队:现有前馈3DGS模型存在信息过载问题,引入信息瓶颈原理打造的ZPressor模块,能将多视图输入高效压缩,减少推理时间和显存占用,提升模型性能。>阅读原文

新方法遏制大模型强化学习熵塌缩

上海人工智能实验室等机构研究者:大模型强化学习中策略熵塌缩致性能停滞,提出 Clip - Cov 与 KL - Cov 遏制熵塌缩,在 AIME24/25 等数据集提升性能,突破强化学习需破熵最小化局限。>阅读原文

阿里推出图像评估智能体CIGEval

阿里国际AI团队:推出CIGEval图像评估智能体框架,用工具链式推理和任务拆解提升评估效果,经实验验证表现优异,还能迁移至轻量模型,有望推动多模态生成任务发展。>阅读原文

趣丸:Playmate精准控人脸表情

趣丸科技:提出肖像驱动框架Playmate,结合音频和控制条件生成肖像视频,可精准控制表情姿态。成果被ICML 2025收录,在多指标上表现优,未来有望拓展应用。>阅读原文

Video - Bench实现视频精准评估

上海交大等团队:推出Video - Bench评估框架,构建双维度体系,用链式查询和少样本评分技术,实现与人类判断高相关,为视频生成模型优化助力,还揭示了提升自动评估效果的潜力。>阅读原文

其他

1. 子茹:RAG 技巧与代码剖析

子茹:本文教你用 Python 基础库构建 RAG 系统,还介绍多种优化技巧。如上下文增强检索提供更完整信息,添加上下文块标题提高检索相关性,查询改写等技术提升检索效果,反馈机制让系统越用越准。>阅读原文

    </p>
    

官网:www.AiReadingHub.com