AI Daily | AI日报：Replit怒批Lovable应用安全漏洞; AlphaEvolve破数学纪录; 斯坦福团队：CUDA - C内核干翻PyTorch

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。

2025-06-01 资讯日报

新闻资讯

Replit怒批Lovable应用安全漏洞

Replit 员工指 Lovable 未修复安全漏洞，多款应用高危。Lovable 推‘安全扫描’仍未解决根本问题。专家认为氛围编码应提升安全，用户创建应用易有漏洞，安全责任界定待明确。>阅读原文

AlphaEvolve破数学纪录

AlphaEvolve与人类数学家协作，一周两破18年数学纪录。AI如侦察兵扫描，人类深度优化。AlphaEvolve提升θ下界，Gerbicz再推进，展现“AI+人类”双引擎驱动科研新范式。>阅读原文

斯坦福团队：CUDA - C内核干翻PyTorch

斯坦福华人团队：用纯CUDA - C写的AI生成内核超越PyTorch，在多方面性能表现优异。采用新优化方法，多数最优内核在靠后轮次出现，优化策略集中，后续将继续探索。>阅读原文

Redis 之父：人类程序员胜过大模型

Redis 之父 Antirez：人类程序员比大模型出色，在修复 Redis 复杂 bug 中，人类能打破常规想解法，大模型较难。开发者看法不一，当下 AI 缺创造力，但改变了开发工作方式。>阅读原文

微软：企业增设AI岗，员工将成老板

微软陶然称中国企业对 AI 认知转变。报告显示 81%企业考虑增设 AI 岗。企业落地分三阶段，智能体成“数字员工”，员工将成其老板，但要应对员工素养和实效转化难题。>阅读原文

陶哲轩重写经典教材用Lean

陶哲轩：为《Analysis I》创建 Lean 配套项目，将内容转成 Lean 版，部分依托 Mathlib。不提供练习官方答案，欢迎自由答题。该项目可作辅助教材和入门指南。>阅读原文

推理模型或一年内撞算力墙

Epoch AI等认为推理模型最多一年撞上算力天花板。o3靠10倍算力碾压o1，推理算力与模型能力挂钩，但数据和隐藏成本或限制发展，不过算力增长仍关键。>阅读原文

红杉中国：推Agent测评工具Xbench

红杉中国团队：提出AI基准测试工具Xbench，采用双轨评估体系和长青评估机制，重点量化AI真实场景效用价值。首期测试中，不同模型在招聘和营销领域表现差异大。>阅读原文

产品应用

Claude团队推UI设计新工具

Claude Engineer团队：Magic Path是新的AI UI设计工具，AI先行生成组件和代码，生成的UI可用，能页面串联，虽有不足但免费且潜力大。>阅读原文

华为盘古Embedded实现快慢思考合一

华为盘古团队：为解决大模型推理难题，推出盘古Embedded模型，基于昇腾NPU，集成快慢思考模式，通过两阶段训练框架，实现推理效率与精度协同提升，为语言模型开发提供新路径。>阅读原文

开源动态

Sakana AI发布可进化AI Agent

Sakana AI推出DGM，能重写代码自我进化。在测试中性能提升显著，能力具通用性，不过有性能瓶颈等局限。团队开源代码，还提出规模化扩展等未来研究方向。>阅读原文

字节跳动开源Dolphin文档模型

字节跳动：开源文档解析模型Dolphin。它用两阶段法解析，功能多、场景广，技术架构强，训练样本超3000万，安装推理易，比同类更有竞争力，为文档处理带来新可能。>阅读原文

Hugging Face 开源亲民机器人

Hugging Face：发布 HopeJR 和 Reachy Mini 两款开源人形机器人，价格亲民。虽 HopeJR 外观遭吐槽，但它们推动构建开源机器人生态，让机器人技术更开放。>阅读原文

Claude团队开源LLM可视化工具

Claude团队：开源“电路追踪”工具，生成归因图解读大模型“脑回路”。通过干预实验验证节点功能分工，在多语言电路等示例中开展研究，助力理解模型决策逻辑。>阅读原文

Dedoc：统一文档格式开源库

Dedoc：开放通用文档解析库，支持多格式，能自动提取内容与结构。可处理扫描文档，用Python实现，有多种优势，可用于信息分析等系统，提供多种安装方式。>阅读原文

DeeplxFile：Excel翻译开源神器

痕小子推荐开源神器DeeplxFile，免费、不限文件大小，能精准翻译Excel公式，还支持PDF转Word，提供两种模式，跨平台且操作简单，重塑文档处理流程。>阅读原文

微软开源Edit编辑器爆火

开源君：微软新开源的Edit编辑器，轻量高效，功能丰富，兼容Windows生态，对新手和老用户都友好，降低命令行编辑门槛，值得Windows用户一试。>阅读原文

Meta 开源高性能 Pyrefly

Meta：开发 Pyrefly 替代 Pyre，用 Rust 编写以实现高性能，每秒能查 180 万行代码，还能推断未注解代码类型，计划今夏进 beta 阶段。>阅读原文

360开源FineHARD图文数据集

360冷大炜博士团队：开源FineHARD高质量图文对齐数据集，含大量图像、边界框和负样本，可提升模型图文对齐能力，能用于多模态大模型训练、具身智能等领域。>阅读原文

小红书、西交大尝试实现o3技术

小红书、西安交大：尝试实现OpenAI未公开的o3「用图思考」技术，构建DeepEyes模型。它无需复杂工作流和大量监督数据，在多任务表现佳，为多模态智能探索提供新路径。>阅读原文

算法论文

NUS：OmniConsistency复现GPT-4o能力

NUS ShowLab 推出 OmniConsistency：用 2600 对数据、约 500 小时 GPU 算力，解决开源与商业 API 图像风格化一致性差距，成本低、效果好，还兼容主流插件。>阅读原文

Tri Dao团队推新注意力机制

普林斯顿大学Tri Dao团队：提出GTA和GLA注意力机制，减少KV缓存用量，解码速度显著提升，是GQA和MLA的有效替代品，迈向推理“理想”架构第一步。>阅读原文

新研究：跳过 SFT，RL 推理上限更高

加州大学等团队研究发现，当前常用的「SFT+RL」训练范式中，SFT 会诱发「伪推理路径」，阻碍推理进步。直接进行 RL 训练，模型多模态推理上限更高，该团队训练的模型刷新了 Open LMM 推理榜单纪录。>阅读原文

哈工大：让AI领略汉字之美

哈工大团队：用传感器捕捉书写实现汉字输入识别，独创中文字形编码CGE让AI从‘识字’到‘解字’，革新中文人机交互，推动汉字文化传承。>阅读原文

港理工团队揭秘大模型遗忘规律

港理工等团队研究大模型遗忘：真正遗忘是结构抹除，持续遗忘风险高，GA/RLabel破坏性强；结构漂移才是不可逆遗忘，遗忘或有隐式增强效果，诊断工具助可控遗忘。>阅读原文

Meta等：新模型解决图像编辑难题

Meta等团队研究者针对few - shot图像编辑提出新自回归模型InstaManip，创新分组自注意力机制，引入关系正则化。实验显示，该模型在多指标超旧模型，增加样例图片数量和多样性可提升性能。>阅读原文

UC伯克利：LLM靠自信学会推理

UC伯克利华人团队：LLM可仅靠自身「自信」学会复杂推理。他们提出RLIF新范式，用INTUITOR方法让模型以自身置信度为奖励，在数学、编程等任务性能提升，还防止奖励滥用。>阅读原文

RM - R1：重塑奖励模型推理价值

伊利诺伊大学团队：RM - R1 将奖励建模变为推理任务，引入 CoR 机制。两阶段训练后，在多基准测试超大规模模型，证明推理能力关键，为奖励模型研究指明新方向。>阅读原文

AI记忆系统获统一框架

香港中文大学等团队：发布AI记忆机制综述，构建统一框架，提出六种记忆操作，探讨关键主题，对比人类与AI记忆差异，指出未来AI记忆系统要突破瓶颈，实现认知跃迁。>阅读原文

哈工大GRGS实现3D重光照

哈工大：提出GRGS框架用于多光照3D人体渲染，采用前馈监督策略，支持可编辑光照，结合物理与神经网络合成逼真效果，不过处理透明材质和纤薄结构有局限。>阅读原文

新方法造出「视频世界模型」

斯坦福等团队：用状态空间模型实现长期记忆，结合逐块扫描方案与帧局部注意力机制，新「视频世界模型」在训练和推理表现上优于传统方法，能高效处理长上下文。>阅读原文

Tool - Star赋能大模型多工具推理

研究团队：提出Tool - Star框架，解决大模型多工具调用问题。该框架让模型在多工具辅助下完成推理，在多任务表现佳，未来可向多模态和多工具扩展。>阅读原文

    </p>

官网：www.AiReadingHub.com