AI Daily | AI日报:Replit怒批Lovable应用安全漏洞; AlphaEvolve破数学纪录; 斯坦福团队:CUDA - C内核干翻PyTorch

59 阅读4分钟

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。

2025-06-01 资讯日报

新闻资讯

Replit怒批Lovable应用安全漏洞

Replit 员工指 Lovable 未修复安全漏洞,多款应用高危。Lovable 推‘安全扫描’仍未解决根本问题。专家认为氛围编码应提升安全,用户创建应用易有漏洞,安全责任界定待明确。>阅读原文

AlphaEvolve破数学纪录

AlphaEvolve与人类数学家协作,一周两破18年数学纪录。AI如侦察兵扫描,人类深度优化。AlphaEvolve提升θ下界,Gerbicz再推进,展现“AI+人类”双引擎驱动科研新范式。>阅读原文

斯坦福团队:CUDA - C内核干翻PyTorch

斯坦福华人团队:用纯CUDA - C写的AI生成内核超越PyTorch,在多方面性能表现优异。采用新优化方法,多数最优内核在靠后轮次出现,优化策略集中,后续将继续探索。>阅读原文

Redis 之父:人类程序员胜过大模型

Redis 之父 Antirez:人类程序员比大模型出色,在修复 Redis 复杂 bug 中,人类能打破常规想解法,大模型较难。开发者看法不一,当下 AI 缺创造力,但改变了开发工作方式。>阅读原文

微软:企业增设AI岗,员工将成老板

微软陶然称中国企业对 AI 认知转变。报告显示 81%企业考虑增设 AI 岗。企业落地分三阶段,智能体成“数字员工”,员工将成其老板,但要应对员工素养和实效转化难题。>阅读原文

陶哲轩重写经典教材用Lean

陶哲轩:为《Analysis I》创建 Lean 配套项目,将内容转成 Lean 版,部分依托 Mathlib。不提供练习官方答案,欢迎自由答题。该项目可作辅助教材和入门指南。>阅读原文

推理模型或一年内撞算力墙

Epoch AI等认为推理模型最多一年撞上算力天花板。o3靠10倍算力碾压o1,推理算力与模型能力挂钩,但数据和隐藏成本或限制发展,不过算力增长仍关键。>阅读原文

红杉中国:推Agent测评工具Xbench

红杉中国团队:提出AI基准测试工具Xbench,采用双轨评估体系和长青评估机制,重点量化AI真实场景效用价值。首期测试中,不同模型在招聘和营销领域表现差异大。>阅读原文

产品应用

Claude团队推UI设计新工具

Claude Engineer团队:Magic Path是新的AI UI设计工具,AI先行生成组件和代码,生成的UI可用,能页面串联,虽有不足但免费且潜力大。>阅读原文

华为盘古Embedded实现快慢思考合一

华为盘古团队:为解决大模型推理难题,推出盘古Embedded模型,基于昇腾NPU,集成快慢思考模式,通过两阶段训练框架,实现推理效率与精度协同提升,为语言模型开发提供新路径。>阅读原文

推荐文章

图解vllm加载模型权重流程

文章指出vllm加载模型权重流程为Executor -> Worker.load_model() -> ModelRunner.load_model() -> DefaultModelLoader.load_model(),分初始化架构和加载权重两步,掌握原理可按需调整代码。>阅读原文

YC分享提示工程实践

YC:提示工程核心在提示词设计。分享实践,含核心原则、进阶技巧等。关键结论是提示工程20%技术+80%领域知识,成功企业要深耕场景转化工作流。>阅读原文

开源动态

Sakana AI发布可进化AI Agent

Sakana AI推出DGM,能重写代码自我进化。在测试中性能提升显著,能力具通用性,不过有性能瓶颈等局限。团队开源代码,还提出规模化扩展等未来研究方向。>阅读原文

字节跳动开源Dolphin文档模型

字节跳动:开源文档解析模型Dolphin。它用两阶段法解析,功能多、场景广,技术架构强,训练样本超3000万,安装推理易,比同类更有竞争力,为文档处理带来新可能。>阅读原文

Hugging Face 开源亲民机器人

Hugging Face:发布 HopeJR 和 Reachy Mini 两款开源人形机器人,价格亲民。虽 HopeJR 外观遭吐槽,但它们推动构建开源机器人生态,让机器人技术更开放。>阅读原文

Claude团队开源LLM可视化工具

Claude团队:开源“电路追踪”工具,生成归因图解读大模型“脑回路”。通过干预实验验证节点功能分工,在多语言电路等示例中开展研究,助力理解模型决策逻辑。>阅读原文

Dedoc:统一文档格式开源库

Dedoc:开放通用文档解析库,支持多格式,能自动提取内容与结构。可处理扫描文档,用Python实现,有多种优势,可用于信息分析等系统,提供多种安装方式。>阅读原文

DeeplxFile:Excel翻译开源神器

痕小子推荐开源神器DeeplxFile,免费、不限文件大小,能精准翻译Excel公式,还支持PDF转Word,提供两种模式,跨平台且操作简单,重塑文档处理流程。>阅读原文

微软开源Edit编辑器爆火

开源君:微软新开源的Edit编辑器,轻量高效,功能丰富,兼容Windows生态,对新手和老用户都友好,降低命令行编辑门槛,值得Windows用户一试。>阅读原文

Meta 开源高性能 Pyrefly

Meta:开发 Pyrefly 替代 Pyre,用 Rust 编写以实现高性能,每秒能查 180 万行代码,还能推断未注解代码类型,计划今夏进 beta 阶段。>阅读原文

360开源FineHARD图文数据集

360冷大炜博士团队:开源FineHARD高质量图文对齐数据集,含大量图像、边界框和负样本,可提升模型图文对齐能力,能用于多模态大模型训练、具身智能等领域。>阅读原文

小红书、西交大尝试实现o3技术

小红书、西安交大:尝试实现OpenAI未公开的o3「用图思考」技术,构建DeepEyes模型。它无需复杂工作流和大量监督数据,在多任务表现佳,为多模态智能探索提供新路径。>阅读原文

算法论文

NUS:OmniConsistency复现GPT-4o能力

NUS ShowLab 推出 OmniConsistency:用 2600 对数据、约 500 小时 GPU 算力,解决开源与商业 API 图像风格化一致性差距,成本低、效果好,还兼容主流插件。>阅读原文

Tri Dao团队推新注意力机制

普林斯顿大学Tri Dao团队:提出GTA和GLA注意力机制,减少KV缓存用量,解码速度显著提升,是GQA和MLA的有效替代品,迈向推理“理想”架构第一步。>阅读原文

新研究:跳过 SFT,RL 推理上限更高

加州大学等团队研究发现,当前常用的「SFT+RL」训练范式中,SFT 会诱发「伪推理路径」,阻碍推理进步。直接进行 RL 训练,模型多模态推理上限更高,该团队训练的模型刷新了 Open LMM 推理榜单纪录。>阅读原文

哈工大:让AI领略汉字之美

哈工大团队:用传感器捕捉书写实现汉字输入识别,独创中文字形编码CGE让AI从‘识字’到‘解字’,革新中文人机交互,推动汉字文化传承。>阅读原文

港理工团队揭秘大模型遗忘规律

港理工等团队研究大模型遗忘:真正遗忘是结构抹除,持续遗忘风险高,GA/RLabel破坏性强;结构漂移才是不可逆遗忘,遗忘或有隐式增强效果,诊断工具助可控遗忘。>阅读原文

Meta等:新模型解决图像编辑难题

Meta等团队研究者针对few - shot图像编辑提出新自回归模型InstaManip,创新分组自注意力机制,引入关系正则化。实验显示,该模型在多指标超旧模型,增加样例图片数量和多样性可提升性能。>阅读原文

UC伯克利:LLM靠自信学会推理

UC伯克利华人团队:LLM可仅靠自身「自信」学会复杂推理。他们提出RLIF新范式,用INTUITOR方法让模型以自身置信度为奖励,在数学、编程等任务性能提升,还防止奖励滥用。>阅读原文

RM - R1:重塑奖励模型推理价值

伊利诺伊大学团队:RM - R1 将奖励建模变为推理任务,引入 CoR 机制。两阶段训练后,在多基准测试超大规模模型,证明推理能力关键,为奖励模型研究指明新方向。>阅读原文

AI记忆系统获统一框架

香港中文大学等团队:发布AI记忆机制综述,构建统一框架,提出六种记忆操作,探讨关键主题,对比人类与AI记忆差异,指出未来AI记忆系统要突破瓶颈,实现认知跃迁。>阅读原文

哈工大GRGS实现3D重光照

哈工大:提出GRGS框架用于多光照3D人体渲染,采用前馈监督策略,支持可编辑光照,结合物理与神经网络合成逼真效果,不过处理透明材质和纤薄结构有局限。>阅读原文

新方法造出「视频世界模型」

斯坦福等团队:用状态空间模型实现长期记忆,结合逐块扫描方案与帧局部注意力机制,新「视频世界模型」在训练和推理表现上优于传统方法,能高效处理长上下文。>阅读原文

Tool - Star赋能大模型多工具推理

研究团队:提出Tool - Star框架,解决大模型多工具调用问题。该框架让模型在多工具辅助下完成推理,在多任务表现佳,未来可向多模态和多工具扩展。>阅读原文

    </p>
    

官网:www.AiReadingHub.com