All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。
2025-05-19 资讯日报
新闻资讯
OpenAI机密文档揭秘对手
OpenAI内部机密文档曝光,显示ChatGPT 2025年上半年要强化核心功能,推动向超级助手转型。将对手分两类,最大对手信息被打码,网友猜测多指向Meta。>阅读原文
Meta Llama 4发布延期风波
新智元报道:Meta旗舰AI模型Behemoth延期,还传80%团队辞职,虽已辟谣但发展困境凸显。Llama 4刷榜遭质疑,对手快速迭代,Meta慌了,招募大佬带队Llama 5。>阅读原文
OpenAI:AI推理砸钱效果好
OpenAI研究员Noam Brown:现在AI胜在通用,推理范式有新可能,模型表现会更好;首席经济学家Ronnie Chatterji:AI正重塑企业格局,企业需做好AI转型。>阅读原文
硅谷野心:AI取代人类工作
新智元报道,Ed Newton - Rex文章称硅谷想用AI和机器人取代人类工作拿走工资。Mechanize公司算出60万亿美元潜在市场,马斯克、盖茨等科技大佬预言AI将大规模取代劳动。>阅读原文
Palo Alto 5亿收购Protect AI
Palo Alto Networks超5亿美元收购Protect AI。后者有两个开源软件、三个平台产品,提供完整AI防护方案,对Huggingface模型持续扫描积累数据,团队实力强,值这个价。>阅读原文
产品应用
「无相」智能体守护网络安全
AI 崛起让网络攻击更复杂,有诈骗、伪造身份等威胁。业内尝试以 AI 对抗 AI,如 Anthropic 防护模型。青藤云安全「无相」实现自主决策,革新安全思维,重塑网络安全格局。>阅读原文
ChatGPT新功能搞定代码库研究
新智元:ChatGPT上线直连Github的Deep Research功能,可对仓库深度研究,10分钟生成专业报告。还能避免“幻觉”,Plus用户就能用,开启全新研究模式,玩法超强大。>阅读原文
推荐文章
翁荔长文谈提升模型性能
翁荔最新长文指出,让模型输出答案前多思考,能提升智能水平。文中围绕“测试时计算”和“思维链”展开,介绍多种提升模型性能的方法,还提及面临的挑战和未来方向。>阅读原文
Bruce解析sglang forward流程
进击的Bruce:详细解析sglang forward核心实现全流程,以flashinfer为example介绍AttentionBackend数据结构和初始化流程,还说明了cudaGraphRunner工作方式,助读者理解代码。>阅读原文
Lilian Weng:模型“思考”研究进展
Lilian Weng:最新博客回顾利用测试时计算的研究,指出思维链等策略可提升模型性能,还介绍并行采样、序列修订等方法。DeepSeek-R1训练流程有效,不过强化学习训练也面临奖励作弊等问题。>阅读原文
Lilian Weng:模型思考新见解
Lilian Weng:模型在高级认知任务上性能提升,得益于思维链等策略,但也带来挑战。还介绍多种提升推理能力方法,如并行采样、序列修订、强化学习等,并提出未来研究开放性问题。>阅读原文
开源动态
中科院学者频域净化对抗图像
中国科学院学者裴高政等:现有图像对抗净化策略在时域有缺陷,转向频域用傅里叶分解,发现扰动破坏高频谱,注入低频信息可有效净化,论文与代码已开源。>阅读原文
苹果开源可手机运行的 FastVLM
苹果开源 FastVLM 视觉语言模型,可在 iPhone 运行。它解决传统模型体积和速度问题,首 token 输出快 85 倍,引入 FastViTHD 编码器,适配苹果生态,有不同版本供选择。>阅读原文
Cooragent:功能全面的Agent框架
CourseAI:Cooragent是改进型Agent框架,可本地部署,借助CLI创建智能体,添加MCP服务后能实现复杂功能,还深度兼容Langchain,支持MCP。>阅读原文
本周5个超神Github开源项目
开源君推荐本周5个超牛的Github开源项目:nginx - proxy - manager简化Nginx配置;SeleniumBase让网页自动化更轻松;ctop监控容器超方便;NB实现高效知识管理;github - chinese汉化GitHub界面。>阅读原文
哔哩哔哩推出AniSora模型
哔哩哔哩推出AniSora,这一面向动画视频生成的综合系统,整合了数据集、模型和评测基准集。它在多维度超越当前先进模型,提升生成效率与创作自由度。>阅读原文
AG - UI:新的Agent交互协议
copilotkit发起AG - UI项目,构建Agent - 用户交互标准化协议,侧重前端交互,有事件驱动等设计原则,支持多种交互功能,已获部分框架兼容,可提升开发效率。>阅读原文
算法论文
北大DeepSeek论文或夺ACL最佳
北大DeepSeek的NSA论文获ACL 2025高评分,有望成最佳论文。它革新注意力机制,提升长文本处理效率。此外,张铭教授团队还有多篇论文聚焦数据训练、金融评估等领域。>阅读原文
TokenSwift实现长文本3倍加速
BIGAI NLCo团队:提出推理加速框架TokenSwift,解决传统自回归长文本生成瓶颈,在多主流模型实验中加速比超3倍,与原模型质量一致,为长文本场景提供支撑。>阅读原文
港中大算法让矩阵乘法更快
香港中文大学论文提出RXTX算法,计算XXᵗ时结合机器学习与组合优化。能源省5%-10%、时间省5%,乘法次数和总运算量表现优,对多领域影响深远。>阅读原文
AI Agents与Agentic AI大比拼
论文指出,AI Agents是单体系统,适合简单任务,有因果推理弱等挑战;Agentic AI是多智能体协作,适合复杂场景,存在稳定性等问题。未来两者或界限模糊,重塑AI与人协作方式。>阅读原文