57-260509 AI 科技日报 (Google AI团队预告I/O大会及本周更新)

0 阅读2分钟

57-260509 AI 科技日报 (Google AI团队预告I/O大会及本周更新)

AI模型

  1. Google数学AI代理在FrontierMath基准登顶 — Google 新的数学 AI 代理在 FrontierMath 最难的 Tier 4 测试里,拿下了 47.9% 的准确率,超过了 GPT 5.5 Pro。 🔗

产品发布

  1. Google AI团队预告I/O大会及本周更新 — Google AI 预告了 I/O 大会,顺便发了些更新,比如健康应用接入了 Gemini,还有 Gemma 4 的多 Token 预测加速。 🔗

研究论文

  1. Anthropic新研究:自然语言自编码器 — Anthropic 公布了一项关于自然语言自编码器的研究,探索怎么把大模型内部的语言和数值表示互相转换。 🔗
  2. Anthropic新研究:教Claude理解“为什么” — Anthropic 还发了另一项“Teaching Claude why”的研究,目标是让模型理解因果关系,从而提升推理本事。 🔗
  3. NVIDIA与Sakana AI合作优化稀疏transformer论文 — NVIDIA 和 Sakana AI 合作发了篇论文,提出一种针对 GPU 优化的稀疏 transformer 技术,能让速度提升20%以上。 🔗

工具推荐

  1. React Doctor v2:自动检测 Agent 生成的差 React 代码 — React Doctor v2 发布,专门检测 AI Agent 搞出来的烂 React 代码,主流框架都支持。 🔗
  2. Obsidian 三件套集成,让 Claude Code 接管笔记仓库 — 通过 Web Clipper、CLI 和 Skills 这三件套,就能让 Claude Code 接管你的 Obsidian 笔记库。 🔗
  3. 规范驱动开发课程应对AI编码代理风险 — DeepLearningAI 推出了规范驱动开发的课程,教你怎么用结构化规范来指导 AI 编码代理,免得它乱来。 🔗

行业动态

  1. Hermes Agent 成为 OpenRouter 全球 token 消耗榜首 — NousResearch 的 Hermes Agent 冲到了 OpenRouter 全球 token 消耗排行榜的第一名。 🔗
  2. Alex Olegimas加入Google DeepMind任AGI经济总监 — 经济学家 Alex Olegimas 加入了 Google DeepMind,当 AGI 经济总监,关注 AGI 的经济和政策影响。 🔗

关注我,每天获取AI最新资讯。