衍辉AI速递 5.12｜Thinking Machines推出原生交互模型等10条AI资讯Thinking Machin

2026-05-12 | 共 10 条精选

今日速览

模型发布 | Thinking Machines发布Interaction Models研究预览版
模型发布 | OpenAI发布安全AI代理Daybreak对标Claude Mythos
模型发布 | Interfaze推出新架构模型，多项基准测试超越Gemini和Claude
开源项目 | E2a开源AI Agent邮件网关，支持SPF/DKIM验证
行业动态 | 通用汽车裁员数百名IT员工，转招AI技能人才
行业动态 | 谷歌首次拦截AI生成的零日漏洞攻击
行业动态 | ChatGPT用户增长扩展至35岁以上群体，性别比例趋于均衡
开源项目 | AgentMemory开源项目登GitHub趋势榜，为AI编码Agent提供持久化内存
开源项目 | Nous Research发布Hermes Agent开源项目，单日获2065星标
实用工具 | React Doctor工具开源，用于检测AI生成的低质量React代码

1. Thinking Machines发布Interaction Models研究预览版

分类：模型发布

Thinking Machines发布Interaction Models研究预览版

Thinking Machines实验室发布Interaction Models研究预览版，这是一种从头训练的新型模型，能原生处理多模态交互而非依赖外部框架。该模型可持续接收音频、视频和文本输入，并实时思考、响应和执行操作。

为确保实时响应能力，团队采用多流（multi-stream）、微轮次（micro-turn）设计架构。这种设计让AI能够像人类协作那样自然地工作——边听边思考边回应，而非传统的轮流对话模式。

此举标志着AI交互范式的转变，将交互能力作为核心训练目标而非后期工程问题。研究团队认为，随着AI智能提升，交互能力也应同步扩展，而非作为附加功能处理。

编者按：从训练底层就把交互能力烤进模型，这对开发者意味着什么？不用再写复杂的状态管理和上下文追踪代码了——模型自己就知道该在什么时候插话、什么时候沉默。

🔗 来源：Hacker News | 原文链接

2. OpenAI发布安全AI代理Daybreak对标Claude Mythos

分类：模型发布

OpenAI发布安全AI代理Daybreak对标Claude Mythos

OpenAI正式推出Daybreak安全计划，专注于在攻击者发现漏洞前进行检测和修补。该计划使用今年3月推出的Codex Security AI代理，基于组织代码创建威胁模型，聚焦可能的攻击路径，验证潜在漏洞并自动检测高风险项。

此举是对竞争对手Anthropic一个多月前发布的Claude Mythos的直接回应。Anthropic当时声称Mythos是一个专注安全的AI模型，因过于危险而未公开发布，仅作为Project Glasswing计划的一部分私下分享。

编者按：AI安全军备竞赛进入新阶段——大厂们不再只关注模型能力对齐，而是让AI直接参与攻防博弈。对企业安全团队来说，这可能意味着漏洞修复周期从周级别缩短到小时级别。

🔗 来源：The Verge AI | 原文链接

3. Interfaze推出新架构模型，多项基准测试超越Gemini和Claude

分类：模型发布

Interfaze推出新架构模型，多项基准测试超越Gemini和Claude

Interfaze发布全新模型架构，在OCR、视觉、语音转文本和结构化输出等9项对比基准测试中超越Gemini-3-Flash、Claude-Sonnet-4.6、GPT-5.4-Mini和Grok-4.3。该模型专为高精度计算机级任务设计，例如读取50页PDF、映射每个单词的XY坐标位置并翻译成其他语言。

团队强调，人类在计算机级任务中效率低下且易出错，但擅长决策和理解细微差别。Interfaze模型针对这类需要高精度、大规模处理的任务进行了优化，目标是减少错误率、降低成本并缩短处理时间。

编者按：垂直场景专用模型开始挑战通用大模型——当你只需要把发票数据精准提取出来时，可能不需要一个能写诗的AI。

🔗 来源：Hacker News | 原文链接

4. E2a开源AI Agent邮件网关，支持SPF/DKIM验证

分类：开源项目

E2a开源AI Agent邮件网关，支持SPF/DKIM验证

Mnexa AI开源了E2a项目，这是一个专为AI Agent设计的邮件网关。该项目支持SPF/DKIM入站验证、HMAC签名传递、webhook和WebSocket扇出功能，并提供CLI工具和SDK。

E2a解决了AI Agent在处理邮件通信时的身份认证和安全传输问题，让开发者能够快速为Agent构建可靠的邮件收发能力，适用于自动化客户服务、邮件监控等场景。

编者按：AI Agent要真正进入企业工作流，邮件是绕不开的一环——终于有人把这个基础设施问题开源出来了。

🔗 来源：Hacker News | 原文链接

5. 通用汽车裁员数百名IT员工，转招AI技能人才

分类：行业动态

通用汽车裁员数百名IT员工，计划招聘具备更强AI技能的人才。新职位聚焦AI原生开发、数据工程与分析、云工程、Agent和模型开发，以及提示工程和新AI工作流等领域。

这一举措反映出传统制造业企业正在重构技术团队结构，将AI能力从可选项变为核心竞争力。通用汽车希望通过这次人员调整加速AI技术在汽车设计、制造和服务流程中的应用。

编者按：传统IT技能贬值速度比想象中快——即使在汽车制造业，不懂Agent开发和提示工程的程序员也开始被淘汰了。

🔗 来源：TechCrunch AI | 原文链接

6. 谷歌首次拦截AI生成的零日漏洞攻击

分类：行业动态

谷歌首次拦截AI生成的零日漏洞攻击

谷歌威胁情报小组（GTIG）首次发现并阻止了由AI开发的零日漏洞攻击。报告显示，知名网络犯罪团伙计划利用该漏洞发动大规模攻击，目标是绕过某开源网络管理工具的双因素认证。谷歌研究人员在攻击脚本中发现了AI协助的痕迹，包括"幻觉CVSS评分"和符合LLM训练数据的"结构化教科书式"格式。

这是首个被公开确认的AI辅助生成的实际攻击案例，标志着AI在网络安全攻防两端的应用都已进入实战阶段。

编者按：AI降低了漏洞开发门槛——以前需要资深黑客才能写出的exploit，现在普通犯罪团伙也能借助LLM搞定了。

🔗 来源：The Verge AI | 原文链接

7. ChatGPT用户增长扩展至35岁以上群体，性别比例趋于均衡

分类：行业动态

OpenAI发布的2026年Q1数据显示，ChatGPT用户增长最快的群体是35岁以上人群，性别使用比例也更加均衡。这表明ChatGPT正从早期技术采用者圈层向主流用户群扩展。

数据反映出AI工具已突破科技圈，开始被更广泛的职场人士和普通消费者接受。年龄和性别分布的平衡化是任何技术产品走向大众市场的关键指标。

编者按：当你爸妈开始用ChatGPT写工作邮件时，AI就真正进入主流了——不再是极客的玩具，而是普通人的日常工具。

🔗 来源：OpenAI Blog | 原文链接

8. AgentMemory开源项目登GitHub趋势榜，为AI编码Agent提供持久化内存

分类：开源项目

AgentMemory开源项目登GitHub趋势榜，为AI编码Agent提供持久化内存

GitHub开源项目AgentMemory登上趋势榜，单日获得430星标。该项目基于真实基准测试，为AI编码Agent提供持久化内存能力，使用TypeScript开发。持久化内存能让AI Agent在多次会话间保持上下文和学习成果，提升代码生成的连贯性和准确性。

🔗 来源：GitHub Trending | 原文链接

9. Nous Research发布Hermes Agent开源项目，单日获2065星标

分类：开源项目

Nous Research发布Hermes Agent开源项目，单日获2065星标

Nous Research推出Hermes Agent开源项目，定位为"与你共同成长的Agent"，使用Python开发。该项目单日在GitHub获得2065星标，成为当天最受关注的开源项目之一。项目强调Agent的自适应和学习能力，能够根据用户使用习惯持续优化表现。

🔗 来源：GitHub Trending | 原文链接

10. React Doctor工具开源，用于检测AI生成的低质量React代码

分类：实用工具

React Doctor工具开源，用于检测AI生成的低质量React代码

Million.co推出React Doctor开源工具，专门用于检测AI生成的低质量React代码。该项目使用TypeScript开发，单日获得212星标。随着越来越多开发者使用AI辅助编程，代码质量监控工具变得更加重要，React Doctor填补了这一市场空白。

🔗 来源：GitHub Trending | 原文链接