衍辉AI速递 5.12|Thinking Machines推出原生交互模型等10条AI资讯

3 阅读1分钟

2026-05-12 | 共 10 条精选

今日速览

  1. 模型发布 | Thinking Machines发布Interaction Models研究预览版
  2. 模型发布 | OpenAI发布安全AI代理Daybreak对标Claude Mythos
  3. 模型发布 | Interfaze推出新架构模型,多项基准测试超越Gemini和Claude
  4. 开源项目 | E2a开源AI Agent邮件网关,支持SPF/DKIM验证
  5. 行业动态 | 通用汽车裁员数百名IT员工,转招AI技能人才
  6. 行业动态 | 谷歌首次拦截AI生成的零日漏洞攻击
  7. 行业动态 | ChatGPT用户增长扩展至35岁以上群体,性别比例趋于均衡
  8. 开源项目 | AgentMemory开源项目登GitHub趋势榜,为AI编码Agent提供持久化内存
  9. 开源项目 | Nous Research发布Hermes Agent开源项目,单日获2065星标
  10. 实用工具 | React Doctor工具开源,用于检测AI生成的低质量React代码

1. Thinking Machines发布Interaction Models研究预览版

分类:模型发布

Thinking Machines发布Interaction Models研究预览版

Thinking Machines实验室发布Interaction Models研究预览版,这是一种从头训练的新型模型,能原生处理多模态交互而非依赖外部框架。该模型可持续接收音频、视频和文本输入,并实时思考、响应和执行操作。

为确保实时响应能力,团队采用多流(multi-stream)、微轮次(micro-turn)设计架构。这种设计让AI能够像人类协作那样自然地工作——边听边思考边回应,而非传统的轮流对话模式。

此举标志着AI交互范式的转变,将交互能力作为核心训练目标而非后期工程问题。研究团队认为,随着AI智能提升,交互能力也应同步扩展,而非作为附加功能处理。

编者按:从训练底层就把交互能力烤进模型,这对开发者意味着什么?不用再写复杂的状态管理和上下文追踪代码了——模型自己就知道该在什么时候插话、什么时候沉默。

🔗 来源:Hacker News | 原文链接


2. OpenAI发布安全AI代理Daybreak对标Claude Mythos

分类:模型发布

OpenAI发布安全AI代理Daybreak对标Claude Mythos

OpenAI正式推出Daybreak安全计划,专注于在攻击者发现漏洞前进行检测和修补。该计划使用今年3月推出的Codex Security AI代理,基于组织代码创建威胁模型,聚焦可能的攻击路径,验证潜在漏洞并自动检测高风险项。

此举是对竞争对手Anthropic一个多月前发布的Claude Mythos的直接回应。Anthropic当时声称Mythos是一个专注安全的AI模型,因过于危险而未公开发布,仅作为Project Glasswing计划的一部分私下分享。

编者按:AI安全军备竞赛进入新阶段——大厂们不再只关注模型能力对齐,而是让AI直接参与攻防博弈。对企业安全团队来说,这可能意味着漏洞修复周期从周级别缩短到小时级别。

🔗 来源:The Verge AI | 原文链接


3. Interfaze推出新架构模型,多项基准测试超越Gemini和Claude

分类:模型发布

Interfaze推出新架构模型,多项基准测试超越Gemini和Claude

Interfaze发布全新模型架构,在OCR、视觉、语音转文本和结构化输出等9项对比基准测试中超越Gemini-3-Flash、Claude-Sonnet-4.6、GPT-5.4-Mini和Grok-4.3。该模型专为高精度计算机级任务设计,例如读取50页PDF、映射每个单词的XY坐标位置并翻译成其他语言。

团队强调,人类在计算机级任务中效率低下且易出错,但擅长决策和理解细微差别。Interfaze模型针对这类需要高精度、大规模处理的任务进行了优化,目标是减少错误率、降低成本并缩短处理时间。

编者按:垂直场景专用模型开始挑战通用大模型——当你只需要把发票数据精准提取出来时,可能不需要一个能写诗的AI。

🔗 来源:Hacker News | 原文链接


4. E2a开源AI Agent邮件网关,支持SPF/DKIM验证

分类:开源项目

E2a开源AI Agent邮件网关,支持SPF/DKIM验证

Mnexa AI开源了E2a项目,这是一个专为AI Agent设计的邮件网关。该项目支持SPF/DKIM入站验证、HMAC签名传递、webhook和WebSocket扇出功能,并提供CLI工具和SDK。

E2a解决了AI Agent在处理邮件通信时的身份认证和安全传输问题,让开发者能够快速为Agent构建可靠的邮件收发能力,适用于自动化客户服务、邮件监控等场景。

编者按:AI Agent要真正进入企业工作流,邮件是绕不开的一环——终于有人把这个基础设施问题开源出来了。

🔗 来源:Hacker News | 原文链接


5. 通用汽车裁员数百名IT员工,转招AI技能人才

分类:行业动态

通用汽车裁员数百名IT员工,计划招聘具备更强AI技能的人才。新职位聚焦AI原生开发、数据工程与分析、云工程、Agent和模型开发,以及提示工程和新AI工作流等领域。

这一举措反映出传统制造业企业正在重构技术团队结构,将AI能力从可选项变为核心竞争力。通用汽车希望通过这次人员调整加速AI技术在汽车设计、制造和服务流程中的应用。

编者按:传统IT技能贬值速度比想象中快——即使在汽车制造业,不懂Agent开发和提示工程的程序员也开始被淘汰了。

🔗 来源:TechCrunch AI | 原文链接


6. 谷歌首次拦截AI生成的零日漏洞攻击

分类:行业动态

谷歌首次拦截AI生成的零日漏洞攻击

谷歌威胁情报小组(GTIG)首次发现并阻止了由AI开发的零日漏洞攻击。报告显示,知名网络犯罪团伙计划利用该漏洞发动大规模攻击,目标是绕过某开源网络管理工具的双因素认证。谷歌研究人员在攻击脚本中发现了AI协助的痕迹,包括"幻觉CVSS评分"和符合LLM训练数据的"结构化教科书式"格式。

这是首个被公开确认的AI辅助生成的实际攻击案例,标志着AI在网络安全攻防两端的应用都已进入实战阶段。

编者按:AI降低了漏洞开发门槛——以前需要资深黑客才能写出的exploit,现在普通犯罪团伙也能借助LLM搞定了。

🔗 来源:The Verge AI | 原文链接


7. ChatGPT用户增长扩展至35岁以上群体,性别比例趋于均衡

分类:行业动态

OpenAI发布的2026年Q1数据显示,ChatGPT用户增长最快的群体是35岁以上人群,性别使用比例也更加均衡。这表明ChatGPT正从早期技术采用者圈层向主流用户群扩展。

数据反映出AI工具已突破科技圈,开始被更广泛的职场人士和普通消费者接受。年龄和性别分布的平衡化是任何技术产品走向大众市场的关键指标。

编者按:当你爸妈开始用ChatGPT写工作邮件时,AI就真正进入主流了——不再是极客的玩具,而是普通人的日常工具。

🔗 来源:OpenAI Blog | 原文链接


8. AgentMemory开源项目登GitHub趋势榜,为AI编码Agent提供持久化内存

分类:开源项目

AgentMemory开源项目登GitHub趋势榜,为AI编码Agent提供持久化内存

GitHub开源项目AgentMemory登上趋势榜,单日获得430星标。该项目基于真实基准测试,为AI编码Agent提供持久化内存能力,使用TypeScript开发。持久化内存能让AI Agent在多次会话间保持上下文和学习成果,提升代码生成的连贯性和准确性。

🔗 来源:GitHub Trending | 原文链接


9. Nous Research发布Hermes Agent开源项目,单日获2065星标

分类:开源项目

Nous Research发布Hermes Agent开源项目,单日获2065星标

Nous Research推出Hermes Agent开源项目,定位为"与你共同成长的Agent",使用Python开发。该项目单日在GitHub获得2065星标,成为当天最受关注的开源项目之一。项目强调Agent的自适应和学习能力,能够根据用户使用习惯持续优化表现。

🔗 来源:GitHub Trending | 原文链接


10. React Doctor工具开源,用于检测AI生成的低质量React代码

分类:实用工具

React Doctor工具开源,用于检测AI生成的低质量React代码

Million.co推出React Doctor开源工具,专门用于检测AI生成的低质量React代码。该项目使用TypeScript开发,单日获得212星标。随着越来越多开发者使用AI辅助编程,代码质量监控工具变得更加重要,React Doctor填补了这一市场空白。

🔗 来源:GitHub Trending | 原文链接