05-08 AI日报:算力、全模态与 Agent 工作流同时提速

25 阅读2分钟

导语 算力放开、全模态升级、Agent 工作流提速,这三条主线今天一起往前推。

1. OpenAI 发布三款实时音频模型,GPT-Realtime-2 具 GPT-5 级推理 #1

OpenAI 在 Realtime API 上线三款实时音频模型。

其中, GPT-Realtime-2 模型具备 GPT-5 级别推理能力,支持 128K 上下文与并行工具调用。

GPT-Realtime-Whisper 能提供低延迟流式转录。

OpenAI 发布三款实时音频模型,GPTRealtime2 具 GPT5 级推理 1

2. 火山方舟上线 Agent Plan 个人订阅套餐支持生成视频图片 #2

火山方舟 正式上线面向个人用户的 Agent Plan 。

Agent Plan 提供最低 40 元/月 的四档套餐,主打 Agent 场景。

该方案采用 Agent 燃料值(AFP) 对不同模型按照不同费率计费,包含月额度、周额度和 五小时 额度限制。

火山方舟上线 Agent Plan 个人订阅套餐支持生成视频图片 2

3. Codex 上线 Chrome 扩展,新增 Vim 模式 #3

Codex 推出 Chrome 扩展并发布更新。该扩展支持 Codex 在后台跨标签页并行处理 Web 任务。

同时, Codex 应用更新带来性能提升。新增 Vim 模式与键盘映射调试等功能。

OpenAI 近日为编程 Agent Codex 发布 Chrome 扩展,支持 macOS 和 Windows 系统。

Codex 上线 Chrome 扩展,新增 Vim 模式 3

4. OpenAI 推出 GPT-5.5-Cyber 面向网络安全防御人员 #4

OpenAI 推出了面向网络安全防御人员的 GPT-5.5-Cyber 模型,并同步通过 TAC 框架提供 GPT-5.5 模型。

从业人员可通过官网验证个人身份,或由企业联系官方代表申请访问权限。

OpenAI 宣布推出面向关键基础设施防御人员的 GPT-5.5-Cyber 受限预览版,旨在支持专业网络安全工作流,并同步通过 TAC 框架提供 GPT-5.5 模型。

OpenAI 推出 GPT55Cyber 面向网络安全防御人员 4

5. xAI 推出 Grok Imagine Quality Mode API #5

SpaceXAI 推出了 Grok Imagine Quality Mode API。

该模式提供高真实感的图像生成与编辑,能保持人物与物体一致性。

近日, xAI 宣布面向企业开发者和团队正式上线 Grok Imagine Quality Mode API 。该图像生成与编辑模式提供更高的真实感与文字渲染能力,能保持人物与物体一致性,强化产品可视化与营销素材生成,并支持结合视频能力。

xAI 推出 Grok Imagine Quality Mode API 5

补充图片

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

RSS 原图

总结

如果今天只能记住一个结论,那就是:AI 的变化已经不只是模型强弱,而是开始系统性改写工作流。