谷歌这次野心不小,试图为 AI 智能体互联制定行业标准

144 阅读2分钟

谷歌推出 A2A 协议:实现跨生态智能体互联

Agent2Agent(A2A)[1]是谷歌最新发布的开放协议,该协议弥补 MCP 协议,实现不同生态系统中的智能体(Agent)之间的无缝通信与协作。

从 GitHub 上发布的草案[2]来看,谷歌这次野心不小,试图为 AI 智能体互联制定行业标准。

xAI 正式推出 Grok-3 API 系列,含标准版和 mini 版

xAI 现已公开发布 Grok-3 API,包括 Grok-3 和 Grok-3 mini 两个系列,每个系列都提供了 fast 版本。具体定价如下:

  • Grok-3-beta: INPUT 15.00/M
  • Grok-3-fast-beta: INPUT 25.00/M
  • Grok-3-mini-beta: INPUT 0.5/M
  • Grok-3-mini-fast-beta: INPUT 0.4/M

比起 OpenAI 的 GPT-4o 和 GPT-4o mini,xAI 的定价要略高一些。更多详细可以看xAI 官方技术文档[3]。

OmniSVG:多模态矢量图生成模型

1.gif

OmniSVG[4] 是一个基于视觉语言模型(VLMs)的端到端多模态 SVG 生成系统。能够生成复杂的 SVG 矢量图形结构,支持文本到 SVG、图像到 SVG 以及角色参考到 SVG 。

目前代码和模型权重还没开源,只开放了数据集,最近非常值得期待的一个模型。

阿里百炼推出国内首个 MCP 服务市场

阿里百炼平台[5]正式推出国内首个 MCP 服务市场。支持个人和企业用户一键部署 MCP 服务,大幅降低了使用门槛。

之前我就觉得MCP的 stdio 的门槛对非开发者门槛太高,要么需要 node 环境要么需要 py 环境,现在可以试试了。

Orpheus TTS 和 Nova Sonic 语音模型

Orpheus TTS[6] 和 Nova Sonic[7] 是最近发布两个语音模型。

Orpheus TTS 是一个支持多语言的开源文本转语音模型,支持商用,不过中文效果一般。

亚马逊推出的 Nova Sonic 是一个原生多模态模型,可以直接语音到语音转换,仅支持 API 调用

(没错我就是偷懒把两个放一起写了,反正都是语音模型嘛~😉)