谷歌发布 Gemini 2.5 Pro I/O 特别版:编程双榜第一

304 阅读2分钟

谷歌发布 Gemini 2.5 Pro I/O 特别版:编程双榜第一

1.gif

谷歌正式发布 Gemini 2.5 Pro "I/O 特别版"技术预览。作为 2.5 Pro 的重大升级版本,其编程能力获得突破性提升 —— 不仅在 LMArena 编码排行榜登顶,更在 WebDev Arena 排行榜稳居第一。

完整更新内容可查阅谷歌官方技术博客[1]。

同样可以在 ai.dev 中直接用,选 Gemini 2.5 Pro Preview 05-06

LTXStudio 发布 130 亿参数 LTX-Video 开源模型

2.gif

LTXStudio 最新发布了 LTX-Video 13B 开源视频生成模型:

  • 130亿参数规模
  • 采用多尺度渲染技术,呈现更精细的细节
  • 显著提升运动轨迹与场景理解能力
  • 可在本地GPU运行,比同类产品快 30 倍
  • 支持关键帧、镜头/角色运动控制及多镜头序列生成

完整更新介绍可以看官方推文[2]

ACE-Step 开源音乐 AI:19 种语言支持

3.gif

ACE-Step[3] 是由 ACE Studio 和 StepFun 联合开发的开源音乐生成模型,基于扩散模型,支持生成多种风格歌曲,支持包括中文在内的 19 种语言。

支持各种控制能力,包括声音克隆、歌词修改、人声性别调整、混音及音轨生成。

生成的效果水平接近 Suno,旋律连贯,歌词对齐。

官方还提供了在线演示[4],感兴趣的佬可以立即体验。

ComfyUI 新增多款付费模型 API 节点支持

4.gif

继上周推出 GPT-Image-1 API 节点后,ComfyUI 现已新增多个付费模型的 API 节点[5]支持。

这些节点的定价与直接调用各模型官方 API 的价格一致。付费模型完整价格表:点击查看[6]。

ComfyUI 团队还表示,未来版本将支持用户使用自己的 API key。

此外,居然还换了 Logo,采用了更现代的扁平化设计风格,似乎是第二次换了吧