OpenAI 为 ChatGPT 新增图片库管理功能

18 阅读2分钟

OpenAI 为 ChatGPT 新增图片库管理功能

1.gif

OpenAI[1] ChatGPT 正式推出图片库管理功能,用户所有生成的 AI 图片都将自动归档于此。

该功能已同步上线 Web 端和移动端,终于不用再在聊天记录里找了。

谷歌推出 Gemini 文生视频 & Whisk 图生视频

2.gif

谷歌在其旗下的 Gemini 和 Whisk 应用中引入了由 Veo2 驱动的视频生成功能[2],需要 Gemini Advanced 或 Google One AI Premium 订阅才能使用。

可以在 Gemini 中进行文生视频,在 Whisk 中进行图生视频,最高能生成 8 秒 720p 的视频。

Mogao 模型揭晓:字节 Seedream 3.0

昨日登顶 Artificial Analysis 榜首的 Mogo 模型现已揭晓,居然是字节跳动发布的 Seedream 3.0(即梦 3.0)模型。

该模型拥有业界领先的人像生成质感;目前最强的汉字排版能力;最高支持 2K 分辨率输出。

国内用户可以直接在即梦 AI 平台体验,国际用户则需要填写表单申请测试[3]。

如果是开发者的话可以通过火山引擎[4]接入该模型,目前定价为 0.2 元/张

智谱AI启动A股上市流程并开源三大模型

智谱AI 于 4 月 14 日在北京证监局正式办理上市辅导备案,目标是争取 2025 年内完成 A 股上市。

同时,智谱AI 还开源了 3 个模型[5]:

  • GLM4 32B 0414:基础大模型,能力对标 DeepSeek V3
  • GLM Z1 32B 0414:专为推理任务优化的版本,对标 DeepSeek R1
  • GLM Z1 Rumination:针对 Agent 场景特别强化训练的专用模型

这些模型现已开源,佬们也可通过智谱新买的域名 z.ai 直接体验。

快手可灵 2.0 大师版发布

3.gif

可灵 2.0[6] 大师版视频生成模型正式发布,带来三大核心升级:

  1. 语义理解能力显著增强,响应更精准
  2. 动态画面质量全面提升,支持大幅运动场景
  3. 画面质感优化,连续画面更流畅自然

同步推出的可图 2.0 图片生成模型也迎来重要更新,新增局部重绘、智能扩图和风格转绘三大实用功能。

不过可灵 2.0 的价格有点问题,生成 5 秒视频就要 10 块钱(这可能是我的问题,不是它的问题)。