Stability AI 发布 Stable Virtual Camera:从 2D 图像生成 3D 视频

23 阅读2分钟

Stability AI 发布 Stable Virtual Camera:从 2D 图像生成 3D 视频

3.gif

Stable Virtual Camera[4] 是由 Stability AI 最新发布的一款能够从一张或多张 2D 图像(最多支持 32 张)生成具有真实深度和透视感的 3D 视频的技术。

用户可以自由定义相机轨迹,或者选择预设的动态相机路径,例如 360° 旋转、螺旋、变焦(Dolly Zoom)等,效果极其丝滑。

不过,当输入图像包含人类、动物或动态纹理(如水面)时,生成的效果一般。

代码和模型可以在 GitHub 和 HF 上找到,注意其开源协议明确禁止用于商业目的。

谷歌 Gemini 新功能:Canvas 和 Audio Overview

1.gif

谷歌 Gemini APP 发布了两个新功能:

  • Canvas[1] 就像一块共享白板,可以和 Gemini 协同工作,帮助你完善文档、编写代码、设计原型等。
  • Audio Overview 则可以将你的文件(如文档或代码)转化为播客式音频讨论。这相当于直接把之前爆火的 NotebookLM 内置了

上面的功能都上线了,完整更新介绍佬们可以看官方博客[2]。

腾讯混元3D模型升级:2.0 MV 与 Mini

2.gif

腾讯混元 3D 模型[3] 正式更新,推出了两个新版本:3D 2.0 MV 和 3D 2.0 Mini。3D 2.0 MV 在多视角效果更好,而 3D 2.0 Mini 则参数小速度快。

昨天我还以为会发布 3.0 版本,没想到只是增强了 2.0。

对了,腾讯混元今天应该还会发布 HunYuan-T1 推理模型,大家可以继续关注一下。

Cursor 推出按量计费的 Claude Max

Claude Max 是由 Cursor 推出的一款基于 Claude 3.7 的模型,专为处理大规模、复杂代码项目设计。

注意,这不是一个新模型,而是对 Claude 3.7 的优化版本,最多支持 200k 上下文,工具调用上限提升至 200 次。不过价格也很感人,单次请求和工具调用要 0.05 美元。