MagicTime：一键生成可变延时视频AI整合包，北大开源

2024-06-04 659 阅读11分钟

MagicTime：一键生成可变延时视频AI整合包，北大开源

MagicTime 是一款由北大团队开发的新框架，用于生成可变时间延时视频（ Metamorphic Videos ）。简单一点来说，就是可以基于文本提示，展示物体变化的过程，并生成我们熟知的延时摄影视频。

通常来说，生成变化过程的视频对于模型来说是很困难的，因为模型不仅需要根据文本生成正确的信息，还需要跟随时间，展示出变化的过程。对于现有的模型来说，在生成这样的视频时，它们往往无法很好的遵循现实世界的物理规律，比如 Sora 的演示视频中凭空出现的小狗。

而 MagicTime 的开发团队通过自主设计的 MagicAdapter 方案，可以解耦空间和时间训练，从而编码更多的物理知识，使图像更符合现实。基于传统的 T2V 模型，MagicTime 在预训练 T2V 的基础上进行转换，从而生成我们看到的延时视频。

团队还将 MagicTime 集成到了先前介绍过的北大 Open-Sora-Plan 中，在同一标注框架中使用额外的变质景观延时视频进行扩展，以获得 ChronoMagic-Landscape 数据集。然后利用该数据集对 Open-Sora-Plan 进行微调，得到 MagicTime-DiT 模型。在项目的主页上，也对模型生成效果进行了部分展示。

开发团队似乎对《我的世界》这款游戏情有独钟，项目已生成的 demo 中，有很大一部分都是展示 Minecraft 中的建筑过程。相信不少游玩过这款游戏的玩家都和我一样，在看到演示 demo 是自己喜欢的游戏画面时，都会忍不住往下翻翻吧。

GIthub仓库：

github.com/PKU-YuanGro…

AI科技智库为广大用户提供了Windows环境下的一键启动包，旨在简化使用流程，使用户无需深入了解Python环境的搭建与配置，便可以轻松地启动并使用这一强大的工具。

如何下载资源？

1：下载压缩包首先，您需要从以下链接下载一键启动包：

下载地址：www.aigchouse.com/1221.html 您可以在页面右侧找到下载按钮进行下载。

2：启动程序

下载完成后，解压压缩包，点击"运行程序"

3：浏览器操作

在浏览器中访问 http://127.0.0.1:7860/，即可通过浏览器界面使用工具。

最新AI资讯和AI资源，欢迎访问AI科技智库网

AI科技智库，一站式AI工具、资料、课程资源平台，每日持续更新。致力于通过分享全球优质AI工具、资源和资讯，帮助更多人了解使用AI，提升工作和学习效率。我们的用户群体是AI相关的爰好者、创作者和开发者，通过学习如何使用这些工具进行创作、开发和研究，解决工作、生活和商业经营中的问题。

编辑

网站地址

AI科技智库：www.aigchouse.com

这里有什么？

1、AI工具集合

您可以轻松找到全球最新热门Al工具，为了方便使用，AI科技智库团队精心制作了AI工具整合包，您可以下载并在Windows系统私有化本地化运行，包括图片、文本、视频、音频等工具资源，我们按照功能、业务和行业来分类，尽可能帮助大家找到自己想要的AI工具。

1.1 AI图片工具

MoneyPrinter：一键生成短视频，AI本地整合包

AniPortrait：音频驱动逼真人像合成，腾讯AI数字人整合包

ComfyUI 秋叶整合包：工作流界面，解压即用，快速入门AI绘画

Stable Diffusion 秋叶整合包v4.7 ：解压即用，快速入门AI绘画

MuseV ：数字虚拟人视频生成AI工具，一键整合包，开箱即用

DiffSynth Studio：专业视频风格转绘/换衣，最佳DomoAI本地平替，本地整合包

FRESCO – 一键视频风格转换AI工具，告别复杂工作流，本地整合包

AnyDoor：服装替换，一键换装，向场景中无缝传送物体的AI工具整合包

Lama Cleaner：一键去水印，修复老照片神器，去背景AI工具，本地整合包

FaceFusion ：最强AI换脸工具，去遮挡，高清化卡通脸一键替换，本地部署包！

Waifu2x Extension GUI ：开源图片视频GIF无损放大AI神器，AI工具本地整合包

v2vt：视频自动翻译AI工具，HeyGen最佳平替,本地整合包

ROPE：强大的AI一键换脸整合包，消除脸部遮挡

Stable Diffusion + ReActor AI换脸插件一键整合包

Vid2Densepose + MagicAnimate 一张照片就能生成跳舞视频，AI工具离线整合包

Stable Diffusion OpenVINO整合包轻薄本CPU24秒出图!

Upscayl：顶级AI智能图片放大工具，最高放大图片16倍

Osprey：像素级别的区域图像分析多模态AI工具，本地整合包

Image to Line Drawings素描神器：图片一键转素描AI工具，本地整合包

BRIA-RMBG：顶级商业图片背景去除整合包

PhotoMaker：最新AI风格写真神器，AI工具本地整合包

InstantID：单图秒生成全套风格写真AI工具，本地整合包

FaceChain：AI数字人及写真整合包

TripoSR ：快速单图生成3D模型AI工具，1秒完成，无需GPU，本地整合包

Oms-Diffusion：一键虚拟换装神器，AI工具整合包

Stable Diffusion WebUI Forge 超快SD整合包

DDColor：阿里AI老照片修复神器，AI工具本地整合包

SDXL-Lightning：最快文生图AI工具，本地整合包

DiffBIR：最强AI照片修复神器,AI工具整合包

Rembg：批量抠图AI工具，本地整合包

1.2 AI文本工具

Llama3 ：本地运行最强开源大模型整合包

RWKV大模型:本地运行整合包,支持N、A、I卡和CPU！

零一万物34B超大模型，本地部署包，李开复最强开源项目

英特尔大型语言模型整合包，酷睿轻薄本CPU运行

ChatGPT-Prompt：提示词自动生成器离线整合包

通义千问0.5B模型 Langchain-Chatchat本地整合包

Gemma：谷歌开源大模型，抢先使用

1.3 AI视频工具

Facefusion：一键换脸，最强换脸AI数字人工具整合包

DynamiCrafter – 图片转动画视频AI工具，腾讯出品

MuseTalk：实时高质量唇形同步，AI数字人整合包

SyncTalk：超逼真AI数字人本地运行整合包

FRESCO – 一键视频风格转换AI工具，告别复杂工作流，本地整合包

ProPainter :专业视频修复，去水印AI工具，抹除视频中静态水印

ROPE：强大的AI一键换脸整合包，消除脸部遮挡

LaVie：高质量文生视频AI工具，本地整合包

FaceChain：AI数字人及写真整合包

Sora开源平替 Stable Video Diffusion，AI视频生成工具本地整合包

1.4 AI音频工具

GPT SoVITS ：声音AI克隆工具，完美复刻任何角色的语音、语调！

OpenVoice:快速语音克隆整合包，AI工具，一键使用

EmotiVoice : 多音色语音合成神器,文本转语音情绪控制AI工具,本地整合包

AI人声伴奏分离软件UVR5下载及使用教程

Whisper-WebUI：音视频字幕AI生成翻译整合包

SOME：唱歌音频到MIDI的一键转换AI工具整合包

MAGNet：Meta文本音乐AI生成工具，本地整合包，吉他摇滚、电子音乐都能搞定

2、AI学习资源

AI科技智库还提供了很多Al资料和课程，包括AI面试资料、AI系统产品原型、AI产品经理视频教程，无论你是开发者还是产品经理，都可以在这里找到适合您的资源。相信每个人都可以开启自己的Al学习之旅。

Sora学习资料最全合集（1.92G）

ChatGPT从入门到精通：PPT教程讲义

AIGC精选行业报告

Midjourney进阶及实战教程（6.85G）

人工智能应用百科-2024视频课程（153课程）

吴恩达最新课程《LangChain: Chat with Your Data》

2024大模型（LLMs）算法面试资料，NLP算法，清华校友整理

2024 AI产品经理面试题库，AI产品面试必看

AI产品经理入门资料（376篇）

AI-Ops智能数据分析运维平台

AI大模型聊天助手CHAT-APP