MV-Adapter：上交大、北航和 VAST 等联合开源多视图一致图像生成模型，将预训练的文生图扩散模型转为多视图生成器

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日跟你分享最新的 AI 资讯和开源应用，也会不定期分享自己的想法和开源实例，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

🚀 快速阅读

公众号: 蚝油菜花 - MV-Adapter

MV-Adapter是由北京航空航天大学、VAST和上海交通大学的研究团队推出的多视图一致图像生成模型。该模型能够将预训练的文本到图像扩散模型转化为多视图图像生成器，无需改变原始网络结构或特征空间。

MV-Adapter基于创新的注意力架构和统一条件编码器，高效地建模多视图一致性和参考图像的相关性，支持生成高分辨率的多视角图像，并能适配多种定制模型和插件，实现广泛的应用场景。

首先克隆仓库：

git clone https://github.com/huanngzh/MV-Adapter.git
cd MV-Adapter

（可选）创建一个新的conda环境：

conda create -n mvadapter python=3.10
conda activate mvadapter

安装必要的包（需要torch > 2）：

pip install torch torchvision --index-url https://download.pytorch.org/whl/cu118
pip install -r requirements.txt

使用SDXL模型：

python -m scripts.gradio_demo_t2mv --base_model "stabilityai/stable-diffusion-xl-base-1.0"

使用动漫风格的模型：

python -m scripts.gradio_demo_t2mv --base_model "cagliostrolab/animagine-xl-3.1"

使用SDXL模型：

python -m scripts.gradio_demo_i2mv

🥦 微信公众号｜搜一搜：蚝油菜花 🥦