Mini DALL·E 3：设计师福音！开源AI绘画神器：对话式修图+智能问答，草图秒变商业大作Mini DALL·E

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发感兴趣，我会每日分享大模型与 AI 领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜：蚝油菜花 🥦

🎨 「设计师福音！多校联合AI绘画神器：对话式修图+智能问答，草图秒变商业大作」

大家好，我是蚝油菜花。当别人还在为AI绘画的提示词绞尽脑汁时，这个国产框架已经让图像生成进入了「聊天式创作」时代！

你是否经历过这些创作噩梦：

今天要解剖的 Mini DALL·E 3 ，正在重定义人机协作创作！这个由北理工领衔的交互式神器，用四大黑科技炸穿创作壁垒：

已有设计团队用它3轮对话完成商业海报，插画师靠它实时修正AI作品——你的创作流程，是时候进化到「动口不动手」阶段了！

🚀 快速阅读

Mini DALL·E 3是首个实现多轮交互式文生图的开源框架。

Mini-DALLE3

Mini DALL·E 3 是由北京理工大学、上海AI Lab、清华大学和香港中文大学联合研发的交互式文本到图像（iT2I）框架。该系统突破传统文生图工具的单次生成模式，允许用户通过自然语言对话逐步优化图像内容。

其核心创新在于将大型语言模型（LLM）与文本到图像模型（T2I）深度结合，通过和等特殊标签实现多轮交互。用户无需专业提示词技巧，用日常语言描述需求即可获得高度匹配的图像输出，系统还能主动解释创作逻辑并接受反馈调整。

minidalle3-instruction

minidalle3-arch

下载模型检查点并保存至指定目录：

checkpoints
   - models
   - sdxl_models

设置OpenAI API密钥后运行：

export OPENAI_API_KEY="your key"
python -m minidalle3.web

可按需切换为百川等国产模型：

python -m minidalle3.llm.baichuan
export OPENAI_API_BASE="http://0.0.0.0:10039/v1"
python -m minidalle3.web

当前已验证支持chatglm、baichuan、internlm等模型

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜：蚝油菜花 🥦