Datawhale X 魔搭 AI夏令营|task3小白向学习笔记

139 阅读3分钟

引言

在上一个任务中,我们深入了解了AI工具通义千问的使用,提升了我们的学习效率。本任务旨在进一步理解微调原理,并借助ComfyUI这一文生图工作流平台工具,实现更高质量的图像生成。

微调原理

微调是一种机器学习技术,通过在预训练模型的基础上进行少量调整,以适应特定的任务。这一过程涉及对模型参数的微量调整,而不是从头开始训练,从而节省时间和资源。

ComfyUI工具介绍

1. ComfyUI初识

ComfyUI是一种基于节点的图形用户界面(GUI),用于图像生成技术。它通过模块化设计,将图像生成过程分解为多个节点,用户可以自由组合这些节点,形成个性化的工作流程。

2. ComfyUI核心模块

  • 模型加载器:加载预训练模型。
  • 提示词管理器:管理用于生成图像的提示词。
  • 采样器:控制图像生成过程中的采样系数。
  • 解码器:将采样结果转换为最终图像。

3. ComfyUI图片生成流程

用户通过拖放模块,构建工作流程,实现从噪声到清晰图像的生成。

4. ComfyUI的优势

  • 模块化和灵活性:用户可以自定义图像生成过程。
  • 可视化界面:简化了AI模型和数据流的操作。
  • 多模型支持:支持多种生成模型的集成和切换。
  • 调试和优化:通过可视化界面简化调试过程。
  • 开放和可扩展:开源项目,支持自定义模块开发。
  • 用户友好性:简化复杂任务的操作流程。

ComfyUI安装指南

1. 安装前的准备

  • 使用魔搭社区提供的Notebook和GPU算力。
  • 下载ComfyUI的执行文件和Lora微调文件。

魔塔链接:www.modelscope.cn/my/mynotebo…

1723890728399.png

复制下列代码,在jupyterlab实例中,点击左上角的file,new,点击terminal,创建新的终端。然后粘贴代码,下载文件。

git lfs install
git clone https://www.modelscope.cn/datasets/maochase/kolors_test_comfyui.git
mv kolors_test_comfyui/* ./
rm -rf kolors_test_comfyui/
mkdir -p /mnt/workspace/models/lightning_logs/version_0/checkpoints/
mv epoch=0-step=500.ckpt /mnt/workspace/models/lightning_logs/version_0/checkpoints/   

2. 安装步骤

  • 执行安装脚本,通常需要10分钟左右。
  • 访问安装后生成的链接,进入ComfyUI界面。
1723891304826.png 1723898989985.png

ComfyUI工作流实践

1. 工作流样例

  • 下载不带Lora的工作流脚本。
  • 加载模型,进行首次图像生成。
1723900926558.png

2. 操作提示

  • 如图所示,运行成功
1723902347327.png

带Lora的工作流脚本

笔者在此卡了一下,因为执行 LoadKolorsLoRA 操作时遇到了问题,具体是因为加载一个名为 epoch=0-step=500.ckpt 的文件时找不到这个文件。 于是笔者重新运行CPU环境。

赛事链接:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 (aliyun.com)

结语

通过本任务的学习,我们不仅理解了微调的基本原理,还掌握了ComfyUI这一强大的图像生成工具的使用。随着技术的不断进步,我们有理由相信,AI工具将在我们的学习和工作中发挥越来越重要的作用。