【Datawhale X 魔搭 AI夏令营】进阶上分-实战优化认识GUI平台，学习节点式平台工具ComfyUI并进行工作

学习链接：Datawhale (linklearner.com)

01 GUI

主流

窗口式function

这种界面通过网页浏览器提供给用户，并且通常包含一个或多个窗口，每个窗口可以包含不同的功能或工具。

代表：WebUI
prompt only

仅依赖于文本提示（prompt）来进行交互的用户界面。这种界面不提供可视化的控件，而是让用户通过输入文本指令来驱动程序的行为。

代表：Fooocus
节点式pipeline

使用节点来组织和控制数据流程的用户界面。在这种界面上，用户可以通过连接不同的节点来创建复杂的工作流。

代表：ComfyUI

其他

官方
- 开源 Stable Studio Stable Swarm
- 在线 Dream Studio Clip drop
第三方
- 开源 Invoke AI SD.Next Volta ML
- 在线 SD Online Hugging Face Cat bird AI Platground AI

02 ComfyUI -- 可视化代码平台

定义

Comfy UI 是一个开源的图形用户界面（GUI）工具，主要用于简化和改进文本到图像生成模型（如 Stable Diffusion）的工作流程。它通过提供一个直观的节点编辑器界面，让用户能够轻松地构建和管理用于生成图像的复杂过程。

作用

作为后端：Comfy Box、Stable Swarm
本体
作为插件：WebUI、Blender

运行

安装

不带Lora的工作流样例

带Lora的工作流样例

体会

运行截图

初次接触ComfyUI，不同于传统的设计软件，ComfyUI简洁直观的界面，让即便是新手小白也能轻松跑出图片，快速实现创意构图的构想。这种低门槛的入门体验，极大地激发了我的学习兴趣。技术并不遥远，创意实现触手可及。

03 LoRA微调

1. 定义

LoRA（Low-Rank Adaptation）是一种高效的微调技术，特别适用于大型预训练语言模型（LLMs）。LoRA 的核心思想是在不修改原有模型权重的情况下，通过引入额外的小规模参数矩阵来调整模型行为，以适应特定的任务或领域。这种方法大大减少了微调所需的计算资源和时间，同时也避免了因全量微调导致的过拟合问题。

2. 特点

模型微调：
- LoRA 可以用于对预训练的大型语言模型进行微调，使其能够更好地完成特定的下游任务，例如文本分类、情感分析、问答系统等。
- 通过 LoRA，可以在不重新训练整个模型的情况下，快速调整模型的行为。
资源效率：
- 由于 LoRA 只添加了少量的参数（通常是低秩矩阵），因此它允许在资源有限的环境中进行模型微调，这对于部署大型模型到边缘设备尤其有用。
快速迭代：
- LoRA 提供了一种快速迭代的方法，使得开发者可以迅速尝试不同的微调策略，找到最适合特定任务的模型配置。
模型压缩：
- LoRA 可以作为一种模型压缩的技术，通过减少模型的参数数量来降低模型的复杂度，同时尽量保持模型性能。
多任务学习：
- LoRA 可以用于多任务学习场景，使得模型能够在不同的任务间共享大部分参数，而每个任务只需要微调特定的 LoRA 参数。

3. LoRA 的工作原理：

学习链接：

在每个模型层内部，LoRA 添加了两个小的可训练矩阵 AA 和 BB，其中 AA 是一个低秩矩阵，BB 通常是一个较窄的矩阵。这些矩阵被设计成与原有的权重矩阵相乘，从而有效地改变模型的行为，而不需要对原模型进行任何更改。
这些额外的矩阵只包含相对较少的参数，这意味着它们可以非常快地进行训练，而且占用的存储空间也更少。