在之前的任务中,我们已经对baseline进行了精读,并生成了,我们自己的八图故事。
在Task3中,我们的主要任务有两个:part1:工具初探一ComfyUI应用场景探索;Part2:Lora微调。
微调是一种在预训练模型的基础上进一步训练以适应特定任务的方法。这种技术广泛应用于自然语言处理和计算机视觉领域。
part1:工具初探一ComfyUI应用场景探索
GUI 是 "Graphical User Interface"(图形用户界面)的缩写。简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。ComfyUI是GUI的一种。
ComfyUI是一个基于Web的用户界面,用于创建复杂的文本到图像工作流。它通过图形化界面让用户能够轻松地构建复杂的生成任务,特别适用于那些想要更精细控制生成过程的用户。
ComfyUI的主要特点包括:1)模块化;2)灵活性;3)可扩展性;4)可视化编辑;5)高级控制。
ComfyUI的核心模块由模型加载器、提示词管理器、采样器、解码器等组成。
浅谈ComfyUI工作流:
1)不带Lora的工作流样例;
2)带Lora的工作流样例
Part2:Lora微调
LoRA(Low-Rank Adaptation)是一种轻量级的微调方法,用于在预训练模型的基础上进行高效适应。LoRA 的核心思想是在不修改原模型权重的情况下,通过添加少量额外的可训练参数来实现对特定任务的适应。这种方法非常适合于资源有限的情况,因为它不需要大量的计算资源和存储空间。
LoRA 的工作原理:1)预训练模型;2)低秩矩阵分解;3)适应性层;4)微调;5)预测
LoRA 的优势:1)参数效率;2)泛化能力;3)灵活性;4)快速适应