AI 绘画神器 Fooocus 本地部署指南:简介、硬件要求、部署步骤、界面介绍

news2024/11/15 21:53:35

在这里插入图片描述

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。

大家好,我是水滴~~
随着人工智能技术的飞速发展,AI 绘画逐渐成为创意领域的新宠。Fooocus 作为一款免费开源的 AI 绘画工具,凭借其简单易用、高质量图像生成的特点,吸引了众多用户的关注。本文将详细介绍 Fooocus 的本地部署过程,帮助用户轻松搭建自己的 AI 绘画环境。
文章内容包含大量的图例,希望能够帮助新手同学快速入门。

一、了解 Fooocus

Fooocus 是一款 AI 绘画工具,其最大的特点是简单易操作,由 ControlNet 的作者 lllyasviel(真实身份是斯坦福大学博士生张吕敏)开发。
Fooocus 结合了 Stable Diffusion 和 Midjourney 的优点,它保留了 Stable Diffusion 的开源属性,可以免费部署到本地使用。同时,它也向 Midjourney 学习,简化了操作界面,省去了复杂的参数调节,让用户可以更专注于提示和图像的创作。
Fooocus 的界面非常简洁,只包含图像展示窗口、正向提示词和生成按钮三个部分。它使用了最新推出的SDXL 1.0 模型,可以通过简单的提示词生成各种风格的高质量图像。此外,Fooocus 还包含了 100 多种不同的预设风格,涉及写实、胶片、电影质感、动漫、水彩、黏土、3D、等距、像素、霓虹、赛博朋克、波普、纸艺等各个方面,让用户可以轻松生成更多样、更具艺术性的图像。
image.png
只输入了a girl, garden两个提示词,就生成了精美的图片。

二、硬件要求

在部署 Fooocus 之前,用户需要确保自己的电脑满足以下要求:

  • 操作系统:Windows、Linux 或 macOS 均可(本文使用 Windows)。
  • 处理器:支持 CUDA 加速的 NVIDIA 显卡(可选,但强烈推荐)。
  • 显存:至少 4GB(推荐 8GB 或以上)。
  • 内存:至少 8GB(推荐 16GB 或以上)。
  • 存储空间:预留至少 10GB 的硬盘空间用于下载模型和生成图片。

下面是官方给出的最低配置表,该表根据在不同的操作系统和不同的 GPU 型号下的最低配置:

操作系统GPU型号最低显存最低内存备注
Windows/LinuxNvidia RTX 4XXX4GB8GB最快
Windows/LinuxNvidia RTX 3XXX4GB8GB通常比 RTX 2XXX更快
Windows/LinuxNvidia RTX 2XXX4GB8GB通常比 GTX 1XXX更快
Windows/LinuxNvidia GTX 1XXX8GB8GB公比 CPU 快一点点
Windows/LinuxNvidia GTX 9XX8GB8GB比 CPU 更快或更慢
Windows/LinuxNvidia GTX < 9XX不支持//
WindowsAMD GPU8GB8GB通过 DirectML,比 Nvidia RTX 3XXX 慢约 3 倍
LinuxAMD GPU8GB8GB通过 ROCm,比 Nvidia RTX 3XXX 慢约 1.5 倍
MacM1/M2 MPS共享共享比 Nvidia RTX 3XXX 慢约 9 倍
Windows/Linux/Mac只使用CPU0GB32GB比 Nvidia RTX 3XXX 慢约 17 倍

三、部署步骤

本文介绍在 Windows 环境下的部署步骤,在提供的 Fooocus 安装包中已经集成了 Python 和 Git 环境,我们直接下载使用即可,并且它还会自动更新至最新版本。

3.1 下载 Fooocus 安装包

可以通过下面直接下载 Fooocus:
https://github.com/lllyasviel/Fooocus/releases/download/release/Fooocus_win64_2-1-831.7z
如果速度慢,也可以从我分享的网盘中下载:
https://pan.quark.cn/s/5b972ab4e26f
image.png

下载完后,可以看到这样的一个压缩文件:
image.png
我们直接解压即可,下面是解压缩后的内容:
image.png

3.2 下载模型

第一次启动程序时,Fooocus 会自动下载一些默认模型,但这些模型都放在国外的服务器,需要科学上网才能下载。不过我已经将这些模型都放到网盘中了,在这里分享给大家:
https://pan.quark.cn/s/5b972ab4e26f
这些模型需要我们提前下载好,然后放到对应目录下:
image.png
checkpoints 目录中的模型为大模型,下载后放到本地 Fooocus\models\checkpoints文件夹中。
image.png
loras 目录中的模型为 LoRA 模型,下载后放到本地 Fooocus\models\loras文件夹中。

3.3 运行 Fooocus

Fooocus 提供了三个运行程序:run.batrun_anime.batrun_realistic.bat
image.png
这三个程序都可以运行,它们主要区别是使用的大模型不同,不同的大模型也具有不同的风格:

类型程序命令行参数大模型
通用run.batjuggernautXL_v8Rundiffusion
漫画run_anime.bat–preset realisticrealisticStockPhoto_v20
写实run_realistic.bat–preset animeanimaPencilXL_v100

实际上我们只运行 run.bat 即可,到高级选项里面还能进行切换 preset(预设)

双击 run.bat 来启动程序,等待一会后,出现下面提示表示启动成功:
image.png
程序会自动进入 Fooocus 界面,如果没有,在浏览器中输入:http://127.0.0.1:7865/,按回车键后就会进入主界面:
image.png
此时,我们输入一个简单的提示词 a girl,然后点击【Generate】按钮就可以生成图像了:
image.png
这是 Fooocus 最简单的用法了。

四、界面介绍

Fooocus 的界面非常简洁,主要包括主界面、高级界面和输入图像界面。

4.1 主界面

主界面主要用于输入提示词,然后输出图片的地方:
image.png

  • 图像展示区域:这是主要的工作区域,用于展示生成的图像。
  • 提示词输入区域:这是用户输入正向提示词的地方,用于指导 AI 绘画模型生成符合需求的图片。
  • 生成按钮:点击此按钮,Fooocus 将根据用户输入的提示词开始生成图片。
  • 高级选项:勾选后会展开高级界面,可以做一些更高级的设置。
  • 输入图像选项:勾选后会展开输入图像界面,可以根据上传的图片做一系列的操作。

4.2 高级界面

勾选【Advanced】高级选项后,就可以在右侧展开高级界面了,该界面主要包括:Setting(设置)、Style(风格)、Model(模型)、Advanced(高级)四个选项卡:
image.png

  • Setting(设置):主要功能可以修改预设、修改生成速度、修改宽高比、图片生成数量、图片输出格式、填写负向提示词、设置随机种子、查看生成历史等。
  • Style(风格):默认有 100 多种风格可供选择。
  • Model(模型):可以修改主模型、精练模型、LoRA 模型。
  • Advanced(高级):可以调整指导量表、图像清晰度、开发者高度模式。

4.3 输入图像界面

勾选【Input Image】输入图像选项后,会在下方展开输入图像界面,该界面主要包括:Upscale or Variation(图片放大)、Image Prompt(图片提示)、Inpaint or Outpaint(局部修复)、Describe(提示词反推)、Metadata(原数据)五个选项卡:
image.png

  • Upscale or Variation(图片放大):可以将图片放大,增强、微调。
  • Image Prompt(图片提示):可以结合提示词和输入图片来生成新的图片,相当于 ControlNet 功能。
  • Inpaint or Outpaint(局部修复):对图片做一些局部调整。
  • Describe(提示词反推):根据输入图片反推出提示词。
  • Metadata(原数据):获取由 AI 生成图像的原数据,包括提示词、模型等信息。

至于更高级的用法,会在后续文章中讲解,欢迎订阅

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1656634.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mysql等保测评2.0命令-三级

版本 Win默认安装位置 C:\Program Files\MySQL\MySQL Server 8.0\bin 版本&#xff1a;select version() from dual; 身份鉴别 a应对登录的用户进行身份标识和鉴别&#xff0c;身份标识具有唯一性&#xff0c;身份鉴别信息具有复杂度要求并定期更换&#xff1b; 1、SELEC…

html--瀑布效果

<!doctype html> <html> <head> <meta charset"utf-8"> <title>瀑布效果</title><style> body {background: #222;color: white;overflow:hidden; }#container {box-shadow: inset 0 1px 0 #444, 0 -1px 0 #000;height: 1…

Windows远程桌面实现之十四:实现AirPlay接收端,让苹果设备(iOS,iPad等)屏幕镜像到PC端

by fanxiushu 2024-05-04 转载或引用请注明原始作者。 这个课题已经持续了好几年&#xff0c;已经可以说是很长时间了。 实现的程序是 xdisp_virt&#xff0c; 可以去github下载使用:GitHub - fanxiushu/xdisp_virt: xfsredir file system 一开始是基于测试镜像驱动的目的随便开…

【FX110】2024外汇市场中交易量最大的货币对是哪个?

作为最大、最流动的金融市场之一&#xff0c;外汇市场每天的交易量高达几万亿美元&#xff0c;涉及到数百种货币。不同货币对的交易活跃程度并不一样&#xff0c;交易者需要根据货币对各自的特点去进行交易。 全年外汇市场中涉及美元的外汇交易超过50%&#xff01; 实际上&…

对象复制工具Orika,快速实现两个java对象的属性赋值

一、maven依赖引入orika <dependency><groupId>ma.glasnost.orika</groupId><artifactId>orika-core</artifactId><version>1.5.4</version></dependency>二、Orika工具类 import io.swagger.annotations.ApiModel; import io…

百面算法工程师 | 支持向量机面试相关问题——SVM

本文给大家带来的百面算法工程师是深度学习支持向量机的面试总结&#xff0c;文章内总结了常见的提问问题&#xff0c;旨在为广大学子模拟出更贴合实际的面试问答场景。在这篇文章中&#xff0c;我们还将介绍一些常见的深度学习算法工程师面试问题&#xff0c;并提供参考的回答…

Leetcode127.单词接龙

https://leetcode.cn/problems/word-ladder/description/?envTypestudy-plan-v2&envIdtop-interview-150 文章目录 题目描述解题思路代码-BFS解题思路二——双向BFS代码 题目描述 字典 wordList 中从单词 beginWord 和 endWord 的 转换序列 是一个按下述规格形成的序列 …

django中的cookie与session

获取cookie request.COOKIE.GET 使用cookie response.set-cookie views.py from django.http import HttpResponse from django.shortcuts import render# Create your views here. def cookie_test(request):r HttpResponse("hello world")r.set_cookie(lan, py…

设计软件有哪些?渲染软件篇(2),渲染100邀请码1a12

好用的渲染软件有很多&#xff0c;今天我们接着介绍。 1、渲染100(http://www.xuanran100.com/?ycode1a12) 渲染100是网渲平台&#xff0c;为设计师提供高性能的渲染服务。通过它设计师可以把本地渲染移到云端进行&#xff0c;速度快价格便宜&#xff0c;支持3dmax、vray、c…

k8s 理论知识基本介绍

目录 一 k8s 理论前言 &#xff08;一&#xff09;微服务是什么 1&#xff0c;应用场景 2&#xff0c;API 是什么 &#xff08;二&#xff09;&#xff0c;微服务 如何做版本迭代 1. Docker镜像构建 2. 版本标记 3. Docker Registry 4. 环境一致性 5. 滚动更新…

《二十一》QT QML编程基础

QML概述 QML&#xff08;Qt Meta-Object Language&#xff09;是一种声明性语言&#xff0c;它被用于描述Qt框架中用户界面的结构和行为。QML提供了一种简洁、灵活的方式来创建动态和交互式的界面。 QML基于JavaScript语法&#xff0c;通过使用QML类型和属性来定义界面的元素…

[C++核心编程-01]----C++内存四区详细解析

目录 前言 正文 01-内存区域简介 02-全局区 03-栈区 04-堆区 05-new操作符 总结 前言 当程序运行时&#xff0c;操作系统会为程序分配一块内存空间&#xff0c;这块内存空间被划分为不同的区域&#xff0c;每个区域有其独特的作用…

ps5电玩计时收费系统软件教程,电玩店适合的计时器,电脑定时语音提醒

ps5电玩计时收费系统软件教程&#xff0c;电玩店适合的计时器&#xff0c;电脑定时语音提醒 一、前言 以下软件操作教程以&#xff0c;佳易王电玩计时计费管理软件为例说明 软件文件下载可以点击最下方官网卡片——软件下载——试用版软件下载 1、计时计费功能&#xff1a;只…

Linux内存管理——Swap

swap space 一个磁盘区域&#xff0c;作为内存使用。当系统内存不足时&#xff0c;会将一些很久不使用的数据转移到swap space中。 优点&#xff1a;扩展了内存空间 缺点&#xff1a;用磁盘做内存&#xff0c;读写效率降低。 swappiness swappiness的值表示建议swap space替…

GtkButton事件处理、事件的捕获、鼠标事件等

事件 事件处理 GTK 所提供的工具库与其应用程序都是基于事件触发机制来管理&#xff0c; 所有的应用程序都是基于事件驱动。 如果没有事件发生&#xff0c; 应用程序将处于等待状态&#xff0c; 不会执行任何操作&#xff0c; 一旦事件发生&#xff0c; 将根据不同的事件做出…

使用 YOLO 进行自定义对象检测

使用 YOLO 进行自定义对象检测 1. 创建数据集 机器是通过数据集学习的。数据集必须包含图像和标签。例如&#xff0c;让我的目标是创建一个检测坦克的系统。 我准备了从网上下载的坦克图片。然后我们需要使用第三方工具对图像进行标记&#xff0c;例如&#xff1b;LabelImg、…

SRM系统供应链库存协同提升企业服务水平

SRM系统供应链库存协同是一种以提高供应链整体效率和竞争力为目标的管理方法。它涉及到企业与供应商之间的紧密合作&#xff0c;以实现库存优化、成本降低、风险分担和灵活响应市场变化等目标。 一、SRM供应链库存协同的概念和特点 SRM供应链库存协同是指企业与供应商之间通过…

团结引擎+OpenHarmony 记录 (持续更新中)

1 TuanjiePlayerAbility.ts 中获取 content 引用 globalThis.AbilityContext 在 TuanjiePlayerAbility.ts 中是可以获取到的 但是在 tslib 或者中 globalThis.AbilityContext 是无法获取到的GetFromGlobalThis(‘AbilityContext’); 同样 在 TuanjiePlayerAbility.ts 中是可以…

文献速递:深度学习医学影像心脏疾病检测与诊断--基于深度学习的PET图像重建与运动估计

Title 题目 Deep Learning Based Joint PET Image Reconstruction and Motion Estimation 基于深度学习的PET图像重建与运动估计 01 文献速递介绍 正电子发射断层扫描&#xff08;PET&#xff09;成像是一种非侵入性成像技术&#xff0c;通过使用放射性示踪剂在活体内可视化…

UE4_摄像机_使用摄像机的技巧

学习笔记&#xff0c;不喜勿喷&#xff01;祝愿生活越来越好&#xff01; 知识点&#xff1a; a.相机跟随。 b.相机抖动。 c.摄像机移动 d.四元数插值&#xff08;保证正确旋转方向&#xff09;。 e.相机注视跟踪。 1、新建关卡序列&#xff0c;并给小车添加动画。 2、创…