给想玩AIGC的小白:教你从0搭一个图文视频生成网站(附插件源码)

news2024/11/17 7:42:40

Stable Diffusion的发布是AI图像生成发展过程中的一个里程碑,相当于给大众提供了一个可用的高性能模型,让「AI 文本图片生成」变成普通人也能玩转的技术。最近一些网友将网上的真人图片不断喂给模型,让其自主学习,训练出来的效果已经可以做到以假乱真——你甚至不知道哪些图片是 AI 生成的还是真人拍出来的。你感兴趣吗?今天这篇文章从零开始,手把手教你如何搭建自己的真人 AI 网站。强烈建议收藏(不管是否吃灰)。

👉看目录,点收藏

1. 搭建你自己的 AI 网站

2. 模型下载

3. 汉化插件下载

4. 生成你的真人图片

4.1 生成真人图片

4.2 不同风格图片生成

4.3 动画视频生成

5. 让你生成的图片开口说话

01、搭建你自己的AI网站

本篇我们将单刀直入教各位最快搭建出一个质量不错的 AI 网站,如果各位想了解相关的原理、技术点,可以留言告诉我们。下文会提及的模型、插件和源码,我们也一并提前为各位整理~大家看到文末添加一下,即可领取。

第一步,我们可以直接使用 GitHub 仓库:

stable-diffusion-webui。

图片

首先,在电脑上安装 python 3.10.6,如果已经安装了其他 python 版本,可以利用 conda 安装多一个 3.10 的虚拟环境版本:

conda create -n novelai python==3.10.6

接下来下载该仓库的代码:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

再安装对应的 GPU 版本的 Pytorch,直接进入网站:

pytorch.org/get-started…

图片

进入刚刚创建的虚拟环境”novelai“:

图片

执行刚刚的命令:

./python -m pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116

安装成功后,可以测试自己的 pytorch 版本是否可以跑通。

图片

进入刚刚下载的 Github 仓库的代码文件夹,安装第三方依赖:

python -m pip install -r requirements.txt

02、模型下载

有了网站之后,就需要下载对应的 AI 模型进行有效生成。一些网友已经利用网上大量的图片训练好的模型,并分享到网站上。我们举个例子:

civitai.com/

这个大名鼎鼎的网站被人们称为「C 站」,里面有很多你意想不到的模型。

图片

可以在这个网站上找到很多已经训练好的模型。例如找一个生成真人图片的模型:ChilloutMix。从网页上下载对应的模型后,把该模型放到工程目录:models/Stable-diffusion。

图片

图片

03、汉化插件下载

stable-diffusion-webui 这个项目还支持下载第三方插件。例如我们可以下载对应的汉化插件。其下载地址如下:
文末领取!

登陆上面网站后,就可以下载插件的安装包:

图片

然后将文件解压放到 extensions 目录下:

图片

接着,就需要对网页进行重启服务:

图片

在扩展这里,把插件勾上:

图片

在“设置”选项里,找到 zh_CN,最后需要重新启动网页,就可以生效了:

图片

图片

04、生成你的真人图片

启动主程序"launch.py",等待一定的时间出现网页地址就可以了。

图片

打开网址时,有时候可能模型没有更新。因此可以尝试一下多次重启。需要选择刚刚下载的模型:ChilloutMix。

图片

这样就已经完成前期的部署工作了。接下来详细教大家怎么生成自己想要的图片。

4.1 生成真人图片

在c站上,已经有很多大神利用 promt 生成图片了,因此我们就可以对这些进行参考。例如找一个好看的图片,对下面的 Prompt 词语进行复制:

图片

其中 Prompt 词语放在提示词框内,消极 Prompt 词语放在对应的方框内。同时调整对应的参数,最后就可以生成真人图片:

图片


4.2 不同风格图片生成

在 C 站上,还有很多 Lora 模型可以进行下载。这是一种可以帮助你调整画风的小模型。主要是放到 Prompt 中进行使用。例如我们可以在网站上下载原神的 Lora 模型:

图片

‍下载完成后,把模型放到 models/Lora 路径下:

图片

按照图片下的步骤,选中模型后,会看到具体的 Prompt 在方框内了:

图片

把步骤 4.1 中的 Prompt 词语加入到这里,就可以生成一个原神风格的图片:

图片


4.3 动画视频生成

首先需要安装插件 “deforum” 这个插件能够根据多个生成的图片构造成视频动画。

在当前 stable-diffusion 目录下,执行下面命令,就会发现 extensions 多了新的插件:

git clone https://github.com/deforum-art/deforum-for-automatic1111-webui extensions/deforum

图片

同时重启新的网页,会发现多了 deforum 这个选项:

图片

可以先执行简单的生成,在提示词上,已经默认填写了语句:

{  
    "0": "tiny cute swamp bunny, highly detailed, intricate, ultra hd, sharp photo, crepuscular rays, in focus, by tomasz alen kopera",  
    "30": "anthropomorphic clean cat, surrounded by fractals, epic angle and pose, symmetrical, 3d, depth of field, ruan jia and fenghua zhong",  
    "60": "a beautiful coconut --neg photo, realistic",  
    "90": "a beautiful durian, trending on Artstation"  
}

Prompt 词语模板解释如下:

//Abstracted Example  
{  
    "0": "Prompt A --neg NegPompt"  
    "12": "Prompt B"   
}

其中“0”和“12”提示在插值中解析的关键帧。Prompt A 和 B 是肯定提示,NegPrompt 是否定提示。当然,也可以直接用上面 C 站下载下来的模型,生成真人动画。

05、让你生成的图片开口说话

从上面我们已经得到了生成的图片。那么就可以利用这张图片,创建自己的 AI 说话视频。登陆这个网址:

studio.d-id.com/

图片

选择刚刚生成的图片,然后输入自己想要说的话,之后生成就可以了:

图片

最后就可以得到比较逼真的真人 AI 说话视频了。

有了这个技术,就可以批量制作二次元甚至是真人说话视频。这对于 AICG 这个行业是一个颠覆性的技术,相信未来这个技术在多个领域上都能够推广开来。

写在最后

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1712501.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024年社会发展、人文艺术与文化国际会议(ICSDHAC 2024)

2024年社会发展、人文艺术与文化国际会议(ICSDHAC 2024) 会议简介 2024年国际社会发展、人文、艺术和文化会议(ICSDHAC 2024)将在广州举行。会议旨在为从事社会发展、人文、艺术和文化研究的专家学者提供一个平台,分…

VI 使用替换命令快速注释多行

使用替换命令快速注释多行: 按下 Esc 键确保你在普通模式下。输入 :起始行号,结束行号s/^/#/ 并按 Enter 键。 :起始行号 和 结束行号 分别是你要注释的起始行和结束行的行号。 关于正则 s/^/#/各个部分解释: s/: 这是vi编辑器中的替换命令的开头。s 表…

音视频开发10 FFmpeg 内存模型-AVPacket, AVFrame

从现有的 Packet 拷贝一个新 Packet 的时候,有两种情况: • ①两个 Packet 的 buf 引用的是 同一数据缓存空间 ,这时 候要注意数据缓存空间的释放问题; • ②两个 Packet 的 buf 引用不同的数据缓存空间 ,每个 Pac…

[ARM-2D 专题] arm-2d配套开发工具准备

arm-2d 提供了配套的图片转换工具img2c.py和字体转换工具ttf2c.py,工具用python语言编写,所以需要先安装python及其相关的支持包。 从python网站可以下载到最新的安装版本,根据你自己的电脑配置选择。 python的相关信息: 官网: ht…

linux系统安装软件

目录 linunx系统安装软件的方法 rpm yun命令 基本介绍 2.安装 升级、卸载的指令完成 linux 系统中如何使用设备 怎么用 创建本地源 在线仓库 第三方在线仓库 linunx系统安装软件的方法 源码安装 类似于 exe rmp安装 安装包 rmp yun安装 rmp 的升级版 源码安装 源码…

多线程新手村4--定时器

定时器是日常开发中很常见的组件,定时器大家可能不知道是干什么的,但是定时炸弹肯定都听过,定个时间,过一段时间后bomb!!!爆炸 定时器的逻辑和这个一样,约定一个时间,这…

Linux服务器安装与配置python环境 最新linux安装python 小白教程

目录 一、下载官网的安装包 二、安装流程 三、配置软连接(类似window系统的环境变量) 四、可能会出现的问题: 1.ssl连接问题,下图所示: 一、下载官网的安装包 1.官网安装包地址:https://www.python.org/…

回溯算法04(leetcode93、78、90)

参考资料: https://programmercarl.com/0093.%E5%A4%8D%E5%8E%9FIP%E5%9C%B0%E5%9D%80.html 93. 复原 IP 地址 题目描述: 有效 IP 地址 正好由四个整数(每个整数位于 0 到 255 之间组成,且不能含有前导 0)&#xff0…

突破空间限制,这些远程控制软件为父母送上“手把手”的教导,解决异地办公难题,出差无忧

在现代社会,科技的飞速发展带来了诸多便利,但同时也给一些年长的父母们带来了困扰。 当父母们面对智能手机电脑等高科技产品时,他们往往感到无所适从,而子女们忙于工作、学习或其他原因,常常无法时刻陪伴在父母身边&a…

Java版招投标管理系统源码:优化流程,提升效率,实现全方位项目管理

在现今日益竞争激烈的招标市场中,企业需要一款强大而灵活的招投标管理系统来优化流程、提升效率。我们的招投标管理系统正是为此而生,它集门户管理、立项管理、采购项目管理、公告管理、考核管理、报表管理、评审管理、企业管理、采购管理和系统管理等多…

Android Ktor 网络请求框架

Ktor 是一个由 JetBrains 开发的用于 Kotlin 编程语言的应用框架,旨在创建高性能的异步服务器和客户端应用程序。由于完全基于 Kotlin 语言,Ktor 能够让开发者编写出简洁、可读性强且功能强大的代码,特别适合那些已经熟悉 Kotlin 的开发人员。…

如何利用Firebase Hosting来托管网站

文章目录 如何利用Firebase Hosting来托管网站前提条件详细步骤1. 安装 Firebase CLI2. 登录 Firebase3. 初始化 Firebase 项目4. 准备网站文件5. 部署到 Firebase6. 配置自定义域名(可选) 常见问题 如何利用Firebase Hosting来托管网站 以下是更详细的…

【领导力SE模型影响地图】如何分辨一个管理者有没有好的领导力? ​

影响地图是以思维导图的形式,在业务目标和交付物之间建立起强关联。 影响地图分为四个层级: 第1层级:目标(Why)- 想要达成的业务目标。 第2层级:利益相关者(Who)- 谁能够帮助达成…

基础8 探索JAVA图形编程桌面:邮件操作组件详解

在一个静谧的午后,卧龙和凤雏相邀来到一家古朴典雅的茶馆。茶馆内环境清幽,袅袅的茶香与悠扬的古筝声交织在一起,营造出一种宁静而祥和的氛围。 卧龙和凤雏坐在茶馆的一角,面前的桌子上摆放着一套精致的茶具。茶香四溢&#xff0c…

重构2:重构的原则

最近在看重构2:改善既有代码的设计这本书,对于代码重构指导非常有帮助,然后也是做个笔记记录下,以下是我阅读本书的前两章的时候整理的思维导图:

Leetcode3165. 不包含相邻元素的子序列的最大和(Go中的线段树分治包含多类数据使用maintain进行维护)

题目截图 题目分析 不能取相邻的,就是打家劫舍 然后更改某一个值就是单点更新 更新后,需要更新区间的值 需要注意的是,使用分治时需要考虑到一头一尾的问题,所以有4种情况(选or不选在两个位置) 这四种情况…

【机器学习系列】掌握随机森林:从基础原理到参数优化的全面指南

目录 目录 一、随机森林简介 (一)随机森林模型的基本原理如下: (二)随机森林模型的优点包括: (三)森林中的树的生成规则如下: (四)在随机森林中,每棵树都使用不同的训练集进行训练,原因如下 随机森林的分类性能&…

【Linux进程篇】Linux内核——程序地址空间的初构

W...Y的主页 &#x1f60a; 代码仓库分享&#x1f495; 程序地址空间回顾 我们在讲C语言的时候&#xff0c;大家应该都见过这样的空间布局图&#xff1a; 为了更好的验证不同的数据在内存中的存储位置&#xff0c;下面这段代码我们可以去实验一下&#xff1a; #include<…

眼精星和金鸣识别新增智能结构化识别,助您快速筛选和统计数据

熟悉眼精星票证识别系统或金鸣表格文字识别大师的用户都知道&#xff0c;近日&#xff0c;这二款软件同时上线了“智能结构化”功能&#xff0c;那么&#xff0c;什么是智能结构化呢&#xff1f; 准确地说&#xff0c;我们这里的智能结构化应为OCR智能结构化&#xff0c;因为它…

Docker Hub 国内镜像源配置

Docker Hub 国内镜像源配置 Docker Hub 国内镜像源是指在国内境内提供 Docker 镜像服务的镜像源。由于国际网络带宽等问题&#xff0c;国内用户下载 Docker 镜像通常速度较慢。因此&#xff0c;为了解决这个问题&#xff0c;一些国内的公司和组织提供了 Docker 镜像的国内镜像…