整理一下最近了解到的AIGC工具

news2024/11/15 8:28:16

AIGC工具的一点整理

  • 前言
    • AIGC类型
    • 图像生成类
      • Stable diffusion
      • Midjourney
      • DALL·E 2
      • 三种工具比较
      • DeepFloyd IF
    • 文本生成
    • 语音生成
      • So-vits-svc 4.0
    • 结尾

前言

好久没有写csdn博客了,突然不知道写点什么,最近AIGC真的很火,有一种三天不看就跟不上发展趋势的感觉,让人又激动又有点慌😂。这里我简单整理一下最近看到的AIGC的一些内容,后续如果有需要我详细描述一下如何使用。

AIGC类型

AIGC现在发展可以说是‘坐地日行八万里’了,总的来说我将目前技术较为成熟的AIGC工具大概分为三种类型,图像生成类,文本生成类,语音生成类,这三类目前均有不同程度的应用:

  1. 图像生成类 : Stable diffusion,Midjourney,DALL·E 2,DeepFloyd IF等;
  2. 文本生成类:Chat GPT,auto-GPT,GPT-4等;
  3. 语音生成类:So-vits-svc 4.0;
    下面就每一类工具,我大概描述一下他们的功能及优势劣势的比较,如有大家有兴趣我会详细讲解。

图像生成类

Stable diffusion

Stable Diffusion是一个文本到图像的潜在扩散模型,由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。目前已有大神将SD打包为本地可直接使用的工具(绘世 sd-webui),通过这个工具我们可以通过网页可视化,便捷使用文生图,图生图。
启动界面
这就是启动界面,只需要输入正向及反向prompt,调整类似图像大小,迭代步数等就可以生成各种不同类型的图像。同时还可以通过加载不同的lora及controlnet等模型来进行微调,生成自己需要的图案。
在这里插入图片描述
在这里插入图片描述

Midjourney

MidJourney 是一个文本到图像的在线服务AI,创始人是David Holz,它可以根据您的文本提示生成华丽的视觉效果。MidJourney 更喜欢用互补的颜色、光影的艺术运用、清晰的细节以及具有令人满意的对称性或透视性的构图来创建图像。

![在这里插入图片描述](https://img-blog.csdnimg.cn/155dbdd8918b4e669c1abcefd68d8b78.png在这里插入图片描述
#pic_center)
在这里插入图片描述

DALL·E 2

DALL-E 2由OpenAI开发,它通过一段文本描述生成图像。其使用超过100亿个参数训练的GPT-3转化器模型,能够解释自然语言输入并生成相应的图像。
在这里插入图片描述
在这里插入图片描述

三种工具比较

在这里插入图片描述
以上比较为个人观点,如有补充会进行修改。

DeepFloyd IF

这个是stability.ai/团队最新作品,据官方介绍,DeepFloyd IF 是最新最先进的开源文本-图像模型,拥有强大的语言理解能力,生成的图像具有高度真实感。从其官网展示了图像来看,DeepFloyd IF 生成的图像质量非常不错,也能处理多种不同的风格效果。能在图像中生成连贯清晰的文本,以及理解不同对象的属性和空间关系。比如它可以正确地将文字呈现在路牌、纸片、包装外壳等规定的媒介内;能理解文本之间的连续关系,将不同的字母或数字按顺序呈现在不同的物体上;以及分清圆球是金属的,三角形是毛茸茸的,不会将不同物体的属性弄混。
在这里插入图片描述
在这里插入图片描述

文本生成

文本生成领域现在chatgpt、autogpt和gpt4目前正在大热。目前针对chat gpt及gpt-4网络上已经有很多相关体验结果及解析,这里对三个gpt模型进行一下对比。
chat GPT和GPT-4均为OpenAI公司开发的自然语言处理模型,gpt4和chatgpt的区别在于gpt4可以处理图像内容,可以更正确的理解信息和处理问题,且回复的准确性提高不少;chatgpt不支持图像内容处理,有时还会出现错误或者矛盾的回答。此外,GPT-4支持图文语义化的解读,以及更好的回答组织能力,而chatgpt则带来了AI对语义理解的突破。
Auto-GPT 的运作方式与 ChatGPT 相同,但增加了运动功能。它将大型语言模型指令链接在一起,以实现指定的结果。该工具具有一定的决策权,可以让AI自我提示。
在这里插入图片描述

语音生成

So-vits-svc 4.0

B站大佬已经将该算法工具化,类似于sd-webui,通过可视化就可以完成语音训练及推理。
在这里插入图片描述
具体效果大家可以看B站很多AI翻唱,很让人惊艳,后续我会将各个工具的具体用法进行介绍。

结尾

以上是我的一点总结,目前AIGC工具及算法日新月异,发展很快,我总结的一些东西在我下笔的那一刻可能就已经过时了。学无止尽,能亲身经历人工智能的发展,真的是幸事。另外,给自己打个广告,有没有做这个的一起玩儿啊😂。

下面是一些工具链接
Stable diffusion,Midjourney,DALL·E 2,DeepFloyd IF等;
2. 文本生成类:Chat GPT,auto-GPT,GPT-4等;
3. 语音生成类:So-vits-svc 4.0;
[1]: sd-webui :https://www.bilibili.com/read/cv22661198
[2]: Midjourney:https://www.midjourney.com/home/
[3]: DALL·E 2:https://labs.openai.com/
[4]:DeepFloyd IF:https://deepfloyd.ai/deepfloyd-if
[5]:Chat GPT:https://chat.openai.com/
[6]:auto-GPT:https://github.com/Significant-Gravitas/Auto-GPT
[7]:GPT-4:https://openai.com/product/gpt-4
[8]: So-vits-svc 4.0:https://github.com/voicepaw/so-vits-svc-fork/blob/main/README_zh_CN.md

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/498782.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算机系统-异常控制流

例行前言: 本篇不是学习课程时的笔记,是重看这本书时的简记。对于学习本课程的同学,未涉及的内容不代表考试不涉及。核心内容是信号部分。本章内容介绍了较多的信号处理函数,需要在实验中巩固本章所学内容及相关问题的处理(并发&…

五彩斑斓的黑:Fun with PyQt5+CMake+C++

Fun Pain Fun with PyQt5CMakeC 本文相关代码GitCode地址 这个项目与PyQt5只有半毛钱关系。事情是这样发生的。当时,我在一个新电脑上干活,装了miniconda,装了PyQt5,干着干着突然要整一个Qt5。我想也挺好,据说C 17里…

Node.js和在浏览器之中的不同

在Node.js中编写JavaScript应用程序与在浏览器中为Web编程有何不同 1、在浏览器中,大多数时候您所做的是与DOM或其他Web平台API(如Cookie)进行交互。当然,Node.js中并不存在这些。您没有浏览器提供的文档、窗口和所有其他对象。 …

让测试更轻松:学习Selenium进行Web应用程序自动化测试

B站首推!2023最详细自动化测试合集,小白皆可掌握,让测试变得简单、快捷、可靠https://www.bilibili.com/video/BV1ua4y1V7Db 目录 摘要: 什么是Selenium 安装Selenium 编写自动化测试脚本 第一步:导入Selenium库 …

前端006_头部快捷导航_标签导航栏

效果如下,红色方框里面有快捷导航 1、添加标签栏导航组件 拷贝vue-element-admin 的 @/layout/components/TagsView 目录及文件到 mengxuegu-blog-admin 对应目录下 [root@pgdb vue-element-admin]# cp -r src/layout/components/TagsView ../db-manager-system/src/layou…

UE蓝图基础学习笔记(未完待续2023/05/06)

文章目录 一、项目创建1)准备流程(选择模板、开发语言、平台、质量等)2)界面介绍 二、Actor三、操作关卡对象(旋转、移动、缩放和坐标轴)四、常用快捷键五、运行游戏六、蓝图介绍七、蓝图节点八、操作事件图…

Vben Admin 自学记录 —— Drawer组件的基本使用及练习(持续更新中...)

Drawer 抽屉组件 对 antv 的 drawer 组件进行封装,扩展拖拽,全屏,自适应高度等功能。 Drawer相关使用及概念 练习 —— 在之前table基础上,添加查看功能,点击查看按钮,弹出抽屉显示单条表格数据&#xf…

基于80C51单片机的电子钟设计与仿真

点击链接获取Keil源码与Project Backups仿真图: https://download.csdn.net/download/qq_64505944/87761539?spm1001.2014.3001.5503 源码获取 主要内容: 电子钟是一种利用数字电路来显示秒、分、时的计时装置,与传统的机械钟相比&#xf…

SpringBatch之实际操作

文章目录 1 SpringBatch操作1.1 SpringBatch介绍1.2 依赖配置相关1.2.1 pom.xml1.2.2 mysql 依赖库表1.2.3 启动配置1.2.4 数据库配置 1.3 示例Demo1.3.1 简单执行1.3.2 报错 1.4 流程控制1.4.1 多步骤任务1.4.2 Flow用法1.4.3 并发执行1.4.4 任务决策1.4.5 任务嵌套 1.5 数据操…

Illustrator如何使用图层与蒙版之实例演示?

文章目录 0.引言1.绘制可爱冰淇淋图标2.霓虹渐变立体文字海报3.炫彩花纹背景 0.引言 因科研等多场景需要进行绘图处理,笔者对Illustrator进行了学习,本文通过《Illustrator CC2018基础与实战》及其配套素材结合网上相关资料进行学习笔记总结,…

电影推荐算法2

模型创建 title _ count, title _ set, genres2int, features, targets _ values, ratings, users, movies, data, movies _ orig, users _ orig pickle.load (open (‘preprocess.p’, mode ‘rb’)) 加载数据后定义神经网络的模型结构: 1)定义参数…

u盘文件名乱码的恢复方法

文件名全部变乱码了怎么恢复?U盘数据恢复方法 电脑里的目录文件名乱码了,这是什么状况呢?好端端的电脑突然就成这个样子了,真是令人摸不着头脑,对于这样的状况,多半是文件类型引起的,那么接下来…

Python:Python进阶:Python整数与 Numpy的数据溢出

numpy数据溢出 1.python 3 的整数上限和 python 2 的整数上限1.1 python 2的整数范围1.2 python 3 的整数范围 2. numpy数值表示2.1 那么numpy支持的数据类型和 python有什么不同了2.2 如何解决整数溢出问题 总结 实验一:使用 numpy库来表示正数 import numpy as n…

redis(4)

1)使用StringTemplateRedis操作String类型 1)判断redis中是否拥有key所对应的值,如果有返回true,没有那么直接返回false redisTemplate.hasKey(key); 2)如果redis中有key那么直接取出key所对应的值 redisTemplate.opsForValue().get(key) 3)删除单个key值…

2023.05.07 学习周报

文章目录 摘要文献阅读1.题目2.现存问题和解决方法3.本文贡献及相关工作4.GRU5.模型5.1 SESSION-PARALLEL MINI-BATCHES5.2 SAMPLING ON THE OUTPUT5.3 RANKING LOSS 6.实验6.1 准备6.2 基线6.3 优化6.4 结果 7.结论 数学建模1.综合评价模型的一般步骤2.层次分析法3.主成分分析…

【Java】中的多线程线程锁

多线程 文章目录 多线程线程的创建和启动sleep()stop() 线程的休眠和中断线程的优先级线程的礼让和加入yield()stop() 线程锁和线程同步synchronized 关键字 死锁概念 wait & notify methodThreadLocal的使用定时器 Timer守护线程再谈集合类parallelStreamforEachOrdered()…

怎么将三张图片合成一张图片?

怎么将三张图片合成一张图片?遇到这个问题,我们其实有很多方法来处理。我们首当其冲想到的是其中最常见的,可以使用我们手机的APP来处理,比如某秀秀等。但是此方法比较适合于尺寸比较小的图片进行合并,如果图片比较大的…

Dockerfile创建镜像文件

Dockerfile Docker镜像原理 Linux文件系统有bootfs和rootfs两部分组成 Docker镜像由特殊文件系统叠加 最底端bootfs,使用宿主机bootfs 第二次时rootfs,被称为基础镜像 向上可以叠加其他镜像文件 同一文件系统能将多层整合成一层,隐藏了多层存在 镜像可以放置…

智能优化算法:鱼鹰优化算法-附代码

智能优化算法:鱼鹰优化算法 文章目录 智能优化算法:鱼鹰优化算法1. 鱼鹰优化算法1.1 初始化1.2 阶段一:定位和捕鱼(探索阶段)1.3 阶段二:把鱼带到合适的位置(开发阶段) 2.实验结果3.…

RISC-V U-Boot 启动 Linux 内核的参数

RISC-V U-Boot 启动 Linux 内核的参数 U-Boot (the Universal Boot Loader简写U-Boot) flyfish U-Boot 启动Linux内核的参数举例说明 RISC-V U-Boot 启动 Linux 内核的参数方式一 文本操作earlyprintksunxi-uart,0x02500000clk_ignore_unusedconsolettyS0,115200init/sbin/i…