AIGC文生图及工具产品简介

news2024/11/24 7:36:39

AIGC,全称是人工智能生成内容(Artificial Intelligence Generated Content)是继UGC(用户生成内容),PGC(平台生成内容)后,利用人工智能技术,自动生成内容的生产方式;
目前主要利用&集成自然语言处理、计算机视觉、语音生成等算法训练生成式大模型,且已经从纯文本生成、纯图像生成拓展到了跨模态的内容理解与生成,促进了更接近普通人定义的“智慧”的加速涌现。

目前商业项目的美术现在的流程一般是MJ起手做概念扩展,定型后用lora练自己的风格或角色,然后SD+controlnet量产。

目前市场上的主要产品:

TIPS:

  • 开源平台比如StableDiffusion的话可以先用GPT生成更细致准确的prompt语句,然后跟AI绘画串联使用,大部分商用平台已经集成了用户语言->模型提示语的这一步,对prompt要求不那么敏感;Midjourney精准词汇总结 - 设计经验 - 素材集市
  • 对于普通用户基本足够,专业需求比如生成logo、海报、广告等依然需要设计师精修,且大部分平台同时支持以图生图(图像编辑);
  • 已有较多设计师/原画师采用AI绘图进行辅助,应用在了logo设计、儿童读物的插图、新闻通讯的艺术图、游戏的概念艺术和角色图等方面,注意自己的套餐是否支持商业用途使用

一些常用概念:

Midjourney

  • 定位:Midjourney是一款AI绘画工具,搭载在Discord社区上,目前在discord上有着较为活跃的用户群体,交互体验较好,新用户免费试用次数25次(刷新小图、重做、优化都会消耗),付费基础版本10刀/月,年用户8刀/月。
  • 注册:需要先下载并注册discord(聊天软件,起家是游戏聊天应用与社区,类似美版YY语音,21年被微软收购,需要挂Seal全局),搜索MidjourneyBot,加载/创建服务器,授权验证,在机器人聊天框中输入【/imagine + 你的prompt语句】进行生成。

小红书-midjourney使用教程

DALL-E2

  • 定位:OpenAI推出的文本生成图像系统https://openai.com/product/dall-e-2
  • 方法:一种层级式的基于CLIP特征的根据文本生成图像模型,在图像生成时,先生成64*64再生成256*256,最终生成更精美的1024*1024的高清大图。DALLE·2模型根据CLIP的文本特征和图像特征最终生成图像,可以看做CLIP的反向过程,因此DALLE·2被作者称为unCLIP。

Stable Diffusion WebUI

  • 定位:一个基于 Stable Diffusion 的基础应用,利用 gradio 模块搭建出交互程序,后端依旧是Stable Diffusion以及一系列相关的工具包,提供了txt2img、img2img、inpaint 等多种功能,还包含了许多模型融合改进、图片质量修复等附加升级。贵在开源,可以在上面训练我们自己的模型,或者在社区里下载别人的模型。
  • 使用:目前提到SD更多是指这套开源框架,大家一般在模型分享站下载模型,原生的模型效果并不好。SD搭建后可以安装插件,加载controlnet、lora等拓展功能。
    • Git clone 项目地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui
    • 模型下载:https://huggingface.co/runwayml/stable-diffusion-v1-5 【这是基础的SD1-5版本,可以用来ft】
    • 详细教程:https://zhuanlan.zhihu.com/p/63

LoRA(定向生成)

LoRA的算法原理简单理解就是外挂一个由少量图片定制训练的小模型,去影响原本的生成大模型;一般用来做角色或画风,比如给若干张类似的图(特朗普), 然后生成的时候都是他。

LoRA本身是Low-Rank Adaption of large language model的缩写,这个方法是一种大语言模型fine-tune的方法。主要思路是在固定大网络的参数,并训练某些层。

外挂一个LoRA小模型(可以在HuggingFace上下载),并设置权重参数,用<>加在prompt语句中即可触发,例如<lora:koreanDollLikeness_v10:0.66>,这样用少量prompt描述语句就可以得到更定向的结果,减少微调。

ControlNet插件

现在的 AI 绘画技术主要采用了一种名为扩散模型的方法,这种方法能够使生成的图片呈现出独特且富有趣味性的效果。然而,这种方法也存在一个显著的问题,那就是生成的图片可控性非常差。在某些情况下,生成的图片可能会非常精美,而在其他时候,效果却可能不尽如人意。这使得设计师在使用此类工具时,很难确保能够满足客户的具体需求。

然而,随着一种名为 ControlNet 的新技术的出现,这一局面得到了改善。ControlNet 能够帮助设计师更好地控制 AI 绘画过程,从而使这个工具更加符合他们的实际工作需求。AI 绘画不再仅仅是一个供人们娱乐的小玩具,而是逐渐发展成为一种能够真正帮助设计师提高工作效率的实用工具。虽然目前 ControlNet 的可控性仍然有待提高,但与之前的技术相比,它已经实现了质的飞跃。

Controlnet 插件的本质是利用图像作为输入信息的方式,以弥补语言在某些情况下的局限性。相对于语言而言,图像更加直观、简洁、易于理解,能够更加准确地传达信息。因此,Controlnet 利用图像作为输入方式,可以更好地帮助 AI 理解我们的需求,从而生成我们所需要的图片。

在图片中,包含了多种信息,例如线条轮廓、表面凹凸等。Controlnet 插件的工作原理是使用特定的模型提取出特定的图像信息,然后将其输入给 AI,引导 AI 生成图片。

总的来说,我们可以将使用图片作为提示词视为补充语言的方式。这里补充一下,在文生图和图生图中用 controlnet 插件的区别,一句话说明白,需要生成新的图片用文生图,在原有图片上优化使用图生图。

其它产品:文心一格、字节豆包

百度文心一格

  • 定位:百度依托飞桨、文心大模型推出的“AI 作画”产品。
  • 注册:百度账号即可https://yige.baidu.com/。
  • 注意:由于各种风险控制,百度的关键词屏蔽非常多,一旦设计敏感词汇就生成不成功。
  • 商业化:有应用场景跳转链接,付费定制马克杯、手机壳、帆布袋等相关产品,价格不贵容易产生消费欲望。

字节豆包

  • 体验链接:https://www.doubao.com/
  • 定位:字节跳动推出的对标ChatGPT的产品,目前免费且无需排队;有语音功能,哄娃讲故事一把好手,用来学英语也非常方便;图片生成上相对比较小白,直接描述想要的图片画面就行,会有相关提示进一步细化描述;最近,字节的BuboGPT的多模态大模型也在huggingface上推出了Demo,预测之后也会在豆包上集成多模态大模型的功能,支持图文交互内容理解。
  • 注册:网页版、安卓版和iOS版同步上线,用抖音账号、手机号和苹果账号都能登录。

SD 的学习曲线。

  1. 先学最基础的,大概理解参数模型提示词的用途,先把 SD 的流程跑通,这一步大概可以做出来相对看得过去的图了
  2. 然后再去研究模型和提示词的高级用法,比如,混用 lora 模型,提示词的分步和融合写法,这个时候,必然会涉及到一些原理性的东西,就会理解为什么 AI 画不好手了。到这一步,可以对图进行针对性的优化了,比如说一个图怎么达不到提示词想要的效果,可以针对性地优化提示词。
  3. 学习其他功能,图生图,Control net 插件,以及分层控制 Lora 模型等进阶功能。
  4. 训练自己的模型

还没有安装Stable Diffusion 软件的朋友可以网上自己找安装一下,或者看本人往期的详细安装教程,安装包:https://item.taobao.com/item.htm?ft=t&id=720790767379这个0.1元的网上很多

civitai网站(C站)的模型打包下载:https://item.taobao.com/item.htm?ft=t&id=722030250111

对于没有魔法工具的人来说,直接下载完整的模型包是比较划算的,因为C站上很多早期的作品都下架了,现在再去找,很多优秀作品都没法找到

AI绘画(文生图)应用分享 - 知乎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1258749.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

无mac电脑生成uniapp云打包私钥证书的攻略

uniapp顾名思义是一个跨平台的开发工具&#xff0c;大部分uniapp的开发者&#xff0c;其实并没有mac电脑来开发&#xff0c;但是生成ios的证书&#xff0c;官网的教程却是需要mac电脑的&#xff0c;那么有没有办法无需mac电脑即可生成uniapp云打包的私钥证书呢&#xff1f; 下…

深入理解计算机中的程序

目录 程序的存储 程序的编译过程 各位宝宝好&#xff0c;我们这次从计算机底层来讲一下程序是如何存储&#xff0c;编译的 程序的存储 我们拿一个最简单的程序来举个例子&#xff1a; #include<stdio.h> int main() {printf("hello world");return 0; } …

吐血整理,Jmeter性能测试常见问题+解决汇总(详细)

目录&#xff1a;导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09; 前言 1、request 请求超…

【好书推荐-第30期】开发者请注意!因果推断与机器学习,终于有人能讲明白啦!

本文目录 一、因果推断二、因果推断的前世今生三、总结四、赠书条件 今天给各位读者推荐一本好书&#xff1a;《机器学习高级实践&#xff1a;计算广告、供需预测、智能营销、动态定价》&#xff0c;好书链接。 2023年初是人工智能爆发的里程碑式的重要阶段&#xff0c;以Open…

Linux MeterSphere一站式开源持续测试平台远程访问

文章目录 前言1. 安装MeterSphere2. 本地访问MeterSphere3. 安装 cpolar内网穿透软件4. 配置MeterSphere公网访问地址5. 公网远程访问MeterSphere6. 固定MeterSphere公网地址 前言 MeterSphere 是一站式开源持续测试平台, 涵盖测试跟踪、接口测试、UI 测试和性能测试等功能&am…

C++ 红黑树插入详解

前言 在之前&#xff0c;我们学习了AVL树&#xff0c;知道了AVL树是一个平衡二叉搜索树&#xff0c;如果没学过AVL树&#xff0c;这篇文章看起来会很吃力&#xff0c;不清楚如何旋转的&#xff0c;建议可以先看AVL树的内容。 今天我们要学习的红黑树&#xff0c;他也是一颗平衡…

串口通信 HAL库+cubeMX

一.通信的基本概念 1.串行通信和并行通信 2.全双工、半双工和单工 3.针对串行通信的同步通信和异步通信 4.通信速率 二.UART配置 UART常用HAL库函数 //UART_HandleTypeDef *huart是句柄typedef struct {//初始化看前面两个就可以了USART_TypeDef *Instance; /* UART 寄存器…

软件提示vcruntime140_1.dll文件丢失解决方法,和vcruntime140_1.dll丢失原因分析

vcruntime140_1.dll是Visual C Redistributable Packages的一部分&#xff0c;它是Microsoft Visual C 2015 Update 3运行时库文件。它包含了许多C标准库函数的实现&#xff0c;这些函数在运行使用C编写的程序时会被调用。所以我们在打开运行软件时候如果计算机中的vcruntime14…

(十三)Flask之特殊装饰器详解

目录&#xff1a; Flask中用作装饰器的特殊的函数第一部分&#xff1a;before_request和after_request一、 before_request装饰器&#xff1a;二、after_request装饰器&#xff1a;三、多个before_request和after_request执行流程分析&#xff1a; 首先—理论讲解&#xff1a;然…

Java核心知识点整理大全18-笔记

Java核心知识点整理大全-笔记_希斯奎的博客-CSDN博客 Java核心知识点整理大全2-笔记_希斯奎的博客-CSDN博客 Java核心知识点整理大全3-笔记_希斯奎的博客-CSDN博客 Java核心知识点整理大全4-笔记-CSDN博客 Java核心知识点整理大全5-笔记-CSDN博客 Java核心知识点整理大全6…

沈阳陪诊系统|陪诊软件开发功能

陪诊小程序的出现它可以帮助患者或家属解决就医过程中的各种问题。根据数据显示&#xff0c;2021年中国陪诊市场规模约为36.7亿元&#xff0c;预计到2025年将达到100亿元。同时&#xff0c;在医疗行业数字化转型的大背景下&#xff0c;陪诊微信小程序作为一种创新的医疗服务模式…

ABAP: JSON 报文解析——/ui2/cl_json

1、JSON数组 报文格式如下&#xff0c;是JSON 数组类型的。 [{"I_TYPE":"V","I_BUSINESSSCOPE":"1001"},{"I_TYPE":"V","I_BUSINESSSCOPE":"1002"} ] json转换为SAP内表&#xff1a; TYP…

二 使用GPIO的复用功能 利用USART 实现printf()

参考这篇&#xff1a; STM32串口通信详解 1. 关于USART USART ( universal synchronous / asynchronous receiver /transmitter) 是一种串行通讯协议 , 允许设备通过串行端口进行数据传输&#xff0c; USART 能够以同步或者异步的方式进行工作&#xff0c;在实际的运用中&…

机器学习的复习笔记4-岭回归与多项式回归

一、岭回归 在简单的线性回归中&#xff0c;一味追求平方误差最小化&#xff0c;R2值尽可能大&#xff0c;可能会受到噪声的严重干扰。噪声&#xff0c;即偶发的错误的值。 如图&#xff0c;若为满足所有点的拟合&#xff08;虚线&#xff09;&#xff0c;表面上看R2值小&…

虚拟偶像的商业化

虚拟偶像的商业化主要通过以下几种方式实现&#xff1a; 直播与内容&#xff1a;虚拟主播在各大平台进行直播&#xff0c;提供音乐、游戏、教育等内容。收益主要包括Super Chat&#xff08;直播打赏&#xff09;、收费会员&#xff08;支付月费后成为该频道会员&#xff0c;可…

如何使用WMS仓储管理系统实现流程优化

随着企业对于物流管理的需求日益增长&#xff0c;自动化WMS仓储管理系统已经成为了现代企业的核心工具之一。通过引入信息化技术&#xff0c;我们可以实现仓库管理流程的不断调整和优化&#xff0c;从而更好地满足客户的多样化需求。 一、信息化技术的引领 在现代仓库管理中&a…

Docker和Kubernetes:区别与优势对比

在现代软件开发和部署中&#xff0c;Docker和Kubernetes是两个备受关注的技术。本文将对Docker和Kubernetes进行比较&#xff0c;探讨它们的区别和各自的优势。 引言 在过去的几年中&#xff0c;容器技术得到了迅速的发展&#xff0c;并且在现代软件交付和部署中扮演着越来越重…

如何获取抖音订单列表

怎么获取订单列表接口 请求地址&#xff1a;响应参数以及示例

为什么我用 AI 做不出好看的图?好说给你划重点

最近一个月&#xff0c;我们介绍了些实用的 AI 绘画教程&#xff0c;不知道看过的你是学会了吗&#xff1f;有不少朋友和小编说&#xff0c;有了这些教程&#xff0c;用好说 AI 的指令做起图来比 SD 方便了不少。 不过也有朋友就和小编抱怨&#xff1a;“你教程里的和我做出来…

Flask 实现Token认证机制

在Flask框架中&#xff0c;实现Token认证机制并不是一件复杂的事情。除了使用官方提供的flask_httpauth模块或者第三方模块flask-jwt&#xff0c;我们还可以考虑自己实现一个简易版的Token认证工具。自定义Token认证机制的本质是生成一个令牌&#xff08;Token&#xff09;&…