AI时代-普通人的AI绘画工具对比(Midjouney与Stable Diffusion)
- 前言
- 1、基础对比
- Stable Diffusion(SD)
- SD界面
- 安装与使用SD
- Midjouney(MJ)
- 2、硬件与运行要求对比
- Stable Diffusion硬件要求
- 内存
- 硬盘
- 显卡
- Midjouney硬件要求
- 要求1
- 要求2
- 要求3
- 3、操作(使用)难度对比
- Stable Diffusion
- Midjourney
- 4、出图效果对比
- Stable Diffusion
- Midjouney
- 总结
前言
在当前技术环境下,AI大模型学习不仅要求研究者具备深厚的数学基础和编程能力,还需要对特定领域的业务场景有深入的了解。通过不断优化模型结构和算法,AI大模型学习能够不断提升模型的准确性和效率,为人类生活和工作带来更多便利。
2023年被视作人工智能领域的爆发之年,以ChatGPT为代表的AI模型如同雨后春笋般迅猛增长。基于AIGC(人工智能内容生成)技术的各类产品纷纷涌现,尤其是众多的AI绘图模型,例如Midjourney、Dreambooth、Novel AI和Stable Diffusion等,它们在社会上得到了广泛的应用。
虽然AI绘图领域,看似进入了百花齐放的时代,但目前业内的顶流,仍然是Stable Diffusion和Midjourney为代表的两大龙头。
希望大家看完这篇博客之后能够选择更为适合自己的AI绘画工具!
1、基础对比
Stable Diffusion(SD)
它由创业公司Stability AI与多个学术研究者和非营利组织合作开发。目前的SD的源代码和模型都已经开源,在Github上由AUTOMATIC1111维护了一个完整的项目,正在由全世界的开发者共同维护。
SD最大的特征,就是由于其开源的特性,可以在电脑本地上离线运行。
敏锐的捕捉关键词:
【开源】—>【免费】
【本地离线】—>【可以嘿嘿嘿不用担心社死】
SD界面
对于我这种白嫖党还是很友好的,基本有台电脑就能玩(你要想炼丹,那还是搞张40系吧)
简单提一嘴如何去安装:
安装与使用SD
很多大佬都弄了sd的启动器,比如:
详细可以参考这篇博客: stable diffusion webUI之赛博菩萨【秋葉】——工具包新手安裝与使用教程
Midjouney(MJ)
Midjourney是一款由总部位于旧金山的独立研究实验室Midjourney, Inc.创建和托管的人工智能程序和服务。Midjourney基于【Discord平台】提供服务,可以根据语言描述prompt(被称为“提示词/关键词”)生成图像,也支持图生图,AI扩图,图生文等功能。
使用MJ需要登陆Discord账号,在聊天界面发送指令后就可以直接在线得到AI图像。
Discord账号需要科学上网,而且MJ是需要马内才能使用的,30$起步,找人拼车会便宜一些。
敏锐的捕捉关键词:
【基于Discord平台】—>【有一定注册门槛】
【科学上网】—>【魔法无处不在,麻瓜速速退散】
【马内】—>【需要钞能力才能使用】
先不说MJ的注册翻墙就拦住了一大批人,每月的刀乐就是一笔不小的开支,对于新手很不友好(主要是俺穷啊~阿米诺兹!)
2、硬件与运行要求对比
Stable Diffusion硬件要求
【硬件要求较高】:这项技术或软件需要本地独立显卡,对硬件配置有较高的要求。尽管仅使用CPU也可以运行,但速度会相对较慢。
【部署相对麻烦x】:环境设置较为繁琐,需要从GitHub上下载许多文件,并且需要一定的Python知识。然而,国内的技术专家已经制作了整合包,可以简化部署过程。用户只需从网盘下载并一键安装即可。例如上面说的秋叶菩萨。
【可完全本地运行】:该技术或软件可以在没有网络连接的情况下完全在本地运行,数据仅存储在本地计算机上,只要拥有相应的硬件,就可以无限期地使用。
建议使用windows10、windows11。
内存
8GB以上,建议使用16GB或以上的内存。在内存比较小的情况下,可能需要调高虚拟内存,以容纳模型文件。
硬盘
40 GB 以上的可用硬盘空间,建议准备60GB以上空间,最好是固态硬盘。
显卡
最低最低需要显存2GB,建议显存不少于4GB,推荐8GB以上。
至于显卡型号方面,很不幸地,因为需要用到 CUDA 加速,所以只有英伟达显卡支持良好。AMD可以用,但速度明显慢于英伟达显卡,当然,如果你的电脑没有显卡也可以用 CPU 花几百倍时间生成。(无脑N卡好吧~)
Midjouney硬件要求
要求1
魔法
要求2
魔法
要求3
还是tm的魔法
MJ其实就是个网页,服务都在人家手里,你就是访问网站直接使用罢了,能有啥配置要求,哈哈。
【无硬件要求】:该技术或软件对本地硬件性能没有特定要求,只要能够使用Discord,就能在其几乎所有设备上运行。
【部署极为简单】:使用这项技术或软件非常简单,只需打开Discord即可立即开始使用,几乎没有任何技术门槛。
【必须联网运行】:该技术或软件需要全程联网才能运行,数据存储在服务器上,而不是本地保存,因此无法在离线状态下使用。
3、操作(使用)难度对比
Stable Diffusion
使用难度较高。Stable Diffusion的界面有很多内容。由于是开源软件,SD一直在更新,并且会有源源不断地便捷插件导入。如果想要熟练操作,需要花费一定时间进行深入学习。
由于俺是白嫖怪,所以我当然是用过SD啦,已经有一些浅显的见解和心得,可以参考这几篇博客:
stable diffusion 提示词进阶语法-学习小结
stable diffusion 提示词进阶语法-年龄&身材&肤色-学习小结
基础使用可以看看秋叶大佬的说明图:
Midjourney
使用难度较低。基本只要了解几个快捷命令,然后输入提示词就可以进行出图操作。相对SD上手速度快了很多。说的难听一点,只要你会打字,那就能使用,因为只需要往输入框输入描述,回车,就能得到多张效果还不错的图片了。
4、出图效果对比
Stable Diffusion
都说是炼丹、抽卡了,你觉得SD的出图能有多稳定,哈哈,基本就是走量,然后拼运气,抽到你满意的图。
不过,现在已经有很很多大佬在做优化,比如controlNet等,学习这些插件之后,就能很好的保证多张图能有较高的一致性(就是有些学习成本)
而且,绝大多数人的SD都是用来跑妹子的,嘿嘿嘿,SD+Controlnet无疑是上限和自由度更高的,提示词百无禁忌,可以跑绅士图,海量主模型和LoRa可以满足各路LSP的XP,如果找不到还可以自己训练。缺点也很突出,提示词门槛高,手部问题,Lora的兼容性等等。
Midjouney
Midjouney的效果是真的好,提示词门槛低,不需要特别精细的描述也可以出不错的图。 缺点是画面不太受控,而且被BAN的敏感词非常多,像bare,nude这类词就用不了。
但是,MJ的出图速度、效率都是很高的,只要你脑洞够大,用MJ绝对很划得来。
比如你想画一幅川普的AI图像,就能通过MJ很快得到一个非常非常真实的图像:
总结
MJ:
使用群体:更偏向大众化,适合那些出于兴趣、好玩、需要简单AI辅助寻找灵感、开课收割或者客户需求不特别细化的情况。
优点:能快速解决用户的需求,帮助缓解相关从业人士的焦虑。
缺点:需要付费,且可能存在一定的随机性或概率试错,导致结果上下波动。
SD:
使用群体:更偏向精准化,适合各类人群,因为可以产出不同内容,满足多样化需求。
优点:从商业化角度看,更适合作为商业服务,因为它可以根据具体需求定制化,这是客户愿意为之付费的重要原因。
特性:是在本地运行的服务,开源但门槛较高,可实现的效果上限极高。