AI时代-普通人的AI绘画工具对比（Midjouney与Stable Diffusion）

news2026/2/16 11:32:25

AI时代-普通人的AI绘画工具对比（Midjouney与Stable Diffusion）

前言
1、基础对比
- Stable Diffusion（SD）
- - SD界面
  - 安装与使用SD
- Midjouney（MJ）
2、硬件与运行要求对比
- Stable Diffusion硬件要求
- - 内存
  - 硬盘
  - 显卡
- Midjouney硬件要求
- - 要求1
  - 要求2
  - 要求3
3、操作（使用）难度对比
- Stable Diffusion
- Midjourney
4、出图效果对比
- Stable Diffusion
- Midjouney
总结

前言

在当前技术环境下，AI大模型学习不仅要求研究者具备深厚的数学基础和编程能力，还需要对特定领域的业务场景有深入的了解。通过不断优化模型结构和算法，AI大模型学习能够不断提升模型的准确性和效率，为人类生活和工作带来更多便利。

2023年被视作人工智能领域的爆发之年，以ChatGPT为代表的AI模型如同雨后春笋般迅猛增长。基于AIGC（人工智能内容生成）技术的各类产品纷纷涌现，尤其是众多的AI绘图模型，例如Midjourney、Dreambooth、Novel AI和Stable Diffusion等，它们在社会上得到了广泛的应用。
虽然AI绘图领域，看似进入了百花齐放的时代，但目前业内的顶流，仍然是Stable Diffusion和Midjourney为代表的两大龙头。
希望大家看完这篇博客之后能够选择更为适合自己的AI绘画工具！

1、基础对比

Stable Diffusion（SD）

它由创业公司Stability AI与多个学术研究者和非营利组织合作开发。目前的SD的源代码和模型都已经开源，在Github上由AUTOMATIC1111维护了一个完整的项目，正在由全世界的开发者共同维护。
SD最大的特征，就是由于其开源的特性，可以在电脑本地上离线运行。

敏锐的捕捉关键词：
【开源】—>【免费】
【本地离线】—>【可以嘿嘿嘿不用担心社死】

SD界面

在这里插入图片描述
对于我这种白嫖党还是很友好的，基本有台电脑就能玩（你要想炼丹，那还是搞张40系吧）
简单提一嘴如何去安装：

安装与使用SD

很多大佬都弄了sd的启动器，比如：
在这里插入图片描述

详细可以参考这篇博客： stable diffusion webUI之赛博菩萨【秋葉】——工具包新手安裝与使用教程

Midjouney（MJ）

Midjourney是一款由总部位于旧金山的独立研究实验室Midjourney， Inc.创建和托管的人工智能程序和服务。Midjourney基于【Discord平台】提供服务，可以根据语言描述prompt（被称为“提示词/关键词”）生成图像，也支持图生图，AI扩图，图生文等功能。

使用MJ需要登陆Discord账号，在聊天界面发送指令后就可以直接在线得到AI图像。

Discord账号需要科学上网，而且MJ是需要马内才能使用的，30$起步，找人拼车会便宜一些。
在这里插入图片描述

敏锐的捕捉关键词：
【基于Discord平台】—>【有一定注册门槛】
【科学上网】—>【魔法无处不在，麻瓜速速退散】
【马内】—>【需要钞能力才能使用】

先不说MJ的注册翻墙就拦住了一大批人，每月的刀乐就是一笔不小的开支，对于新手很不友好（主要是俺穷啊~阿米诺兹！）

2、硬件与运行要求对比

Stable Diffusion硬件要求

【硬件要求较高】：这项技术或软件需要本地独立显卡，对硬件配置有较高的要求。尽管仅使用CPU也可以运行，但速度会相对较慢。

【部署相对麻烦x】：环境设置较为繁琐，需要从GitHub上下载许多文件，并且需要一定的Python知识。然而，国内的技术专家已经制作了整合包，可以简化部署过程。用户只需从网盘下载并一键安装即可。例如上面说的秋叶菩萨。

【可完全本地运行】：该技术或软件可以在没有网络连接的情况下完全在本地运行，数据仅存储在本地计算机上，只要拥有相应的硬件，就可以无限期地使用。

建议使用windows10、windows11。

内存

8GB以上，建议使用16GB或以上的内存。在内存比较小的情况下，可能需要调高虚拟内存，以容纳模型文件。

硬盘

40 GB 以上的可用硬盘空间，建议准备60GB以上空间，最好是固态硬盘。

显卡

最低最低需要显存2GB，建议显存不少于4GB，推荐8GB以上。

至于显卡型号方面，很不幸地，因为需要用到 CUDA 加速，所以只有英伟达显卡支持良好。AMD可以用，但速度明显慢于英伟达显卡，当然，如果你的电脑没有显卡也可以用 CPU 花几百倍时间生成。（无脑N卡好吧~）

Midjouney硬件要求

要求1

魔法

要求2

魔法

要求3

还是tm的魔法

MJ其实就是个网页，服务都在人家手里，你就是访问网站直接使用罢了，能有啥配置要求，哈哈。

【无硬件要求】：该技术或软件对本地硬件性能没有特定要求，只要能够使用Discord，就能在其几乎所有设备上运行。

【部署极为简单】：使用这项技术或软件非常简单，只需打开Discord即可立即开始使用，几乎没有任何技术门槛。

【必须联网运行】：该技术或软件需要全程联网才能运行，数据存储在服务器上，而不是本地保存，因此无法在离线状态下使用。

3、操作（使用）难度对比

Stable Diffusion

使用难度较高。Stable Diffusion的界面有很多内容。由于是开源软件，SD一直在更新，并且会有源源不断地便捷插件导入。如果想要熟练操作，需要花费一定时间进行深入学习。

由于俺是白嫖怪，所以我当然是用过SD啦，已经有一些浅显的见解和心得，可以参考这几篇博客：

stable diffusion 提示词进阶语法-学习小结

stable diffusion 提示词进阶语法-年龄&身材&肤色-学习小结

基础使用可以看看秋叶大佬的说明图：
在这里插入图片描述

Midjourney

使用难度较低。基本只要了解几个快捷命令，然后输入提示词就可以进行出图操作。相对SD上手速度快了很多。说的难听一点，只要你会打字，那就能使用，因为只需要往输入框输入描述，回车，就能得到多张效果还不错的图片了。
在这里插入图片描述

4、出图效果对比

Stable Diffusion

都说是炼丹、抽卡了，你觉得SD的出图能有多稳定，哈哈，基本就是走量，然后拼运气，抽到你满意的图。
不过，现在已经有很很多大佬在做优化，比如controlNet等，学习这些插件之后，就能很好的保证多张图能有较高的一致性（就是有些学习成本）

而且，绝大多数人的SD都是用来跑妹子的，嘿嘿嘿，SD+Controlnet无疑是上限和自由度更高的，提示词百无禁忌，可以跑绅士图，海量主模型和LoRa可以满足各路LSP的XP，如果找不到还可以自己训练。缺点也很突出，提示词门槛高，手部问题，Lora的兼容性等等。

Midjouney

Midjouney的效果是真的好，提示词门槛低，不需要特别精细的描述也可以出不错的图。缺点是画面不太受控，而且被BAN的敏感词非常多，像bare,nude这类词就用不了。
但是，MJ的出图速度、效率都是很高的，只要你脑洞够大，用MJ绝对很划得来。
比如你想画一幅川普的AI图像，就能通过MJ很快得到一个非常非常真实的图像：
在这里插入图片描述