Diffusion惊艳应用大赏

news2025/1/24 4:41:14

b7b8b2b338a414709e2d7cdb9c6c132f.jpeg

文|白鹡鸰

自从Diffusion模型兴起之后,AI绘画圈又迎来了一波猪突猛进式的强化,早几年还只是Ins的二次元/迪士尼风格滤镜,让人穿上不同服装当接头霸王。现在,你随便输几句话,模型就能刷刷刷给你吐出一大堆精美的图来,画的比你好,风格多样化,还两分钟就交稿。

d743f1a154c1c7b44560e2a47fb166a1.png
▲NovelAI画的星球与城市 [1]

虽然用AI搞艺术已经进入了全民应用的时代,但很多人对这个强大的工具的使用方式却让我不由感叹想象力的匮乏。想想吧!我当着妈妈的面打开小蓝鸟搜索这期推送的素材,结果齐刷刷跳出了一大排雪白的胸脯!我妈看我的眼神当场就不对了!!!

5af340200d9e747193ad0e6b7bee46a7.png

那么,今天我们就来看看Diffusion模型还有哪些好玩实用的应用,一起欣赏下吧!

本期内容参考@daniel_eckler。

cf7104cd9344d2f17c4b5c06991e69de.png游戏/动画制作15db560300dd331c5e4251cb5a021d1f.png

三维动作生成

模型名为MDM, Human Motion Diffusion Model [2],只要输入语言描述,就能让三维小人模型做出对应的动作,生成结果具有多样性,每个小人会有一定的动作差异。从demo可以看出,目前动作已经非常生动流畅了。

ea1f517ebcacb35618ee1cb6f815e3fc.gif
▲MDM基于描述生成三维动作效果展示

建模贴图

dream-textures,基于Stable Diffusion实现的开源项目,可以自动生成纹理,给模型贴图,可以作为Blender插件部署 [3]。

3206a51b2575c41cc6d357f294ef76a5.gif

▲dream-textures贴图效果展示[4]

MineCraft转绘画

另一项基于Stable Diffusion实现的工作,目前未开源,但它的效果展示引发了我无限的遐想 [5]。如果MineCraft转现实风格的图片效果这么好,《三体》动画的开发是不是可以基于《我的三体》加快进程了?

4c68cb4fa788bf41e283f9ee092e07b2.gif

▲DiffusionCraft效果展示

c57f839d9ca5bd1cba2ea6b5a238bb1d.png增强现实与虚拟现实28c8b43a2392de9dec65eae3bf3e282a.png

虚空画图

Diffusion模型和GravitySketch的结合,原本GravitySketch的绘制效果非常简陋,但加上diffusion模型之后,图像生动了不止一点两点 [6]。

0ca4c8b0a46a33d137b9df17b12453c1.gif

▲加上Diffusion后GravitySketch绘画效果比较

室内环境生成

还是基于Stable Diffusion的开源项目 [7],能通过VR眼镜“扭曲”你周围的环境并基于一些参考图片进行再生成。老实说总体效果还是有些掉SAN,不过前途无量啊,想想以后在家里,带上VR瞬间变成凡尔赛宫,这不是很爽?

4671b2d5ef3653f53ce800ff22b3aefb.gif

▲Deforum Stable Diffusion效果展示

13cbe914209ecfd10a453e3a363512bf.png最佳应用994ea181208d74ac23d13a2cef838a9b.png

在大部分人还在用Diffusion捏脸、造原创角色、沉迷美色的时候,有些人的格局已经打开了。直接靠着目前为止漫威的动画、电影素材,把《蜘蛛侠·平行宇宙2》的预告片给造出来了。看到这个整活的时候我内心的震撼程度更甚于当年看到Jack Frost和Elsa、林黛玉和伏地魔的拉郎MV [8]。


3298ecaf17a408cab2f7ef6fded75c4d.png结语69c7a3e470e32ac46861fe1fdb169e4f.png

Diffusion模型的使用姿势目前为止还没有被完全开发,它的潜力很大程度上取决于人类想象力能有多么精彩。所以说,还请大家整活的时候含蓄一点,免得下次我又被逮个现行,百口莫辩跳进黄河洗不清了!

最后是题图里承诺的爆照时间——

没错,网络上,没有人知道小爷是一只电子鸟(图片由HuggingFace-Stable Diffusion生成 [9])。

230327ff6204a499f7479ad2adc0f6ca.png

e5318a0f4ee3e49637046d5756d9efac.png卖萌屋作者:白鹡鸰

白鹡鸰(jí líng)是一种候鸟,浪形的飞翔轨迹使白鹡鸰在卖萌屋中时隐时现。已在上海交大栖息四年,进入了名为博士的换毛期。目前蹲在了驾驶决策的窝里一动不动,争取早日孵出几篇能对领域有贡献的论文~

知乎ID也是白鹡鸰,欢迎造访。

作品推荐:

  1. NLP太卷,我去研究蛋白质了~

  2. 谷歌40人发表59页长文:为何真实场景中ML模型表现不好?

  3. 学术&工业界大佬联合打造:ML产品落地流程指南

  4. 两个月,刷了八千篇Arxiv,我发现……

547f7dd9f3324a15bb72f77d9b9a3fdb.jpeg

后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

 dd3166b38c0cec10939baf7a3ab29da3.png

[1] @Kemono_VR

[2]https://guytevet.github.io/mdm-page/

[3]https://github.com/carson-katri/dream-textures/tree/0.0.5

[4]@Kdawg5000

[5]https://www.youtube.com/watch?v=ThnAnva2RPY

[6]@ThoseSixFaces

[7]https://github.com/deforum-art/deforum-stable-diffusion

[8]@CorridorDigital

[9]https://huggingface.co/spaces/stabilityai/stable-diffusion

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/105216.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

024 | 知行国学:全国领先的线上一对一国学教育平台 | 大学生创新训练项目申请书 | 极致技术工厂

公司产品 公司的产品包括两个部分的内容,一是模块化、智能化的课程体系——“诗书礼乐”快乐国学课程体系,二是梯队化、“以一带群”、联动型的师资培训体系——“知行者”大学生国学师资培训模式。 近年来,国家大力弘扬中华优秀传统文化&a…

在Docker中的ubuntu中安装Python3和Pip

下载载python3.7 apt-get update apt-get install python3.7 建立软链接 先删除旧的python连接。 删除后建立新的连接关系,例如linux下python3默认在/usr/bin/下 rm -rf /usr/bin/python ln -s /usr/bin/python3.7 /usr/bin/python 进入python3.7的lib中&#xf…

基于springboot的疫情防控系统java疫情防控物资管理平台源码和论文

系统开发技术介绍 2.1 MySQL数据库 社区疫情防控系统采用了一款开源免费的关系型数据库——MySQL数据库进行开发,因为它不收取任何费用,免费提供给各个开发者使用学习使用,使本次系统开发成本大大降低了。由于MySQL数据库体积小&#xff0c…

5.5 5个小红书月销售10W+的商家【玩赚小红书】

一、SWEETIEDOTS:蛋糕 简介 :甜点类商家,独创罐装厚卡龙、创新手工点心甜点,目前在小红书有2.7W粉丝,点赞评超7W,在简介上,告诉用户在薯店进行购买,客单价在98-108元。 内容&#x…

堆堆排序加强堆和堆有关的题一网打尽

堆结构、堆排序 堆结构的实现 堆结构就是用数组实现的完全二叉树结构 2)完全二叉树中如果每颗子树的最大值都在顶部就是大根堆 3)完全二叉树中如果每颗子树的最小值都在顶部就是小根堆 4)堆结构的向上调整和向下调整算法 向上调整 向下调整 5)堆结构某个元素的增大和减少 …

安卓手机独有的6个功能,个个都很实用,你用过几个呢?

安卓和苹果,你更喜欢哪一种?今天我整理了6个安卓独有的功能,不看不知道,一看安卓用户可能会吓一跳。因为这些功能真的很实用,但是苹果却没有这些功能。第一种:更改默认打开的应用 苹果系统无法直接更改默认…

【数据库】MVCC

Multi-version Concurrency Control DBMS 维护一个对象的多版本在数据库中。所以事务可以访问历史版本信息。 只依赖MVCC做不到可串行化; 一个事务在改对象的时候,留下一个历史版本,其他的事务可以读这个历史版本的数据。 读者不锁写着&a…

ch3_2多进程中寄存器的切换

运行中的程序在进行切换时, 可以分为以下两类: 线程: 只涉及指令的切换, 硬件资源没有切换;进程: 包含指令的切换,以及硬件资源的切换, 其中映射表便是一种内存资源。 1. 进程间的…

用3Dmax优化模型的方法,让你的效果图又快又好

3DMax是一个特别强大的建模软件,它具有无数需要小伙伴付出时间和练习才能掌握的特性和功能。 如果你已经能足够直观的掌握基础知识,并且已经能创造出很优秀的作品。这必然是一件值得高兴的事。 但是,在设计过程的妙处就在于,总是…

Prometheus集成Grafana(手动创建/通过模板创建Dashboard)

目录1. Grafana的基本介绍2. Centos7上安装Grafana2.1 下载解压2.2 修改conf/default.ini2.3 启动grafana3. Grafana各层级关系4. 添加Prometheus数据源5. 添加Dashborad和手动添加Row和Panel(方式一)6. 通过社区提供的模板创建Dashboard(方式二)1. Grafana的基本介绍 grafana…

自然语言基础之分词提取关键词基本操作

概述 从今天开始我们将开启一段自然语言处理 (NLP) 的旅程. 自然语言处理可以让来处理, 理解, 以及运用人类的语言, 实现机器语言和人类语言之间的沟通桥梁. 关键词 关键词 (keywords), 即关键词语. 关键词能描述文章的本质, 在文献检索, 自动文摘, 文本聚类 / 分类等方面有着…

我发现,被裁的一般都是情商低的人!网友:老板只看你有没有利用价值!

什么样的人容易被裁员?一位网友分享了自己的发现:被裁的一般都是情商比较低的。有人认同楼主,情商高能在一定程度上降低被裁的概率,大多数被裁的员工是因为情商不够,导致人际关系不好,才被辞退。有人说&…

JS如何读取对象内的一个属性两种方法

目录一:读取对象内的一个属性--可以用数组二:读取对象内的一个属性--可以用 .1、点的方式2、中括号的方式一:读取对象内的一个属性–可以用数组 二:读取对象内的一个属性–可以用 . let obj {name:张三,age:18,address:中国}1、…

【PAT甲级 - C++题解】1067 Sort with Swap(0, i)

✍个人博客:https://blog.csdn.net/Newin2020?spm1011.2415.3001.5343 📚专栏地址:PAT题解集合 📝原题地址:题目详情 - 1067 Sort with Swap(0, i) (pintia.cn) 🔑中文翻译:用 Swap(0, i) 操作…

【关于时间序列的ML】项目 3 :基于机器学习的地震预测模型

🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞…

Datawhale powerful-numpy《从小白到入门》学习笔记

Datawhale powerful-numpy《从小白到入门》学习笔记 持续更新中 文章目录Datawhale powerful-numpy《从小白到入门》学习笔记摘自官方文档的一些话What is NumPy?Why is NumPy Fast?Who Else Uses NumPy?一.创建和生成1.从python列表或元组创建从列表创建从元组创建2.使用ar…

基于ISO13209(OTX)实现引导诊断

在上篇文章《基于ISO13209(OTX)实现EOL下线序列》中,讲到了OTX的由来以及OTX在EOL中的实现案例,而本文将讲述OTX的另一个广阔应用场景——定义引导诊断序列。 一 何为引导诊断? 引导诊断,通常也称为“引导…

市面上有哪些自动生成报表的工具?

每到月末、季度、年底,就是企业里各营销、财务、运营、企管等各部门“摆数据、晒业绩”的时候,除了财务因为有规范的制度约束,在规则和工具上更有保障(最常见的就是在财务软件/ERP 里面自动生成三大周报)之外&#xff…

GoPass系列免杀基础(一)

Goby社区第 23 篇插件分享文章 全文共:7730 字 预计阅读时间:20 分钟 小板凳提示:过数字全家桶(开启晶核)、某绒、卡巴、WD、某管家、魔法保姆、机器人、橘子,全程新手简单版,欢迎师傅们来交流…

一个被迫毕业面试 30 家公司,终于上岸了的Java老前辈的经验分享!

今天分享一个朋友的经历,被“毕业”后的求职经历: 在老东家干了 6 年,发展一般,很想出去,但是一直没有合适的机会,只好一边准备面试一边学习。让我没有想到的是,突然收到了“毕业”通知&#x…