[AI StoryDiffusion] 创造神奇故事,AI漫画大乱斗!

news2024/11/26 4:53:51

今天介绍一个新的AI项目,StoryDiffusion,用于生成一致性连贯的图像和视频。

因为它的一致性,因此可以用于创建漫画,或者长视频。

官方示例可看文末链接,这里不再赘述。

关键特性:

StoryDiffusion 可以通过生成连贯的图像和视频来创造一个神奇的故事。我们的工作主要包括两个部分:

  1. 长距离序列中角色一致的图像生成的连贯自注意力机制。它是即插即用的,与所有基于SD1.5和SDXL的图像扩散模型兼容。在当前的实现中,用户需要为连贯自注意力模块提供至少3个文本提示。我们建议至少提供5-6个文本提示以获得更好的布局安排。
  2. 长距离视频生成的运动预测器,它在压缩的图像语义空间中预测条件图像之间的运动,实现更大范围的运动预测。

安装

安装很简单,依次执行几个命令

conda create --name storydiffusion python=3.10
conda activate storydiffusion
pip install -U pip
pip install -r requirements.txt

python gradio_app_sdxl_specific_id_low_vram.py

使用

我们看下界面

ui-1

ui-2

所以,需要输入“角色描述” 和 “漫画描述”,基本上就可以了。

程序员经常争论代码对齐用 tab 还是 space,我们考虑用这个话题做个漫画。

角色描述

[汤姆] 一个戴眼镜的年轻程序员,穿着带有编程口号的T恤。
[丽莎] 一个女开发者,短发,笔记本电脑上贴满了科技标志的贴纸。

漫画描述

[汤姆] 在办公室,正在键盘上打字 #汤姆正在编写一段代码。
[丽莎] 在同一个办公室,正在她的笔记本电脑上查看汤姆的代码 #丽莎问汤姆他是用的tab还是空格。
[汤姆] 和 [丽莎] 争论,双方都显得很沮丧 #汤姆辩解用tab,丽莎坚持用空格。
[汤姆] 和 [丽莎] 打起来了,纸张和笔记本飞得到处都是 #他们的争论升级成了肢体冲突。

然后点“Generate”,出图!

tab-or-space

样例

我们再来看几个例子。还是 tab or space 主题,换漫画风格试试

tab-or-space-comicbook

tab-or-space-lineart

tab-or-space-photographic

tab-or-space-realvision

再换几个主题试试

人工智能是否会取代人类工作?

ai-replace-human-anime

猫和狗哪个是更好的宠物?

dog-or-cat-anime

哪个操作系统更好:Windows还是macOS?

win-or-mac-anime


  • github
  • 官网
  • AI 博客 - 从零开始学AI
  • 公众号 - 从零开始学AI

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1816873.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

欣九康诊所管理系统多少钱

欣九康诊所管理系统,是一款专为中小型医疗机构设计的综合管理软件,旨在提升诊所、中医馆、门诊部等医疗机构的运营效率和患者服务质量,提高收益。那么,这个系统软件需要多少钱呢? 欣九康诊疗系统提供了不同的版本以适应…

Spring AI 第二讲 之 Chat Model API 第六节Google VertexAI API

VertexAI API 可提供高质量的定制机器学习模型,只需花费最少的机器学习专业知识和精力。 Spring AI 通过以下客户端提供与 VertexAI API 的集成: VertexAI Gemini Chat Vertex AI Gemini API 允许开发人员使用 Gemini 模型构建生成式人工智能应用程序。…

LIUNX系统编程:可重入函数volatile

目录 1.概念 2.volatile关键字 1.概念 在执行流执行到mian函数,insert函数中的1号位置的时候,突然就陷入内核,处理信号,执行信号自定义方法,这个方法调用的也是insert,执行完之后,导致了n2的节…

openlayers 绘图功能,编辑多边形,modify组件的使用(三)

前两篇介绍了 openlayers 中 draw 的使用,自定义了绘制中和绘制结束后的样式,绘制结束后可以获取到绘制图形的featue或者进一步获取轮廓坐标(如下),可以进行坐标保存或者将feature添加到其他层进一步自定义显示 draw.value.on("drawend…

智能合约漏洞类型

Are We There Yet? Unraveling the State-of-the-Art Smart Contract Fuzzers | Proceedings of the IEEE/ACM 46th International Conference on Software Engineering

Studio One软件安装包+安装教程

Studio One 6简体中文版适合制作各种类型的音乐,包括但不限于流行音乐、古典音乐、电子音乐、摇滚乐、爵士乐等。这款软件提供了丰富的音乐制作工具和功能,能够满足不同音乐类型的需求。 对于流行音乐和古典音乐,Studio One 6 提供了高质量的…

2024 Python-Flask框架:网页版 邮件超时自动提醒器(超简单)

首先安装flask框架 pip install flask pip install pywin32 pip install pandas pip install datetime 然后根目录下,创建 app.py 和 templates文件夹 (注意我们的原时间是年,周,日的计算方式) from flask import …

yolov3 详解

文章目录 1、yolov3原理2、损失函数3、yolov3改进4、使用opencv实现yolov35、卷积神经网络工作原理 1、yolov3原理 参考视频 darknet53:52个卷积层和1个全联接层 输入图像为416416 1313 -》 下采样32倍 2626 -》 下采样16倍 5252 -》 下采样8倍 由标注框中心点落在…

离职原因这么回答,off就妥妥的

现在大环境不好,到处都在裁员,好不容易有一次面试机会,结果因为面试回答问题没有回答好,而错失机会,甚至觉得面试表现很好,结果也没拿到offer。 这其中原因除了当前环境下竞争比较激烈外,有些关…

Buffer

Buffer 概念 在Node.js中,Buffer是一个非常重要的内置全局对象,Node.js是基于Chrome V8引擎构建的,V8引擎本身不支持处理二进制数据,因此Node.js引入Buffer来弥补这一不足,Buffer中文译为【缓冲区】,是一…

量产导入 | Tessent Scan 和 ATPG

目标 Upon completion of this module, you should be able to: Use Tessent Scan to insert full scan. Write a scan-inserted netlist file. Write ATPG setup files. lnsert test logic. Create, configure, and balance scan chains. Edit a scan chain order file and …

CentOS停服倒计时不到一个月喊话:“国产操作系统准备好了吗?”安排!

01 CentOS停服倒计时 再过不到20天,CentOS历史将正式终结!Redhat公司此前面向全球宣布,将于2024年6月30日停止维护CentOS 7,届时CentOS全系列版本将停止维护,这意味着CentOS时代将彻底终结,而部署在CentOS…

[NCTF 2018]flask真香

打开题目后没有提示框,尝试扫描后也没有什么结果,猜想是ssti。所以尝试寻找ssti的注入点并判断模版。 模版判断方式: 在url地址中输入{7*7} 后发现不能识别执行。 尝试{{7*7}} ,执行成功,继续往下走注入{{7*7}},如果执…

Linux - 信号阻塞 信号捕捉

Linux - 信号阻塞 & 信号捕捉 信号阻塞信号集操作信号集sigporcmasksigpendingsigaction 信号捕捉用户态与内核态信号捕捉的时机 在博客[Linux - 信号概念 & 信号产生]中,我讲解了信号的基本概念,以及信号是如何产生的,本博客将继续讲…

2024年6月12日 (周三) 叶子游戏新闻

万能嗅探: 实测 网页打开 某视频号、某音、某红薯、某站,可以做到无水印的视频和封面下载功能哦,具体玩法大家自行发挥吧。 WPS免登录一键修改器: 去除烦人的登录且能正常使用 杨奇试戴《黑神话:悟空》豪华版金箍 效果还不错!最近…

大型语言模型(LLMs)的后门攻击和防御技术

大型语言模型(LLMs)通过训练在大量文本语料库上,展示了在多种自然语言处理(NLP)应用中取得最先进性能的能力。与基础语言模型相比,LLMs在少样本学习和零样本学习场景中取得了显著的性能提升,这得…

西门子PLC位逻辑指令学习(SCL语言)

R_TRIG 参数 功能 当CLK信号出现一个低电平到高电平的跳变时,输出Q导通一个周期。 实例 定义以下类型变量 "R_TRIG_DB"(CLK:"data".source,Q>"data".result); //当source输入出现低电平到高电平跳变,result信号…

File、IO流

File、IO流(一) 存储数据的方案 以上都是内存中的数据容器(记住程序正在处理的数据,能快速运算),它们记住的数据,在断电,或者程序终止时会丢失 程序在内存中处理后的数据想长久的保…

Maven增强插件助你开发快人一步

因为之前的工作中一直用的Maven进行jar包管理,每次新加依赖都要去中央仓库上搜索下坐标,这里为了方便以SerchEveryWhere为入口,增加了一个Maven的搜索tab,输入你想要找的包名即可在idea中直接显示最新版对应的坐标以及cve数&#…

镜舟科技与千丁数科开展战略洽谈,探索智慧空间与数据的深度融合

数据作为当下最重要的生产要素之一,数据分析与智慧空间科技的结合正成为推动企业发展的新引擎 。 5 月 15 日,镜舟科技与千丁数科在北京开展战略合作洽谈。本次会议旨在探索双方在智慧空间科技和数据分析领域的合作潜力,共同推进数字经济的新…