【NovelAI 小说SD批量生成 文生图/视频克隆】环境配置和使用方法

news2025/1/11 12:52:26

【样品】《谜影之夜》文生图全自动版SD一键成片

操作步骤&环境配置地址:

【NovelAI】月产10000+全自动批量原创小说短视频支持文生图和视频克隆

该文章面向购买脚本的付费用户,提供所有问题以及解决办法。使用 notepad++ 打开对应的文件即可,软件自行百度下载。

使用出现问题查看这里【NovelAI 小说SD批量生成 文生图/视频克隆】问题汇总&解决办法

数据文件配置

任务文件

整个项目包中的路径 不能有中文,不能有中文,不能有中文, 文件位置 task_menu/task.xlsx

数据格式如下
在这里插入图片描述

  • content列,蓝色部分 是你要一键生成视频的稿件,建议用GPT4洗一遍,如果自己写的稿建议添加断句,断句以优先级最高。不然会出现很多句子特别长生成画面的情况,影响视频效果。字数控制建议在3000字一下,如果一个稿件字数很多建议拆分。
  • type、en_name、cn_name,黄色部分 是你的项目文件目录type 为故事的类别,en_name 是每个故事的文件夹,所有生成的数据会在这下面,cn_name 是你这个文章的标题,用于生成word文档和视频结果用。
  • status,绿色部分 用于管理任务,是一个下拉选项,如果这里选择已完成,则该行数据不会出现在生成任务重。

前期不会操作的建议一个一个来熟练之后批量操作。
前期不会操作的建议一个一个来熟练之后批量操作。
前期不会操作的建议一个一个来熟练之后批量操作。

SD重绘文件

整个项目包中的路径 不能有中文,不能有中文,不能有中文, 文件位置 task_menu/redraw.xlsx

在这里插入图片描述

  • type、en_name,部分是你已经生成好AI绘画的图片的路径。
  • index 是你要重新绘制的图片的编号。

重绘需要执行对应的脚本,如果绘制满意的图片在这里吧对应的数据删行删除就可以了。

系统环境配置

整个项目包中的路径 不能有中文,不能有中文,不能有中文, 文件位置 config/authenticate.py

用户名和密码

用户名和密码是购买脚本后管理员发放的,直接填写替换掉对应你的用户名你的密码部分的内容就好。

UserData = {
    'username': '你的用户名',  # 填写你的用户名
    'password': '你的密码',  # 填写你的密码
}

ChatGPT3.5 API

请自行购买购买地址 ,这个是国内镜像,基本上调用1次2分钱还算比较合适。获取好API之后填写即可。

# 定义GPT接口
# 请自行购买购买地址 https://data.zhishuyun.com
GPT35_Token = "你的API"

SD绘画关键词

关键词分前缀和负面,用于控制你的画面风格和不想要的画面。自行在SD中测试好即可,前缀的意思是通过GPT35生成的关键词会加在tag_prefix后面,进行AI绘画。

# 绘画关键词前缀
tag_prefix = "best quality ,masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,8k wallpaper, "
# 绘画负面通用词
negative = "NSFW,sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, bad anatomy,(long hair:1.4),DeepNegative,(fat:1.2),facing away, looking away,tilted head, {Multiple people}, lowres,bad anatomy,bad hands, text, error, missing fingers,extra digit, fewer digits, cropped, worstquality, low quality, normal quality,jpegartifacts,signature, watermark, username,blurry,bad feet,cropped,poorly drawn hands,poorly drawn face,mutation,deformed,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,extra fingers,fewer digits,extra limbs,extra arms,extra legs,malformed limbs,fused fingers,too many fingers,long neck,cross-eyed,mutated hands,polar lowres,bad body,bad proportions,gross proportions,text,error,missing fingers,missing arms,missing legs,extra digit, extra arms, extra leg, extra foot,"

微软TTS文本转语音

需要自己有一张VISA,不明白是啥自行百度,微软申请账号需要。

微软TTS文本转语音,这里必须选择eastus服务器,申请好API之后填写即可。

# 微软TTS APIkey
# 申请地址 https://azure.microsoft.com/zh-cn/products/cognitive-services/text-to-speech/
apiKey = "你的API"  # 这里换成你的API
AccessTokenHost = "eastus.api.cognitive.microsoft.com"  # 必须选择 eastus 服务器

如果自己没有办法申请自己的API,可有偿提供封装API,这里就无视即可。

微软语音选择

这部分代码不要动。

# 声音配置
name_dict = {'HiuGaai': 'zh-HK, HiuGaaiNeural', 'HiuMaan': 'zh-HK, HiuMaanNeural', 'WanLung': 'zh-HK, WanLungNeural',
             'Xiaoxiao': 'zh-CN, XiaoxiaoNeural', 'Xiaoyou': 'zh-CN, XiaoyouNeural', 'Xiaomo': 'zh-CN, XiaomoNeural',
             'Xiaoxuan': 'zh-CN, XiaoxuanNeural', 'Xiaohan': 'zh-CN, XiaohanNeural', 'Xiaorui': 'zh-CN, XiaoruiNeural',
             'Yunyang': 'zh-CN, YunyangNeural', 'Yunye': 'zh-CN, YunyeNeural', 'Yunxi': 'zh-CN, YunxiNeural',
             'HsiaoChen': 'zh-TW, HsiaoChenNeural', 'HsiaoYu': 'zh-TW, HsiaoYuNeural', 'YunJhe': 'zh-TW, YunJheNeural'}

# 语气
style_dict = {'兴奋': 'advertisement_upbeat', '高音调': 'affectionate', '厌恶': 'angry', '热情': 'customerservice', '冷静': 'calm',
              '轻松': 'chat', '愉快': 'cheerful', '忧郁': 'depressed', '轻蔑': 'disgruntled', '纪录片': 'documentary-narration',
              '犹豫': 'embarrassed', '关切': 'empathetic', '钦佩': 'envious', '希望': 'excited', '紧张': 'fearful',
              '愉悦': 'friendly', '温和': 'hopeful', '优美': 'lyrical', '朗读': 'narration-professional',
              '阅读': 'narration-relaxed', '新闻': 'newscast', '通用': 'newscast-casual', '权威': 'newscast-formal',
              '快节奏': 'poetry-reading', '悲伤': 'sad', '严肃': 'serious', '高声': 'shouting', '赛事': 'sports_commentary',
              '精彩': 'sports_commentary_excited', '柔和': 'whispering', '疯狂': 'terrified', '无情': 'unfriendly'}

role_dict = {'女孩': 'Girl', '男孩': 'Boy', '年轻的成年女性': 'YoungAdultFemale', '年轻的成年男性': 'YoungAdultMale',
             '年长的成年女性': 'OlderAdultFemale', '年长的成年男性': 'OlderAdultMale', '年老女性': 'SeniorFemale', '年老男性': 'SeniorMale'}

gender_dict = {'男': 'Male', '女': 'Female'}

上面的格式是这样的,大括号{ }中以每个,断开来看,: 前面是你要复制的信息,后面是对应这个信息的解释。

例如想使用云希的声音在name_dict中复制
在这里插入图片描述
到下面如何修改在这里这里,其他的依次类推,目前支持自定义修改,但是有的声音配置可能不支持,比如云希不会有女人声音这样,具体慢慢尝试或者百度即可。

# 设置配置,这里自行选择,有的可能无法生成,尽量选择通用方法是
# 发音人声音
name = name_dict["Yunxi"]
# 说话风格
style = style_dict["纪录片"]
# 性别
gender = gender_dict["男"]
audio_rate = '1.4'  # 生成音频的速度 1.4 表示1.4倍,修改''中间的数字

剪映配置路径

例如我的路径是这样的
在这里插入图片描述

# 剪映需要的完整路径
full_path = "H:\\NovelAI\\User Edition\\sell_NovelAI_txt2video"

这个配置不对,剪映的配置文件会出错。

使用方法

【通用】step1_切分文本生成excel数据.bat

执行该脚本是将task_menu/task.xlsx下的未完成的文章进行断句操作。

会在data_story/下生成你表格中定义的typecn_name文件夹,在该项目下会自动生成一个txt_excel文件夹,里面有个excel文件打开,之后只有一列数据,应该是这样的。

如果已经执行完后面几步误点了第一步这个脚本的话,会把原来的数据覆盖掉,意味着就要重新来一遍。
在这里插入图片描述

【通用】step2_ChatGPT35生成需要SD绘画需要的关键词.bat

需要用自己申请的API执行,次数不够请及时充值。

执行该脚本是将你生成项目也就是故事的文件夹每句话通过GPT生成关键词,正面和负面以及索引,其中正面词自行设置前缀,负面词是通用的一个,如果生成不满意可以自行在表格里修改。

生成完的数据表单是这样的就可以执行下一步。
在这里插入图片描述

【通用】step3_使用TTS生成语音.bat

需要在配置文件中使用你的微软文字转语音API,使用微软的API生成语音文件。

会在你生成项目也就是故事的文件夹生成2个目录audio_waveach_audio_wav,确保里面的音频文件都有声音即可,在生成界面会看到返回结果为200,即可。

在文件夹下会生成对应的音频文件,脚本设置的已经生成的会跳过,如果音频文件没有声音请删除重新执行脚本。

在这里插入图片描述
在这里插入图片描述

【定制】step3_1_使用TTS生成语音.bat

使用方法同 【通用】step3_使用TTS生成语音.bat

【通用】step4_SD绘画,开启SD端口默认7680.bat

需要提前打开Stable Diffusion环境,并开启API模型。启动命令行显示这样就表示可以了。
在这里插入图片描述
在这里插入图片描述
在网页上选择你需要的模型,之后页面就可以关掉了。
在这里插入图片描述
启动脚本即可,会自动的进行绘画,基于前面API生成的关键词。生成图片在data_story/下生成你表格中定义的typecn_name文件夹下生成data_png图片文件。
在这里插入图片描述

【通用】step4_1_SD重绘,开启SD端口默认7680

打开文件位置 task_menu/redraw.xlsx,这里的数据要和task_menu/task.xlsx对应。

在这里插入图片描述
重画那个写那个,后面的index值是图片的编号,也就是是你要重新绘制的图片。

【通用】step5_批量合并视频,依次合成.bat

以上图片和音频都生成好了直接点击该脚本合成视频。

在这里插入图片描述

【定制】step5_1_批量合并视频,机器不好一次少弄几个.bat

这个脚本属于付费,批量合成,机器不好的不要选,用于一次合成N个视频,不需要一个一个等待合成。

回头补个图。

【通用】step6_随机挑选图片成视频封面.bat

执行该脚本会在data_story/下生成你表格中定义的typecn_name文件夹下生成data_png图片文件中随机挑选一张作为视频封面,保存在data_result中。
在这里插入图片描述

【通用】step7_生成图文word文件.bat

执行该脚本会在data_story/下生成你表格中定义的typecn_name文件夹下生成data_result生成一个 图文适配的word文档,自动化生成,如果不满意手动调整。

在这里插入图片描述

【通用】step8_生成剪映可编辑文件.bat

执行该脚本会在data_story/下生成你表格中定义的typecn_name文件夹下生成data_result生成一个剪映的配置文件draft_content.json,这个文件仍到你剪映的项目中打开就会看到图文适配音频的工程时间轴,方便后期二次加工。

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/536235.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深度学习部署(Pytorch+windows)

目录 NVIDA GPU驱动 NVIDA GPU驱动 查看电脑显卡类型(电脑——属性——设备管理器——显示适配器) 进入NVIDA官方网站(官方驱动 | NVIDIA)下载对应驱动, 接下来默认安装即可。 安装完成之后,查看自己的…

GitHub项目免费教你提示工程,全中文教学,小白也能懂

转载自 | 量子位 量子位 | 公众号 QbitAI 这个GitHub开源项目,打算手把手教你成为一名提示工程师。 理论与实例结合,浅显易懂,可以免费学习,关键还是中文! 如果觉得GitHub界面看起来不方便,还可以到搭建…

文心领航走进大模型时代,从Q1财报看百度价值重估机遇

大模型风头不减,真正的“灵魂选手”在此刻交出了一季度成绩单,让市场看到了“AI巨头”的本色。 北京时间5月16日美股盘前,百度发布了2023Q1财报。财报显示,其营收和利润双双超市场预期,整体经营质量大幅度提高。在经济…

基于卷积的图像分类识别(四):GoogLeNet (V1~V4 Xception)

本专栏介绍基于深度学习进行图像识别的经典和前沿模型,将持续更新,包括不仅限于:AlexNet, ZFNet,VGG,GoogLeNet,ResNet,DenseNet,SENet,MobileNet&#xff0c…

JavaWeb学习-MyBatis-入门

JavaWeb学习-MyBatis-入门 快速入门准备工作配置Mybatis(数据库连接)编写程序mappertest 配置SQL提示JDBC介绍概述案例 数据库连接池概述连接池切换Druid连接池 lombok工具介绍maven坐标案例 来源 快速入门 准备工作 创建SpringBoot工程 数据库表usercreate table user (id …

flume 进阶 自定义source(十)

需求 每隔五秒输出5次数据 pom文件 <dependencies><dependency><groupId>org.apache.flume</groupId><artifactId>flume-ng-core</artifactId><version>1.9.0</version></dependency></dependencies>代码 pac…

NETALAND惊艳上线,平行云助力元宇宙大玩家网易闪亮登场

近日&#xff0c;网易传媒旗下全新的泛娱乐体验空间NETALAND惊艳上线。NETALAND以其近乎于电影质感的场景&#xff0c;趣味的互动模式&#xff0c;流畅、沉浸的交互体验&#xff0c;给营销行业带来了一份新答卷。 NETALAND整合了网易传媒强大的元宇宙技术和丰富的内容生态&…

【Jenkins】新手安装、运行Jenkins(详细教学)

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;公众号&#x1f448;&#xff1a;测试开发自动化 &#x1f449;专__注&#x1f448;&#xff1a;专注主流机器人、人工智能等相关领域的开发、…

【c语言】Union共用体

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞 关注支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; &#x1f525;c语言系列专栏&#xff1a;c语言之路重点知识整合 &#x…

如何将 O2OA 集成到企业微信实现微信办公

O2OA 平台拥有配套的原生开发的安卓和 IOS 移动 APP&#xff0c;可以以自建应用的方式集成到企业微信&#xff0c;同步企业微信的企业通讯录作为本地组织人员架构&#xff0c;并且可以将待办等通知直接推送到企业微信进行消息提醒。本篇主要介绍如何将 O2OA 集成到企业微信实现…

4年外包出来人废了,5次面试全挂....

我的情况 大概介绍一下个人情况&#xff0c;男&#xff0c;毕业于普通二本院校非计算机专业&#xff0c;18年跨专业入行测试&#xff0c;第一份工作在湖南某软件公司&#xff0c;做了接近4年的外包测试工程师&#xff0c;今年年初&#xff0c;感觉自己不能够再这样下去了&…

开心档之Java 抽象类

Java 抽象类 目录 Java 抽象类 抽象类 Employee.java 文件代码&#xff1a; AbstractDemo.java 文件代码&#xff1a; 继承抽象类 Salary.java 文件代码&#xff1a; AbstractDemo.java 文件代码&#xff1a; 抽象方法 Salary.java 文件代码&#xff1a; 抽象类总结…

2023海外网红营销策略揭秘:打造品牌曝光的7大技巧

随着全球互联网的普及&#xff0c;海外网红营销成为越来越多出海品牌的首选策略之一。然而&#xff0c;要在海外市场成功打造品牌形象并吸引目标受众并不容易。本文Nox聚星将详细介绍几项关键技巧&#xff0c;帮助您在海外市场中成功实施网红营销。 一、深入了解目标市场 在海…

如何避免软件bug?优化你的测试流程和设计用例方法就对啦!

目录 引言 一、测试流程 二、测试用例设计方法 等价类 边界值 场景设计法 判定表 错误推测法 结语 引言 对于大多数软件开发者和测试人员而言&#xff0c;避免出现bug是一项非常重要的任务。但是&#xff0c;在实际的开发过程中&#xff0c;我们经常容易忽略一些细节…

【Spring Boot】Spring Boot配置文件与Spring Boot日志文件

文章目录 1. 什么是Spring Boot&#xff1f;2. 如何创建Spring Boot项目&#xff1f;3. 验证Spring Boot项目的创建3.1 补充添加依赖3.2 代码示例 4. Spring Boot配置文件4.1 配置文件的作用4.2 配置文件的格式4.2.1 properties的语法4.2.2 yml的语法4.2.3 properties与yml的对…

性能测试工具的选购细节

近年来&#xff0c;随着软件技术的不断发展&#xff0c;为了保证软件系统的稳定性、可靠性和高效性&#xff0c;在软件开发过程中越来越多地使用性能测试工具。但是&#xff0c;如何选择一款合适的性能测试工具并不是一件容易的事情。下面是一些性能测试工具的选购细节&#xf…

Python学习笔记 - 探索5种数据类型

Python作为一门易学且功能强大的编程语言&#xff0c;吸引了众多编程爱好者。在学习Python的过程中&#xff0c;了解其数据类型是十分重要的。这里将向大家介绍Python中的五种常见数据类型&#xff0c;分别是&#xff1a;整数、浮点数、字符串、列表和字典&#xff0c;并且将通…

【华为新版模拟器eNSP Lite实验界面一览,赶紧来学习】

eNSP Lite是华为新开发的数据通信领域网络环境模拟软件&#xff0c;用于支持数通领域的考试认证、网络环境模拟和技术学习而开发的新版模拟器。相比于旧版模拟器eNSP的本地部署模式&#xff0c;新版模拟器eNSP Lite基于云端部署的模式使得软件在使用的过程中变得更加灵活&#…

使用Socket技术进行数据传输、传输文件;浏览器访问Socket服务器

文章目录 计算机网络基础IP地址和端口TCP和 UDP Socket技术使用Socket进行数据传输使用Socket传输文件使用浏览器访问Socket服务器 计算机网络基础 利用通信线路和通信设备&#xff0c;将地理位置不同的、功能独立的多台计算机互连起来&#xff0c;以功能完善的网络软件来实现…

Visual Studio 2022 v17.6 正式发布

Visual Studio 17.6 正式发布&#xff0c;这个最新版本提供了一系列强大的工具和功能&#xff0c;旨在使你能够制作出最先进的应用程序。 提高生产力 通过 Visual Studio 2022&#xff0c;目标是帮助你在更短的时间内完成 IDE 内的所有开发任务&#xff0c;在这个版本中&…