批量提取某音视频文案(二)

news2024/11/24 19:17:49

牙叔教程 简单易懂

之前写过一篇 批量提取某音视频文案 ,

在之前的教程中, 我用的是微软的语音转文字功能, 今天我们换个方法,

使用 逗哥配音 的 文案提取 功能

准备工作 下载视频和音频

我在github找到的是这个仓库
https://github.com/Johnserf-Seed/TikTokDownload

注意一定要阅读 readme.md ,

并且 一定运行 ./server.bat 启动本地接口解析,

每次我老是忘记运行 bat, 所以总是报错, 运行以后就不会报错了

这是我批量下载的视频和音频

红色的是视频

蓝色的是音频

音频转文字步骤

把音频上传, 然后点击提取文案即可,

10分钟的音频, 消耗时间 25 秒

文案就提取出来了

提取文案以后, 我们改吧改吧就要把它变成视频,

改文案的两种工具

  • ChatGPT
  • Claude

改文案技巧

把文案喂给 AI , 让 AI 模仿写作专家来写文案, 让 AI 当 古龙, 金庸, 司马迁, 鲁迅,

把指定作家的作品告诉给 AI , 让他拥有这个作者的人格和技能

AI 写出文案以后, 我们自己仍然要修改一遍,

因为他写的人称, 描述, 动作, 可能不一定符合你的想法

文案有了以后, 就要转成音频了

文案转音频

我们使用 逗哥配音 的 角色 云浩宇, 全网最火,

语速就参考一下同行的语速, 一般都比较快, 很有有文案需要较慢的语速

如果不知道声音的参数如何设置, 可以看 逗哥配音 的帮助文档, 里面还有 AU 调试声音的教程

提取字幕

音频有了以后, 逗哥配音 还可以导出字幕

剪映导入字幕

文案转成音频, 并且提取字幕以后, 我们就要出图了

生成图片技巧

图片中肯定会有人物出现, 如何固定人物?

我们要指定人物的样子, 尤其是头发和五官

生成图片, 我们使用的是

ChatGPT联网版, Stable Diffusion画图, 这个星球全都有, 低调使用, 别外传

这是人物咒语

1名男子,21岁,短发,黑发,刘海,黑眼睛,眉毛上翘,白皮肤,无表情,栗色嘴巴
1man, 21 years,short hair, black hair, straight hair, bangs, black eyes, cocked eyebrow, White skin, expressionless, chestnut mouth

让他吃饭

餐厅, 坐着, 吃饭, 红烧肉,

1man, 21 years,short hair, black hair, straight hair, bangs, black eyes, cocked eyebrow, White skin, expressionless, chestnut mouth
Restaurant, sitting, eating, roast pork. 

可以看到, 人物相似度是差不多的, 是满足小说推文, 制作视频需求的


图片排序

图片生成完以后, 我们要整理图片, 按顺序编号1,2,3,

这样在导入剪映的时候, 图片就是编排好, 后期就不用一个一个找图片了

就按照文案, 按照字幕, 提前给图片排序

剪映图片默认时长是 5 秒


剪映必须会的快捷键

使用剪映做小说推文必用的快捷键

分割图片 Ctrl + B

上一分割点 ↑

下一分割点 ↓

上一帧 ←

下一帧 →

轨道放大缩小 Ctrl + 滚轮

轨道左右移动 Alt + 滚轮


打关键帧

不懂关键帧的可以看这篇教程

剪映 自动打关键帧 AutoHotkey

关键帧如果打错位置的话, 可以用鼠标拖动关键帧, 直接拖到图片尾部

除了图片要打关键帧, 有时候, 蒙版有时候也要打关键帧, 方法都是一样的.

如果要做 双开门 , 就需要用到 动画 , 向上滑动和向下滑动

动画时长 0.2 秒

为什么是 0.2 秒呢? 我们看看 ChatGPT 如何解释

将图片的闪现时长设置在0.1-0.3秒,可以使观众在短时间内注意到图片内容。这个建议来自于人眼对视觉刺激的反应时间。

当一个视觉刺激呈现在我们面前时,大脑需要一定的时间来处理这个信息。根据研究,人类对视觉刺激的反应时间大约为0.1-0.4秒不等。所以,将图片的闪现时长设定在0.1-0.3秒之间,能够让观众在短时间内注意到图片,同时又让图片保持了突出的效果。

然而,请注意,在显示速度非常快的情况下,过多快速闪现的画面可能会导致观众感到不适。因此,在设计视频时,请确保在更突出的闪现效果与观众舒适度之间找到平衡。


关键帧打完以后, 就要给视频前几十秒加特效了

特效

特效有以下几种

  • 媒体
  • 音频
  • 贴纸
  • 特效
  • 转场
  • 滤镜
  • 模板

男频用音频和特效

女频可能还会用模板


特效加完以后, 就要开始配乐了

配乐

伤感文案不能配搞笑音乐, 大佬用啥你用啥

声音渐入渐出

字幕

大佬用啥你用啥


封面

视频一般都取第一帧做封面, 所以我们要在视频开头留下封面的空间

按三下 →, 这三帧就放封面图片

封面之后才开始放其他图片


图片高清

Stable Diffusion 生成的图片一般是 512X512

我们可以用512做, 然后再把图片变成高清图片

图片高清软件, 可以看这个教程 图片无损放大-AI为图片开光

这个软件还支持批量处理图片, 并且图片处理之后会覆盖源文件, 名字也是一样的,

当然了, 你也可以设置把处理后的图片放到另外的文件夹

我懒得弄高清, 直接用的剪映的 超清画质

这个超清画质和那些批量高清软件一样,

也是一张一张处理图片


该星球提供 ChatGPT 和 Stable Diffusion

支持N多大模型, 就不用你自己一个一个去上传大几G的模型数据了


还支持微调模型, 以及各种VAE

星球提供的ChatGPT可以参考这个教程, 可以直接听歌和看电影

ChatGPT联网版, Stable Diffusion画图, 这个星球全都有, 低调使用, 别外传

微信公众号 牙叔教程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/599639.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VLANIF虚接口案例实践

1)拓扑 2)需求: -所有PC能够ping通自己的网关 -实现vlan间互通,实现所有的PC互通 3)配置步骤: 第一步:给pc配置IP地址 第二步:交换机创建vlan,做access和trunk -所有的交换机都配…

传统图形学对nerf的对比与应用落地

作者今年参加了China3DV的盛会,大会的发表、线下讨论、学者、工业界等等的交流着实对于Nerf有了更深的思考,以下是作者的抛砖引玉,如有不当之处敬请指出~ 传统图形学与nerf的简介: 传统图形学:显示表达几何表达方式&…

【CloudCompare教程】010:点云的裁剪功能(分段、裁剪、筛选)

本文讲解CloudCompare点云的裁剪功能(分段、裁剪、筛选)。 文章目录 一、点云的分段二、点云的裁剪三、点云的筛选一、点云的分段 加载案例点云数据,如下图所示: 选中图层点云,点击工具栏中的【分割】工具。 点击【激活线状选择】工具: 在需要裁剪的点云上绘制现状裁剪范…

使用免费的SSL证书将nginx配置的普通网站修改为HTTPS网站

一、需求说明 已经在Centos8系统中使用nginx搭建了网站;但是该网站没有实现HTTPS协议不安全;现需要将网站升级为HTTPS站点。 Linux环境对Nginx开源版源码下载、编译、安装、开机自启https://blog.csdn.net/xiaochenXIHUA/article/details/130265983?spm=1001.2014.3001.5501

chatgpt赋能python:Python交易接口简介

Python交易接口简介 Python作为一种高级编程语言,被广泛用于各种不同的领域,其中包括金融市场交易。Python交易接口提供了一种优雅而简单的方式,使得交易者能够方便地执行自己的交易策略。 什么是Python交易接口? Python交易接…

Effective第三版 中英 | 第2章 创建和销毁对象 | 考虑静态工厂方法而不是构造函数

文章目录 Effective第三版第2章 创建和销毁对象前言考虑静态工厂方法而不是构造函数 Effective第三版 第2章 创建和销毁对象 前言 大家好,这里是 Rocky 编程日记 ,喜欢后端架构及中间件源码,目前正在阅读 effective-java 书籍。同时也把自己…

基于SSM的人才招聘网站

末尾获取源码 开发语言:Java Java开发工具:JDK1.8 后端框架:SSM 前端:采用JSP技术开发 数据库:MySQL5.7和Navicat管理工具结合 服务器:Tomcat8.5 开发软件:IDEA / Eclipse 是否Maven项目&#x…

模拟实现库函数:strcpy

目录 通过cplusplus网站了解函数功能: 断言assert的使用: 关于const: 本篇你最应该了解的内容: 通过cplusplus网站了解函数功能: 要模拟实现库函数,首先我们需要了解这个函数的参数,函数的…

主机加固介绍

最近公司做服务器安全,开始在市场了解产品,对这一块算是短暂的研究了一段时间,有一点心得给大家分享一下。 主机加固 最近主机加固的概念被炒得火热,主机加固的功能也正在被致力于服务器安全的相关人士所关注。 那么究竟什么是主…

【CVPR2022】CSWin Transformer详解

【CVPR2022】CSWin Transformer详解 0. 引言1. 网络结构2. 创新点2.1 Cross-Shaped Window Self-Attention2.2 Locally-Enhanced Positional Encoding(LePE) 3. 实验总结 0. 引言 Transformer设计中一个具有挑战性的问题是,全局自注意力的计算成本非常高&#xff0…

chatgpt赋能python:Python代码怎么敲:了解Python编程语言

Python代码怎么敲:了解Python编程语言 Python是一种高级编程语言,具有易读易用和高效性等优点。这使得Python成为了程序员的最佳选择,并成为了广泛应用于机器学习、Web开发、数据分析等领域。 Python代码敲法:小技巧 Python代码…

chatgpt赋能python:Python主要语句介绍

Python主要语句介绍 Python是一种广泛使用的高级编程语言,其语法简介、易于学习,并有丰富的库和工具支持。在Python中,主要的语句可以帮助开发人员快速编写代码,实现各种各样的任务。在本文中,我们将介绍Python中的主…

性能优化之高Log file sync等待实战案例分享

故障情况 AWR报告如下: 之后他们把大部分业务停掉后,Log file sync等待事件还是非常高。 通过对比昨天跟今天相同时间的AWR,在业务量小非常多的情况,等待时间还是高非常大。 诊断过程 log file sync等待事件首先判断当前系统IO…

“微商城”项目(1环境搭建)

开发工具分享: 百度网盘: 链接:https://pan.baidu.com/s/1lSsCjf-_zx1ymu6uZeG26Q?pwdhuan 提取码:huan 一、环境搭建说明 本项目服务端环境要求为 Windows Apache PHP MySQL。 下面介绍如何搭建环境,部署服…

CW32系列模数转换器(ADC)

模数转换器(ADC)的主要功能是将模拟量转换为数字量,方便MCU进行处理。下面以CW32L083为例介绍CW系列的模数转换器的特点和功能,并提供演示实例。 一、概述 CW32L083 内部集成一个 12 位精度、最高 1M SPS 转换速度的逐次逼近型模…

位操作符的应用

目录 位操作符的概念: 一、&(按位与):两个整数的补码对应的二进制位有0则为0,两个同时为1才为1,得到的数仍为补码。 二、|(按位或):两个整数的补码对应的二进制位…

Effective第三版 中英 | 第2章 创建和销毁对象 | 当面临多个参数的构造器时考虑使用构建器

文章目录 Effective第三版前言第2章 创建和销毁对象当面临多个参数的构造器时考虑使用构建器 Effective第三版 前言 大家好,这里是 Rocky 编程日记 ,喜欢后端架构及中间件源码,目前正在阅读 effective-java 书籍。同时也把自己学习该书时的笔…

【KKT】∇f(x)+λ∇g(x)=0中λ的讨论

Karush-Kuhn-Tucker (KKT)条件 〇、问题背景 在阅读 Karush-Kuhn-Tucker (KKT)条件 时,不太能理解 ∇ f \nabla f ∇f 的方向,以及 ∇ g \nabla g ∇g 的方向: 为什么 ∇ f \nabla f ∇f 是指向可行域内部, ∇ g \nabla g ∇g…

Java多线程方面知识

目录 1.程序、进程、线程 2.进程与线程的内存解析 3.并发与并行 4.Java程序的线程 5.多线程的创建:方式一:继承于Thread类 6.start方法的作用 7.使用start()时要注意的问题 8.Thread类中的一些方法 9.线程的优先级 10.多线程的创建&#xff1a…

【JAVA】清缓存(打断点删除 / 新增表或字段无效)

一. 打断点无效 情景 新写了一个获取列表数据接口,前端调用的,获取到的数据为空数组。在数据库中查看,是有数据的,但是调用接口返回数据为空。接下来就打断点啦,发现无效!表现如下 没有可执行的…