从零开始之AI视频制作篇

news2024/9/25 17:17:51

从零开始之AI视频制作篇


文章目录

  • 从零开始之AI视频制作篇
  • 前言
  • 一、工具列表
  • 二、成片展示
  • 三、制作流程
    • 1、获取图片素材
    • 2、图片生成视频
      • 2.1 Runway操作流程
    • 3、文本生成语音
      • 3.1 Fish Audio操作流程
    • 4、视频剪辑
      • 4.1 音频素材
      • 4.2 字幕生成
  • 四、Runway提示词参考:
  • 参考


前言

现在是2024年8月。虽然AI现在发展得很快,但离完全替代人类还是有部分的距离。AI作为提高效率的工具确实是不争的事实。本文将详细描述在这个时间节点上可达到的基于图片的AI视频制作的整个流程,适合小白食用。


一、工具列表

基于图片的AI视频制作需要准备的工具列表有:

  • 图片素材
    本文采用的图片素材来源(已获许可):汐木桃ART的木桃日记

  • 图片生成视频的平台
    Runway Gen3传送门(本文采用)
    Luma Dream Machine传送门
    可灵AI传送门
    即梦AI传送门
    清影AI传送门

  • TTS工具
    TTS工具用于根据文本内容生成语音。
    Fish Audio传送门 (本文采用)
    Cosy Voice传送门
    ChatTTS的autodl云平台部署版传送门

  • 视频剪辑工具
    adobe premiere pro (本文采用)
    剪映

二、成片展示

木桃日记

三、制作流程

1、获取图片素材

可通过国内各个文生图的平台生成,或者通过自己搭建webui/comfyui云平台服务进行创作生成。webui的autodl云一键部署传送门、comfyui的autodl云一键部署传送门,本文采用的图片素材来源(已获许可):汐木桃ART的木桃日记。如果需要去水印,可用WPS等工具,或者用comfyui搭建一个去水印的工作流操作。comfyui去文字和水印的工作流可供参考:去水印和文字工作流传送门

2、图片生成视频

本文采用的是Runway平台,因此针对如何在Runway平台操作图片生成视频进行详解。

2.1 Runway操作流程

通过 Runway官网传送门 进入Runway后便可看到如下界面。
Runway Gen官网
点击右上角的【Get Started】按钮后,便可进入登陆界面,此时需要一个账号才可使用,如果用 Gen2 可以自己注册个账号,有 免费试用额度。如果是用Gen3,就需要在某宝或某鱼上租用账号。
Runway的登陆界面
进入Runway官网后,便可看到如下的控制台,其中的【Assets】表示的是存放的你正在生成和已经生成的视频。【Tools】表示的是可以试用的工具。
Runway工作台
我们需要使用的是【Tools】下的【Text/Image to Video】工具,点击进入即可。可以看到如下的工作台。
Runway工作按钮
Gen3工作台
因为我们采用的是Gen3模型,所以我们的【模型】选择的是【Gen-3-Alpha】。因为我们是用的是租用的账号,所以经常会有同时几个人在线的情况,这时就要看【Generate】按钮是否可按,只要可按,不要犹豫, 立即按下 即可。

因为图片生成视频时,需要对生成的视频进行描述,从而让生成的视频符合我们的构想。所以需要填写提示词来让大模型进行参考。

最好将如下图片中的【guide】链接打开,里面有【运镜】、【特效】等的专业术语提示词可以让大模型更好的理解。Gen-3提示词官方指南
guide
提示词指南中需要注意提示词的基本构造结构,如下图所示。
提示词基本构造
图中的案例部分:

Low angle static shot: The camera is angled up at a woman wearing all orange as she stands in a tropical rainforest with colorful flora. The dramatic sky is overcast and gray.

其中【camera movement】 部分可参考【官方提示词指南】的【Camera Styles】部分。
Camera Styles
部分提示词参考可见文章末尾。

写好提示词后,点击【Generate】,平台右面部分会有个视频生成的进度展示,生成后也会展示在右面。
视频生成进度
视频生成后便按下图所示,点击下载按钮,进行下载。
下载视频
如果生成视频不理想,同一个提示词可多生成几次,如果还是不理想就得调整提示词再试试。在此祝各位好运连连。

3、文本生成语音

本文采用的是Fish Audio传送门 ,这个每天有50次的免费生成次数,短视频基本够用。

3.1 Fish Audio操作流程

Fish Audio操作平台
登录进入后,便可看到各个声音角色的列表,选择想使用的声音角色,点击【使用声音】即可。
进入对应的角色页面后,便可参考下图步骤将文本填入对应文本框中,点击【创建】即可生成。
角色声音合成
生成后按下图所示步骤即可将生成的声音文件进行下载。
声音下载

4、视频剪辑

视频素材和旁白的音频素材准备好了,就可以进行视频剪辑了。如果是视频剪辑小白,可参考b站up主【京译达雅】的【【pr教程】新版本全套56集学不会你找我】教程,可选择性学习。pr教程b站传送门。

4.1 音频素材

如果剪视频的时候需要相关的音频素材,比如本文的剪辑视频中需要的夏夜的蝉鸣声、森林的蝉鸣声的素材,可通过如下几个音频素材网站进行搜索下载使用:淘声网传送门、耳聆网传送门、爱给网传送门。

4.2 字幕生成

如果剪辑的时候需要生成对应的字幕,可参考b站up主【Leo叔叔爱摄影】的字幕生成教程,可选择性学习。职业博主快速制作视频字幕的最佳方案,PR2023字幕最详细攻略,语音自动识别,批量制作字幕效果【PR零基础新手指南65集】,另外PR 2023已经支持一键语音转字幕功能了。

四、Runway提示词参考:

图片描述:A person in a crowd
提示词:Cinematic view of [a human subject with detailed descriptions of their appearance] walking through a blurry crowd. [Describe their action]. 30x speed, hyperspeed, fast motion. In the style of [describe style; ex. Moody colors, cinematic feel, dynamic motion, depth of field].
图片描述:Cinematic drone
提示词:First person view shot of a [subject]. hyper-speed fly, dynamic motion, dynamic blur, timelapse, 30x speed. In the style of [describe style; ex. cinematic, muted color palette].
图片描述:Close up
提示词:Telephoto close up: [subject].
图片描述:Close-up portrait
提示词:A crash zoom into a close-up portrait, shallow depth of field, bokeh. In the style of [describe style; ex. muted color palette, neutrals, magic hour, dull, dramatic, moody, film, 35mm].
图片描述:Dynamic motion
提示词:Dynamic motion, dynamic blur, 30x speed, unsharp edges.
图片描述:Establishing wide
提示词:Extreme wide angle establishing shot: [subject] in vast [scene].
图片描述:Fast motion
提示词:High speed, motion blur, chaotic, kinetic, hyperkinetic.
图片描述:Fast zoom
提示词:Hyperspeed shot: [scene]. Camera movement: fast zoom.
图片描述:First person view
提示词:First person view shot flying through [objects ex. canyons] of a [place ex. planet] toward a [object ex. moon].
图片描述:Handheld
提示词:Handheld tracking shot, following a [subject] in a [place].
图片描述:High angle
提示词:Aerial tracking shot: glide over [place]. Camera Movement: Start high, descend closer to [place].
图片描述:Low angle
提示词:Low angle shot: A [subject ex. car] drives down the center of a [place ex. city]. Tall [objects ex. buildings] loom on either side, their [objects ex. windows] blurred in the background.
图片描述:Macro cinematography
提示词:Macro cinematography: A large [object ex. water droplet] rests among [objects ex. succulent plants]. The [object] refracts and distorts the view of the surrounding environment. Camera Movement: Start with a close-up of the [object], then slowly pull back to reveal more of the surreal [plant life].
图片描述:Nightlight portrait
提示词:Close-up shot of [a human subject with detailed descriptions of their appearance], the neon lights of Tokyo's bustling streets reflecting in the eyes. The face has a pensive expression, hinting at an untold story. The vibrant colors of the city paint the facial features in a mesmerizing interplay of light and shadow.
图片描述:Orbiting scenery
提示词:We orbit around [a subject in a scenic environment; ex. a monument on a hill overlooking a forest], hyper dynamic movement in orbiting motion, shallow depth of field, subject in focus. In the style of [describe style; ex. dark muted natural color palette, cinematic]
图片描述:Over the shoulder
提示词:Over the shoulder shot: [subject doing X]. The camera trails behind them.
图片描述:Portal transition
提示词:Flying through [a place] into [another place]. Fast motion, motion blur. In the style of [describe style; ex. hyperlapse cinematography].
图片描述:Realistic documentary
提示词:An award winning documentary about [a subject; ex. a bunny, a tree, or coral reefs], wide angle shot showcasing the [subject], dynamic movement, this video is incredibly detailed and high resolution, the sharp focus and cinematic light is impressive, a masterpiece.
图片描述:Slow motion
提示词:Slow motion shot: [a subject in motion].
图片描述:Surreal levitation
提示词:An extreme wide angle establishing shot from low angle level looking up at into the sky at sunset hours. [A subject; ex. a plastic bag, a shiny orb, or a goat] is floating slowly in the sky above, defying gravity. Extreme perspective, 3x speed. In the style of [describe style; ex. cinematic, muted naturals coloring, documentary film]
图片描述:Titles
提示词:The scene starts in [location; ex. soup] and then suddenly [object; ex. noodles] appears and begins to [action; ex. transforms] to form the word "[single object, ex. SOUP]", centered, superb cinematic lighting.

参考

  • 汐木桃ART的木桃日记

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1992899.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

盘点5个PDF 怎么转换成 Word 的实用技巧

在日常的办公和学习中,要将 PDF 文件转换成 Word 是很常有的事。方便我们编辑、修改内容或者是提取其中的内容。一般都会用到一些工具;下面,我将为大家介绍5种高效且实用的 PDF 转 Word 的方法。 1、PDF365转换软件 直通车:www.…

搜维尔科技:【研究】大屏幕沉浸式系统的优势,视觉冲击强、‌分辨率高、‌画面层次感强以及沉浸式交互性体验好等!

大屏幕沉浸式系统的优势主要体现在视觉冲击强、‌分辨率高、‌画面层次感强以及沉浸式交互性体验好。‌ 视觉冲击强:‌大屏幕沉浸式系统通过使用多台投影机投射画面,‌结合高质量影片,‌营造出场景环境,‌通过视觉艺术直击体验者…

Hanoi(汉诺)塔问题

目录 什么是汉诺塔? 如何分析汉诺塔 代码实现汉诺塔 什么是汉诺塔? 这是一个古典的数学问题,是一个用递归方法解题的典型例子。汉诺塔的故事在这里不做介绍啦! 汉诺塔的思想是: 总共有3根柱子,这里假设为…

书生.浦江大模型实战训练营——(三)Git基本操作与分支管理

最近在学习书生.浦江大模型实战训练营,所有课程都免费,以关卡的形式学习,也比较有意思,提供免费的算力实战,真的很不错(无广)!欢迎大家一起学习,打开LLM探索大门&#xf…

趋动科技荣登「AIGC赋能金融创新引领者TOP20」

2023年11月28日,“极新AIGC行业峰会”在北京召开,峰会以“AI落地”为指引,探究AI实践与产业化。 从制造业到金融服务业,从医疗保健到交通运输,从文化娱乐到消费零售,智能客服、数字人直播、智能巡检机器人&…

RocketMQ5.0课笔记-架构设计

rocketmq云原生架构 rocketmq的可观测性 NameServer服务发现和注册 rocketMQ的负载均衡 rocketmq高可用方案设计

pod的存储卷

容器磁盘上的文件的生命周期是短暂的,这就使得在容器中运行重要应用时会出现一些问题。首先,当容器崩溃时,kubelet 会重启它,但是容器中的文件将丢失——容器以干净的状态(镜像最初的状态)重新启动。其次&a…

【轨物洞见】光伏电站组件满发小时偏差监测分析方案

光伏发电作为一种环保、可再生的能源形式,在全球得到了广泛的应用。然而,与其他发电方式相比,光伏发电的产能与天气条件息息相关。长期以来,人们一直关注光伏满发小时偏差的问题,并不断努力找到解决方案。 光伏满发小时…

C++笔记1•C++入门基础•

1.C关键字 C总计63个关键字,C语言32个关键字: 2.命名空间: 在 C/C 中,变量、函数和后面要学到的类都是大量存在的,这些变量、函数和类的名称将都存在于全局作用域中,可能会导致很多冲突。使用命名空间的目…

VSCode学习记录

一、下载相关包 npm install npm install vue-router //路由 npm install axios npm install element-plus --save //组件 二、构建一个简单的项目 1.创建router文件夹,在里面创建一个index.js文件用来管理不同页面的路由 import {createRouter,createWebHashHist…

【virtuoso】ocean脚本生成数据文件

1. 生成的原始脚本文件 点击ADE,Sessionsave Ocean Script (如果是AED Explorer或者 ADE Assembler)点击之后会出现这样选项 第2个选项,保存东西更多。这里选择第一个选项 输出的脚本如图所示 ocean文件 1simulator仿真器选择2design设计文件所在位置3r…

循环依赖问题和Spring三级缓存

产生原因:两个或多个bean之间互相持有对方的引用 解决:spring三级缓存 一级缓存:单例池,存放已经经历了完整的生命周期的bean 二级缓存:存放早期的,还没走完生命周期的bean 三级缓存:存放对…

Linux编译器 gcc/g++使用

目录 0.前言 1.C/C编译链接过程回顾 2.gcc如何完成编译链接 2.1预处理 2.2编译 2.3汇编 2.4链接 3.gcc编译选项 4.函数库 4.1静态库 4.2动态库 5.小结 (图像由AI生成) 0.前言 在Linux系统中,C/C编程的开发工具不可或缺,其中gcc…

写给非机器学习人员的 embedding 入门

你好,我是 shengjk1,多年大厂经验,努力构建 通俗易懂的、好玩的编程语言教程。 欢迎关注!你会有如下收益: 了解大厂经验拥有和大厂相匹配的技术等 希望看什么,评论或者私信告诉我! 文章目录 一…

合并两个有序数组(LeetCode)

题目 给你两个按 非递减顺序 排列的整数数组 和 ,另有两个整数 和 ,分别表示 和 中的元素数目。请你 合并 到 中,使合并后的数组同样按 非递减顺序 排列。 注意:最终,合并后数组不应由函数返回,而是…

Word中加载Mathtype后粘贴复制快捷键(Ctrl+C/V)不能使用

操作环境 windows 11操作系统 word版本2021 mathtype版本7.4 这个问题只出现在word中,在excel和ppt中都不存在这个问题,而且之前在另一台电脑中使用word2016版本并没有这种问题的,然后网上搜了一下有不少人有这种问题,word直接取…

nodejs/node-sass/sass-loader三者版本对应关系(已解决)

基本前提:了解版本对应关系 示例: 我的nodejs:v14.21.3, 则package.json: "node-sass": "^4.14.1", "sass-loader": "^8.0.0",扩展: 查看node历史版本: Node.js…

【数据结构-前缀哈希】力扣525. 连续数组

给定一个二进制数组 nums , 找到含有相同数量的 0 和 1 的最长连续子数组,并返回该子数组的长度。 示例 1: 输入: nums [0,1] 输出: 2 说明: [0, 1] 是具有相同数量 0 和 1 的最长连续子数组。 示例 2: 输入: nums [0,1,0] 输出: 2 说明: [0, 1] (或 [1, 0]) 是…

摸着石头过河的具身智能公司,正在寻求“确定性”

在种种不确定因素之下,对于具身智能,唯一可以确定的是,其未来巨大的市场空间。从纷纷入局的科技巨头、创业公司的市场现状即可窥见一二。而类比到自动驾驶,其也是抛开层层迷雾后才得以在今天看见曙光。 相信,于具身智…

高效报销管理:领先软件的综合评测

本文主要介绍了以下10款报销管理软件:合思、明道云、汇联易、畅捷通、慧算账、云之家、Ramp、Nexonia by Emburse、Rydoo、Expensify。 在处理财务报销时,你是否经常感到手续繁琐、效率低下?选择合适的软件系统,能够显著优化整个报…