AI助力古诗视频制作全流程化教程

news2024/12/29 9:39:50

AI助力古诗视频制作全流程化教程

目录

1. 制作视频的原材料(全自动)

2.文生图:图像生成(手动)

3.文生音频:TTS技术(全自动)

4.视频编辑(手动)

5.自动发布多平台(全自动)

下一步计划

AI助力古诗视频制作全流程化教程


从上一篇“如何利用AI制作“小学古诗”视频?”发布后,我经过一段时间的实践,古诗视频制作基本实现了流水线生产方案,涉及的技术汇总如下:

图片

1. 制作视频的原材料(全自动)

参考AI智能体实战案例,可以借鉴“实现一个自动生成小学生古诗词精读讲稿及插画的智能体”和“AI 智能体实战|优化迭代小学生古诗陪读智能体,提升使用体感”的思路。

通过重新编写程序调用LLM(大型语言模型),我们可以批量生成译文、图片提示词、音频文案等,为视频制作提供基础素材。
核心代码如下:

def call_api(messages, model_name="openai"):    if model_name not in clients:        raise ValueError(f"Unknown model: {model_name}")    client = clients[model_name]    model = MODEL_CONFIGS[model_name]["model"]    response = client.chat.completions.create(        model=model,        messages=messages,        temperature=0.7,        max_tokens=4000    )    return response.choices[0].message.contentdef generate_poetry_explanation(poem_name,model_name="openai"):    messages = [        {"role": "system", "content": SYSTEM_PROMPT_POETRY},        {"role": "user", "content": f"请讲解这首古诗:{poem_name}"}    ]    return call_api(messages, model_name)

2.文生图:图像生成(手动)

在图像生成方面,虽然国外平台如MJ在图片质量上可能更胜一筹,但考虑到网络访问的便捷性,我选择了国内免费的平台【即梦、可灵】。

关于文生图,可以参考“AI生成衣服搭配视频全流程”。目前,文生图仍需人工选择更合适的图片,这一步骤会耗费一些时间。

3.文生音频:TTS技术(全自动)

在文本转语音(TTS)技术方面,有许多选择,包括免费的ttsmaker。目前,我主要使用微软的文本转语音库,并自行编写代码生成音频。
核心代码如下:

communicate = edge_tts.Communicate(text, voice, rate=rate)file_name = f"{uuid.uuid4()}.mp3"file_path = os.path.join(CACHE_DIR, file_name)await communicate.save(file_path)

4.视频编辑(手动)

准备好图片和音频后,接下来就是视频编辑工作。我使用的是【剪映】,只需掌握一些基础的编辑技术。可以参考“用AI把一张竹节人照片生成一个短视频”的教程,学习如何将素材整合成完整的视频内容。

5.自动发布多平台(全自动)

每次发布,需要填写诗文介绍和设定定时发布,我使用playwright模拟人工操作流程实现自动批量发布到多个平台。这一步骤大大节省了手动发布的时间,提高了工作效率。
核心代码是找到控件,然后点击,代码参考:

# 找到并点击“定时发布”单选按钮schedule_radio = page.locator('label.el-radio span.el-radio__label:text-is("定时发布")')await schedule_radio.click()# 等待日期时间输入框出现date_time_input = page.get_by_placeholder("选择日期和时间")await date_time_input.click()

类似命令行工具是可以用AI直接生成:

usage: upload_cli.py [-h] {login,single_upload,batch_upload} ...Upload video to multiple social media platforms.positional arguments:  {login,single_upload,batch_upload}                        Choose an action    login               Login operation    single_upload       Single video upload operation    batch_upload        Batch video upload operation

下一步计划

提升自动化

文生图是否使用自动化呢?为什么没有用API直接文生图,因为最大的问题是图片的可靠性无法保证,有时需要出几次图才能选择到可用的图片。未来可考虑的方向是用大模型对图片进行审核,自动筛选出优质图片作为备选,减少人工筛选的时间。
视频编辑自动化的探索,用ffmpeg能实现很多视频处理的操作,如果素材是确定性的话,自动化是完全没有问题,但前提是需要先解决掉素材的确定性。当然,也可以先探索半自动化,把一些确定性的操作流程化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2267385.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于SSM的“快递管理系统”的设计与实现(源码+数据库+文档+PPT)

基于SSM的“快递管理系统”的设计与实现(源码数据库文档PPT) 开发语言:Java 数据库:MySQL 技术:SSM 工具:IDEA/Ecilpse、Navicat、Maven 系统展示 登陆页面 注册页面 快递员页面 派单员订单管理页面 派单员订单添…

AWTK 在全志 tina linux 上支持 2D 图形加速

全志 tina linux 2D 图形加速插件。 开发环境为 全志 Tina Linux 虚拟机。 1. 准备 下载 awtk git clone https://github.com/zlgopen/awtk.git下载 awtk-linux-fb git clone https://github.com/zlgopen/awtk-linux-fb.git下载 awtk-tina-g2d git clone https://github.co…

Unity游戏环境交互系统

概述 交互功能使用同一个按钮或按钮列表,在不同情况下显示不同的内容,按下执行不同的操作。 按选项个数分类 环境交互系统可分为两种,单选项交互,一般使用射线检测;多选项交互,一般使用范围检测。第一人…

线性直流电流

电阻网络的等效 等效是指被化简的电阻网络与等效电阻具有相同的 u-i 关系 (即端口方程),从而用等效电阻代替电阻网络之后,不 改变其余部分的电压和电流。 串联等效: 并联等效: 星角变换 若这两个三端网络是等效的,从任…

攻防世界web第二题unseping

这是题目 <?php highlight_file(__FILE__);class ease{private $method;private $args;function __construct($method, $args) {$this->method $method;$this->args $args;}function __destruct(){if (in_array($this->method, array("ping"))) {cal…

[文献阅读]ReAct: Synergizing Reasoning and Acting in Language Models

文章目录 摘要Abstract:思考与行为协同化Reason(Chain of thought)ReAct ReAct如何协同推理 响应Action&#xff08;动作空间&#xff09;协同推理 结果总结 摘要 ReAct: Synergizing Reasoning and Acting in Language Models [2210.03629] ReAct: Synergizing Reasoning an…

ISDP010_基于DDD架构实现收银用例主成功场景

信息系统开发实践 &#xff5c; 系列文章传送门 ISDP001_课程概述 ISDP002_Maven上_创建Maven项目 ISDP003_Maven下_Maven项目依赖配置 ISDP004_创建SpringBoot3项目 ISDP005_Spring组件与自动装配 ISDP006_逻辑架构设计 ISDP007_Springboot日志配置与单元测试 ISDP008_SpringB…

Linux -- 从抢票逻辑理解线程互斥

目录 抢票逻辑代码&#xff1a; thread.hpp thread.cc 运行结果&#xff1a; 为什么票会抢为负数&#xff1f; 概念前言 临界资源 临界区 原子性 数据不一致 为什么数据不一致&#xff1f; 互斥 概念 pthread_mutex_init&#xff08;初始化互斥锁&#xff09; p…

1.微服务灰度发布落地实践(方案设计)

前言 微服务架构中的灰度发布&#xff08;也称为金丝雀发布或渐进式发布&#xff09;是一种在不影响现有用户的情况下&#xff0c;逐步将新版本的服务部署到生产环境的策略。通过灰度发布&#xff0c;你可以先将新版本的服务暴露给一小部分用户或特定的流量&#xff0c;观察其…

从 Coding (Jenkinsfile) 到 Docker:全流程自动化部署 Spring Boot 实战指南(简化篇)

前言 本文记录使用 Coding (以 Jenkinsfile 为核心) 和 Docker 部署 Springboot 项目的过程&#xff0c;分享设置细节和一些注意问题。 1. 配置服务器环境 在实施此过程前&#xff0c;确保服务器已配置好 Docker、MySQL 和 Redis&#xff0c;可参考下列链接进行操作&#xff1…

丢失的MD5

丢失的MD5 源代码&#xff1a; import hashlib for i in range(32,127):for j in range(32,127):for k in range(32,127):mhashlib.md5()m.update(TASCchr(i)O3RJMVchr(j)WDJKXchr(k)ZM)desm.hexdigest()if e9032 in des and da in des and 911513 in des:print des 发现给…

基于51单片机的交通灯外部中断proteus仿真

地址&#xff1a; https://pan.baidu.com/s/1WSlta_7pz5HdWsyIGoviHg 提取码&#xff1a;1234 仿真图&#xff1a; 芯片/模块的特点&#xff1a; AT89C52/AT89C51简介&#xff1a; AT89C52/AT89C51是一款经典的8位单片机&#xff0c;是意法半导体&#xff08;STMicroelectro…

JavaWeb(一) | 基本概念(web服务器、Tomcat、HTTP、Maven)、Servlet 简介

1. 基本概念 1.1、前言 web开发&#xff1a; web&#xff0c;网页的意思&#xff0c;www.baidu.com静态 web html,css提供给所有人看的数据始终不会发生变化&#xff01; 动态 web 淘宝&#xff0c;几乎是所有的网站&#xff1b;提供给所有人看的数据始终会发生变化&#xf…

C语言性能优化:从基础到高级的全面指南

引言 C 语言以其高效、灵活和功能强大而著称&#xff0c;被广泛应用于系统编程、嵌入式开发、游戏开发等领域。然而&#xff0c;要写出高性能的 C 语言代码&#xff0c;需要对 C 语言的特性和底层硬件有深入的了解。本文将详细介绍 C 语言性能优化的背后技术&#xff0c;并通过…

C语言-数据结构-查找

目录 一,查找的概念 二,线性查找 1,顺序查找 2,折半查找 3,分块查找 三,树表的查找 1,二叉排序树 (1)查找方式: (2)、二叉排序树的插入和生成 (3)、二叉排序树的删除 2,平衡二叉树 (1)、什么是平衡二叉树 (2)、平衡二叉树的插入调整 &#xff08;1&#xff09;L…

[江科大编程技巧] 第1期 定时器实现非阻塞式程序 按键控制LED闪烁模式——笔记

提前声明——我只是写的详细其实非常简单&#xff0c;不要看着多就放弃学习&#xff01; 阻塞&#xff1a;执行某段程序时&#xff0c;CPU因为需要等待延时或者等待某个信号而被迫处于暂停状态一段时间&#xff0c;程序执行时间较长或者时间不定 非阻塞&#xff1a;执行某段程…

如何理解:产品线经营管理的战略、组织、业务、项目、流程、绩效之间的逻辑关系?-中小企实战运营和营销工作室博客

如何理解&#xff1a;产品线经营管理的战略、组织、业务、项目、流程、绩效之间的逻辑关系&#xff1f;-中小企实战运营和营销工作室博客 产品线经营管理中&#xff0c;战略、组织、业务、项目、流程、绩效之间存在着紧密的逻辑关系&#xff0c;它们相互影响、相互作用&#xf…

【CSS in Depth 2 精译_096】16.4:CSS 中的三维变换 + 16.5:本章小结

当前内容所在位置&#xff08;可进入专栏查看其他译好的章节内容&#xff09; 第五部分 添加动效 ✔️【第 16 章 变换】 ✔️ 16.1 旋转、平移、缩放与倾斜 16.1.1 变换原点的更改16.1.2 多重变换的设置16.1.3 单个变换属性的设置 16.2 变换在动效中的应用 16.2.1 放大图标&am…

Oracle 11G还有新BUG?ORACLE 表空间迷案!

前段时间遇到一个奇葩的问题&#xff0c;在开了SR和oracle support追踪两周以后才算是有了不算完美的结果&#xff0c;在这里整理出来给大家分享。 1.问题描述 12/13我司某基地MES全厂停线&#xff0c;系统卡死不可用&#xff0c;通知到我排查&#xff0c;查看alert log看到是…

三只脚的电感是什么东西?

最近在做加湿器&#xff0c;把水雾化的陶瓷片需要有专门的驱动电路。 我参考了某宝卖家的驱动板以及网上的开源项目&#xff0c;发现了驱动电路的核心就是一个三脚电感。 在此之前我都没注意过这玩意&#xff0c;三脚电感不也还是电感嘛&#xff1f; 今天我们就来看看三脚电…