【开源项目】自动字幕生成和字幕翻译

【开源项目】自动字幕生成和字幕翻译

news2025/4/28 3:04:25

文章目录

1. 安装ffmpeg
2. 克隆项目
3. 配置项目运行环境
4. 填写配置文件
5. 运行项目（仅使用CPU）

项目地址：Github - qinL-cdy/auto_ai_subtitle
项目原理：使用ffmpeg提取视频的音频，使用whisper将音频转写为字幕，使用translate将源语言字幕翻译成目标语言字幕。

1. 安装ffmpeg

下载构建好的ffmpeg。Windows版本下载。
用7-zip解压文件，将解压目录下的bin目录对应的路径添加到环境变量
- 在搜索框中搜索环境变量 > 编辑系统环境变量 > 环境变量 > 系统变量 > Path
- 将bin目录对应的路径添加到Path中
win + R启动运行，输入cmd，在命令提示符中输入以下命令，出现下图所示内容即配置成功。
```
ffmpeg -version
```

在这里插入图片描述

2. 克隆项目

打开VSCode，点击Clone Git Repository ...。选择克隆的目标文件夹，克隆完成后打开文件夹。

3. 配置项目运行环境

使用conda创建虚拟环境（安装Anaconda、conda换源、pip换源可以去搜索）
- 启动Anaconda Prompt
- 输入以下命令创建虚拟环境
```
conda create -n auto_ai_subtitle python=3.9 -y
```
- 激活虚拟环境
```
	conda activate auto_ai_subtitle
```
VSCode选择虚拟环境
右键main.py，点击打开集成终端，输入以下命令安装第三方库。

pip install -r requirements.txt

4. 填写配置文件

打开config.yaml，可以根据自己的实际情况设置相应的参数。

语言简称参照链接后两位字母转小写。
路径中不能有中文

5. 运行项目（仅使用CPU）

修改script/audio_tool.py为以下内容：

import ffmpeg
import subprocess

def audio_extract(input, output):
	ffmpeg.input(input, vn=None).output(output).run()

# 解决中文路径ffmpeg无法运行的问题
# def audio_extract(input_path, output_path):
# 	command = [
# 		'ffmpeg', 
# 		'-i', 'pipe:0',  # 从stdin读取输入
# 		'-vn',          # 仅提取音频
# 		output_path     # 输出文件路径
# 	]

# 	with open(input_path, 'rb') as f:
# 		subprocess.run(command, input=f.read())

修改script/whisper_tool.py，添加verbose=True能显示转写过程。
在集成终端输入以下命令：

python main.py

运行过程中出现以下警告可以忽略，因为默认使用FP16，但是CPU不支持FP16，程序自动会改成FP32。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1478237.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

消息中间件之RocketMQ源码分析(二十三)

消息中间件之RocketMQ源码分析(二十三)

Broker的关机恢复机制概述 Broker关机恢复是指恢复CommitLog、Consume Queue、Index File等数据文件。Broker关机分为正常调用命令关机和异常被迫进程终止关机两种情况。恢复过程的设计目标是使正常停止的进程实现零数据丢失，异常停止的进程实现最少量的数据丢失…

阅读更多...

Python：练习：输出int值a占b的百分之几。例如：输入1和4，输出：25%。

Python：练习：输出int值a占b的百分之几。例如：输入1和4，输出：25%。

案例： 输出int值a占b的百分之几。例如：输入1和4，输出：25%。思考： 所有的一步步思考，最后综合起来。首先，确定输出，那么就用input，而且是int值，所以肯定…

阅读更多...

javaee教程郑阿奇，一线互联网架构师筑基必备技能之Java篇

javaee教程郑阿奇，一线互联网架构师筑基必备技能之Java篇

一、什么情况下会发生栈内存溢出？ 1、栈是线程私有的，栈的生命周期和线程一样，每个方法在执行的时候就会创建一个栈帧，它包含局部变量表、操作数栈、动态链接、方法出口等信息，局部变量表又包括基本数据类型和对象的引…

阅读更多...

【Kubernetes】安装K3S

【Kubernetes】安装K3S

目录前言一、原理单体架构高可用架构二、初始化1.配置yum源2.关掉防火墙3.关掉selinux4. 修改内核参数5.关掉swap交换分区三、安装master节点1. 安装container2.启动master服务四、安装node节点五、卸载六、总结前言各位小伙伴们，大家好，小涛又来…

阅读更多...

【MATLAB源码-第149期】基于MATLAB的2ASK,2FSK,2PSK,2DPSK等相干解调仿真，输出各节点波形。

【MATLAB源码-第149期】基于MATLAB的2ASK,2FSK,2PSK,2DPSK等相干解调仿真，输出各节点波形。

操作环境： MATLAB 2022a 1、算法描述 2ASK（二进制幅移键控）、2FSK（二进制频移键控）、2PSK（二进制相移键控）和2DPSK（二进制差分相移键控）是数字调制技术中的基本调制方…

阅读更多...

1.2 debug的六种指令的使用，四个通用寄存器

1.2 debug的六种指令的使用，四个通用寄存器

汇编语言首先进入环境 mount c d:masm //把c挂载在d盘中的masm当中 c: //进入c，进入到编译环境 dir //查看文件，可有可无Debug是DOS、Windows都提供的实模式（8086 方式）程序的调试工具。使用它可以查看CPU各种寄存器中的内容…

阅读更多...

同芯.共赢 | 暴雨服务器亮相AMD EPYC合作伙伴峰会

同芯.共赢 | 暴雨服务器亮相AMD EPYC合作伙伴峰会

2月29日，AMD EPYC合作伙伴峰会活动在北京成功举行，暴雨作为AMD重要生态合作伙伴应邀参加。作为AMD开年首场活动，此次活动意义非凡，AMD在现场向合作伙伴分享了AMD数据中心全新产品路线、解决方案以及生态建设领域的最新进展。 AMD是…

阅读更多...

centos服务配置springboot服务开机启动

centos服务配置springboot服务开机启动

在做后端服务运维时，经常遇到服务器重启时，需要移动一堆后端服务。服务器故障自动重启时，通常无人通知。把springboot服务的jar包配置开机启动太有必要了，虽然不是很复杂，这里记录一下太有必要了。创建jar包启动和停…

阅读更多...

linux下gcc编译时默认是32位还是64位，怎么指定为32or64？

linux下gcc编译时默认是32位还是64位，怎么指定为32or64？

本来是想研究一下long的字节大小sizeof(long)，于是写了代码： #include <stdio.h> int main() {long a 10;printf("%d\n", sizeof(a));return 0; } 我当时使用的是win10系统，使用的是vs 2022，然后对以上代码进行…

阅读更多...

嵌入式 Linux 下的 LVGL 移植

嵌入式 Linux 下的 LVGL 移植

目录准备创建工程修改配置修改 lv_drv_conf.h修改 lv_conf.h修改 main.c修改 Makefile 编译运行更多内容 LVGL（Light and Versatile Graphics Library，轻量级通用图形库）是一个轻量化的、开源的、在嵌入式系统中广泛使用的图形库&#xff0c…

阅读更多...

【刷题】 Leetcode 1022.从根到叶的二进制数之和

【刷题】 Leetcode 1022.从根到叶的二进制数之和

刷题 1022.从根到叶的二进制数之和题目描述：思路一（dfs深搜万能版）思路二 （栈迭代巧解版）总结 Thanks♪(･ω･)ﾉ谢谢阅读！！！下一篇文章见&#xff…

阅读更多...

Qt6.8 GRPC功能使用(2)标准 Qt实现客户端

Qt6.8 GRPC功能使用(2)标准 Qt实现客户端

简介基于之前的文章所说， Qt6.7之后才开始支持客户端、服务端、及双向流，恰好电脑需要重装，看到Qt6.8版本就直接安装了，内容也是使用Qt6.8的版本进行编译的客户端实现步骤 1. 安装Qt6.8, 包含GRPC功能模块 Qt 6.8安装目录下包…

阅读更多...

浅谈XSS简单漏洞xss-labs-master（初级）

浅谈XSS简单漏洞xss-labs-master（初级）

一、环境以及xss漏洞简介网上很多gethub自己下就行 XSS简介： 当用户访问被XSS注入的网页，XSS代码就会被提取出来。用户浏览器就会解析这段XSS代码，也就是说用户被攻击了。用户最简单的动作就是使用浏览器上网，并且浏览器中有J…

阅读更多...

ai作画在线生成！这8个AI生图工具一定要知道。

ai作画在线生成！这8个AI生图工具一定要知道。

过去的2023年被称作AI元年，随之而来的2024，被业内人士称之为AI应用元年，即随着大模型和各类AI应用的涌现速度放缓，人们关注的焦点也从产品层面（有哪些好用的AI应用），转移到AI如何更好地赋能实际…

阅读更多...

Go开发入门以VSCode为例

Go开发入门以VSCode为例

一、Go环境搭建 1.1 安装进入Golang官网 https://go.dev，点击 Download 若无法打开网页可以使用国内的Go语言中文网 https://studygolang.com/dl 进入下载找到合适的平台点击链接下载即可（这里以Windows距离） 下载完成后 Next Next 安…

阅读更多...

33. 【Linux教程】Linux 用户组

33. 【Linux教程】Linux 用户组

前面小节介绍了 Linux 用户相关的增删改查，本小节介绍 Linux 用户组，Linux 系统中采取了一种安全机制（即用户组），用户组可以允许多个 Linux 用户共享同一种权限。 1. 用户组介绍 Linux 是多任务多用户的操作系统&…

阅读更多...

Android Studio level过滤查看各个等级的日志

Android Studio level过滤查看各个等级的日志旧版as可以在下方的日志输出框选择debug、info，warn、error日志，新版的需要通过在过滤框手动/联想输入 level:xxx，过滤相应等级的日志，如图： android studio/idea返回/前进…

阅读更多...

价格战打响！阿里云服务器和腾讯云服务器价格对比

价格战打响！阿里云服务器和腾讯云服务器价格对比

2024年阿里云服务器和腾讯云服务器价格战已经打响，阿里云服务器优惠61元一年起，腾讯云服务器62元一年，2核2G3M、2核4G、4核8G、8核16G、16核32G、16核64G等配置价格对比，阿腾云atengyun.com整理阿里云和腾讯云服务器详细配置价格表…

阅读更多...

Unity 使用脚本获取组件，代码生成预制体

Unity 使用脚本获取组件，代码生成预制体

代码获取组件 using System; using System.Collections; using System.Collections.Generic; using Unity.VisualScripting; using UnityEngine;// 必须要继承 MonoBehaviour 才是一个组件 // 类名必要与文件名一致public class c1 : MonoBehaviour {// 使用 public 初始变量时…

阅读更多...

永磁同步电机无感FOC（龙伯格观测器）算法技术总结-实战篇

永磁同步电机无感FOC（龙伯格观测器）算法技术总结-实战篇

文章目录 1、ST龙伯格算法分析（定点数）1.1 符号说明1.2 最大感应电动势计算1.3 系数计算1.4 龙伯格观测器计算1.5 锁相环计算1.6 观测器增益计算1.7 锁相环PI计算（ST）1.8 平均速度的用意 2、启动策略2.1 V/F压频比控制2.2 I/F压频…

阅读更多...

推荐文章

最新文章