下载NVIDIA官网的培训视频,生成中文字幕和PPT

news2025/1/11 15:02:10

下载NVIDIA官网的培训视频,生成中文字幕和PPT

  • 一.[视频网站](https://www.nvidia.cn/on-demand/session/gtc24-s62129/)
  • 二.如何获取视频的原始链接
  • 三.下载视频的脚本【生成output.mp4】
  • 四.安装whisper环境【语音识别生成英文字幕】
  • 五.下载whisper模型
  • 六.生成英文字幕【输出merge.mp4】
  • 七.提取场景变化的帧保存成图片序列【场景变化率大于0.1的帧】
  • 八.图片序列转PPT

背景:想学习NVIDIA官网上的培训视频,但视频没有字幕,桑希望能离线观看,以下的操作步骤
涉及到的功能:
1.m3u8视频的下载及转换
2.whisper的使用
3.ffmpeg字幕的使用

一.视频网站

二.如何获取视频的原始链接

在这里插入图片描述

三.下载视频的脚本【生成output.mp4】

#!/bin/bash

# 下载m3u8索引文件
wget https://vod.nvidia.cn/s/hls/p/2935771/sp/293577100/serveFlavor/entryId/1_kpe8g8f4/v/11/ev/8/flavorId/1_wo6zmhel/name/a.mp4/index.m3u8?__hdnea__=st=1718065127~exp=1718151527~acl=/s/hls/p/2935771/sp/293577100/serveFlavor/entryId/1_kpe8g8f4/v/11/ev/8/flavorId/1_*~hmac=5d616800c6cc5b3a48d8f11e2f7b7d2583f9fc419d3f463a6a287afc0caa1f7b -O index.m3u8

# 解析m3u8文件,下载所有的ts文件
for f in `cat index.m3u8 | grep "https"`
do
   name=`echo $f | sed -n 's/.*\(seg-[0-9]*-v[0-9]*-a[0-9]*\.ts\).*/\1/p'`
   echo $name
   wget $f -O $name   
done

# 替换m3u8中的文件名
sed  's/.*\(seg-[0-9]*-v[0-9]*-a[0-9]*\.ts\).*/\1/p' index.m3u8 > index_new.m3u8

# 安装ffmpeg
apt install ffmpeg -y

# 将m3u8转mp4
ffmpeg -i index_new.m3u8 -c:v libx264 -c:a aac output.mp4

四.安装whisper环境【语音识别生成英文字幕】

conda create -n whisper python=3.10
conda activate whisper
pip3 config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple/
pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple
pip3 install git+https://github.com/openai/whisper.git

五.下载whisper模型

wget https://openaipublic.azureedge.net/main/whisper/models/81f7c96c852ee8fc832187b0132e569d6c3065a3252ed18e56effd0b6a73e524/large-v2.pt -O large-v2.pt

六.生成英文字幕【输出merge.mp4】

#提取音频
ffmpeg -i output.mp4 -vn  output.mp3
#生成字幕
whisper --model_dir ./ --model large-v2 --output_format srt --language English output.mp3
#合并字幕
ffmpeg -i output.mp4 -vf subtitles=output.srt merge.mp4

七.提取场景变化的帧保存成图片序列【场景变化率大于0.1的帧】

mkdir extracted_frames
ffmpeg -i merge.mp4 -vf "select='gt(scene,0.1)'" -vsync vfr extracted_frames/frame_%04d.png

八.图片序列转PPT

pip install python-pptx
tee im2ppt.py <<-'EOF'
from pptx import Presentation
from pptx.util import Inches
import os

def create_ppt_from_frames(folder_path, output_pptx):
    prs = Presentation()
    image_files = [f for f in os.listdir(folder_path) if f.endswith('.png')]    
    for image_file in sorted(image_files):
        slide = prs.slides.add_slide(prs.slide_layouts[0])  # 使用空白幻灯片布局
        img_path = os.path.join(folder_path, image_file)
        slide.shapes.add_picture(img_path, Inches(1), Inches(1), width=Inches(8), height=Inches(4.5))
    prs.save(output_pptx)
if __name__ == "__main__":
    folder_path = "extracted_frames"
    output_pptx = "output_presentation.pptx"
    create_ppt_from_frames(folder_path, output_pptx)	
EOF	
python im2ppt.py

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1813865.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

“探索AIGC市场:腾讯元宝APP加入竞争,大模型产品的未来走向与个人选择“

文章目录 每日一句正能量前言使用体验分享独特优势和倾向选择字节豆包百度文心一言阿里通义千问腾讯元宝个人倾向选择结论 未来发展方向技术创新可持续可拓展性用户体验应用场景政府赋能数据安全与隐私保护伦理与社会责任国际合作与竞争结论 后记 每日一句正能量 不管现在有多么…

000-基于sklearn的机器学习入门:工作环境搭建与配置

本专栏将介绍基于Scikit-learn(简称sklearn)的机器学习入门知识。包括但不一定限于&#xff0c;机器学习基本知识、sklearn库简介&#xff0c;基于Sklearn库的机器学习实践。 这是本专栏的第000篇&#xff0c;将介绍如何安装和配置sklearn环境&#xff0c;不仅包括Sklearn库的…

【QT5】<知识点> IMX6ULL开发板运行QT

目录 1. 安装交叉编译器 2. 命令行交叉编译QT项目 3. 运行该可执行程序 4. 开发板上运行UDP程序与Ubuntu通信 1. 安装交叉编译器 第一步&#xff1a;进入正点原子论坛找到IMX6ULL开发板的资料&#xff0c;下载“开发工具”&#xff0c;将“交叉编译工具”中的fsl-imx-x11-…

Docker引起的漏洞问题

前言 测试环境上的中间件和java应用都是由docker进行部署的,但是因为docker的镜像访问有时候需要外网,由此引发了问题,在docker文件中 /usr/lib/systemd/system/docker.service 原有的配置为,可以看到进行了加密 ExecStart/usr/bin/dockerd --tlsverify --tlscacert/etc/docker…

【PL理论】(19) 函数式语言:更复杂的 let-in 示例 | 作用域 | 静态作用域 vs. 动态作用域

&#x1f4ad; 写在前面&#xff1a;本章我们将继续讲解函数式语言&#xff0c;介绍比上一章更复杂的 let-in 示例&#xff0c;进行分析。并讲解作用域&#xff0c;通过例子对比静态作用域和动态作用域的区别。 目录 0x00 复杂的 let-in 示例 0x01 作用域 0x02 静态作用域 v…

EI/CPCI/Scopus会议论文是啥?

EI/CPCI/Scopus会议论文是啥&#xff1f; EI/CPCI/Scopus是学术圈常见的字母缩写了&#xff0c;它们并非某一种期刊或是某一种杂志&#xff0c;而是一种便捷的论文检索工具。它们之间的区别在于&#xff0c;各自涵盖的领域的不同。▌EI &#xff08;The Engineering Index&…

STM32硬件接口I2C应用(基于MP6050)

目录 概述 1 STM32Cube控制配置I2C 1.1 I2C参数配置 1.2 使用STM32Cube产生工程 2 HAL库函数介绍 2.1 初始化函数 2.2 写数据函数 2.3 读数据函数 3 认识MP6050 3.1 MP6050功能介绍 3.2 加速计测量寄存器 ​编辑3.3 温度计量寄存器 3.4 陀螺仪测量寄存器 4 MP60…

openlayers 绘图功能,绘制多边形,draw组件的使用,一个简单的需求引发的思考(二)

上一篇是使用openlayers原生实现的&#xff0c;这一节使用vue3-openlayers实现(有轮子真好) 1 需求 使用openlayers绘图功能绘制多边形 2 分析 主要是openlayers中draw功能的使用 3 实现 为了方便&#xff0c;就不加载底图了&#xff0c;直接使用绘制功能 2.1 简单实现 …

ttkbootstrap的icon图标自定义

前言 在使用ttkbootstrap库时&#xff0c;发现icon参数使用报错&#xff0c;错误代码 root ttk.Window(themename"superhero",size(1400, 700),resizable(True, True),iconphoto"1.png" )结果报错&#xff1a;iconphoto path is bad; using default ima…

AC/DC电源模块的原理、特点以及其在实际应用中的重要性

BOSHIDA AC/DC电源模块的原理、特点以及其在实际应用中的重要性 AC/DC电源模块是一种用于将交流电转换为直流电的设备&#xff0c;广泛应用于各种电子设备中。这种电源模块可以有效地将电力从电网中提取出来&#xff0c;并将其转换为稳定的直流电源&#xff0c;供给各种不同功…

【短剧看剧系统之投流版】短剧看剧系统功能更新,前端uniapp搭建开发

目录 一、常规款短剧系统和投流版的区别&#xff1f; 二、后端体系 1.管理端&#xff1a; 2.代理投流端 三、功能区别 总结&#xff1a; 前言&#xff1a; 短剧看剧系统目前在抖音端是比较热门的&#xff0c;最重要的功能就是可以接入第三方cps&#xff0c;包含类目报白…

万众瞩目的苹果AI来了,但我们用不了

关注卢松松&#xff0c;会经常给你分享一些我的经验和观点。 从今天开始&#xff0c;最了解你的不是你老婆&#xff0c;不是你自己&#xff0c;而是苹果AI。 万众瞩目的苹果WWDC24开发者大会在大半夜举办了&#xff0c;其中一项重要的更新是&#xff1a;苹果宣布要把ChatGPT集…

MES系统定制 | 生产调度车间排班计划/MES排程排产

MES系统是一种集成化的生产信息化管理系统&#xff0c;通过实时收集和分析车间生产数据&#xff0c;帮助企业实现生产过程的自动化控制和监测。它可以跟踪生产计划、设备状态、物料流动等关键指标&#xff0c;并提供实时报表和决策支持。在这个系统中&#xff0c;车间班次排班是…

零基础直接上手java跨平台桌面程序,使用javafx(五)TableView显示excel表

我们在窗口的中间加上TableVie&#xff1a; 在hello-view.fxml的文本中&#xff0c;要增加一些代码。在TableView定义中加上fx:id"TableView1"&#xff0c;这样java代码才方便访问&#xff0c;在java代码中要加上FXML private TableView TableView1;表示定义TableVie…

如何禁止使用U盘|禁止使用U盘的四个方法

你知道U盘滥用对企业的危害&#xff0c;总接下来有这三点: 数据泄露&#xff1a;U盘可以方便地存储和传输大量数据&#xff0c;但如果U盘丢失或被盗&#xff0c;其中的数据可能会被他人获取&#xff0c;从而导致数据泄露。病毒传播&#xff1a;U盘是病毒传播的常见途径之一。如…

基于若依的ruoyi-nbcio-plus里抄送人多页选择人员的bug修复

更多ruoyi-nbcio功能请看演示系统 gitee源代码地址 前后端代码&#xff1a; https://gitee.com/nbacheng/ruoyi-nbcio 演示地址&#xff1a;RuoYi-Nbcio后台管理系统 http://218.75.87.38:9666/ 更多nbcio-boot功能请看演示系统 gitee源代码地址 后端代码&#xff1a; h…

点云技术在AI绘画中的革新性应用

引言&#xff1a; 随着人工智能的不断演进&#xff0c;艺术与科技的交融催生了AI绘画这一全新的创作方式。AI绘画不仅为艺术家提供了前所未有的工具&#xff0c;也拓展了艺术表达的边界。在这一进程中&#xff0c;点云技术作为一种重要的三维数据处理手段&#xff0c;其在AI绘画…

深入解析:常用的IP地址类型及其应用

随着互联网的日益发展&#xff0c;IP地址已经成为了我们日常生活中不可或缺的一部分。无论是浏览网页、发送邮件&#xff0c;还是进行在线视频通话&#xff0c;都离不开IP地址的参与。然而&#xff0c;对于许多非专业人士来说&#xff0c;IP地址的分类及其应用可能还是一个相对…

1502 - JUC高并发

慢慢挣&#xff0c;今天比昨天更有钱&#xff0c;明天比今天有钱&#xff0c;后天比明天有钱。 0.思维导图 6.多线程锁 synchronized实现同步的基础&#xff1a;Java中的每一个对象都可以作为锁。 具体表现为以下3中形式 对于普通同步方法&#xff0c;锁是当前实例对象。对于…

Python 基础001 pythonpycharm安装

1 安装python 尽量在官网安装 根据电脑情况下载,下载完需要重启电脑 python安装路径自定义 添加环境变量&#xff08;add path&#xff09;需要勾选&#xff0c;若无勾选&#xff0c;手动更新环境变量 确认python是否安装成功&#xff1a; 方法一&#xff1a;有安装成功&am…