本地部署 faster-whisper

news2024/9/28 21:22:49

本地部署 faster-whisper

  • 1. 创建虚拟环境
  • 2. 安装依赖模块
  • 3. 创建 Web UI
  • 4. 启动 Web UI
  • 5. 访问 Web UI

在这里插入图片描述

1. 创建虚拟环境

conda create -n faster-whisper python=3.11 -y
conda activate faster-whisper

2. 安装依赖模块

pip install torch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 --index-url https://download.pytorch.org/whl/cu118
pip install faster-whisper
conda install matplotlib
pip install gradio

3. 创建 Web UI

# webui.py
import gradio as gr
from faster_whisper import WhisperModel

# Initialize the model
# model_size = "large-v3"
model_size = "Systran/faster-whisper-large-v3"
model = WhisperModel(model_size, device="cuda", compute_type="float16")

def transcribe_audio(audio_file, language):
    # Transcribe the audio
    segments, info = model.transcribe(audio_file, beam_size=5, language=language)

    # Prepare the output
    transcription = ""
    for segment in segments:
        transcription += f"[{segment.start:.2f}s -> {segment.end:.2f}s] {segment.text}\n"

    detected_language = f"Detected language: {info.language} (probability: {info.language_probability:.2f})"

    return detected_language, transcription

# Define Gradio interface
iface = gr.Interface(
    fn=transcribe_audio,
    inputs=[
        gr.Audio(type="filepath", label="Upload Audio"),
        gr.Dropdown(["en", "zh", "ja"], label="Select Language", value="en")
    ],
    outputs=[
        gr.Textbox(label="Detected Language"),
        gr.Textbox(label="Transcription", lines=20)
    ],
    allow_flagging='never',
    title="Audio Transcription with Faster Whisper",
    description="Upload an audio file and select the language to transcribe the audio to text. Choose 'auto' for automatic language detection."
)

# Launch the interface
iface.launch()

4. 启动 Web UI

python webui.py

5. 访问 Web UI

使用浏览器打开 http://localhost:7860,
在这里插入图片描述

reference:

  • https://github.com/systran/faster-whisper
  • https://huggingface.co/Systran/faster-whisper-large-v3

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1980622.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

快讯 | OpenAI迎挑战:开发者转向Sonnet和Llama 405B,GPT-5亟待发布

在数字化浪潮的推动下,人工智能(AI)正成为塑造未来的关键力量。硅纪元视角栏目紧跟AI科技的最新发展,捕捉行业动态;提供深入的新闻解读,助您洞悉技术背后的逻辑;汇聚行业专家的见解,…

Golang | Leetcode Golang题解之第312题戳气球

题目&#xff1a; 题解&#xff1a; func maxCoins(nums []int) int {n : len(nums)rec : make([][]int, n 2)for i : 0; i < n 2; i {rec[i] make([]int, n 2)}val : make([]int, n 2)val[0], val[n1] 1, 1for i : 1; i < n; i {val[i] nums[i-1]}for i : n - 1…

网络商城系统/在线购物商城系统/电子商城系统/商品销售系统

获取源码联系方式请查看文章结尾&#x1f345; 摘 要 本毕业设计的内容是设计并且实现一个基于SSM框架的网络商城系统。它是在Windows下&#xff0c;JSP技术&#xff0c;以MYSQL为数据库开发平台&#xff0c;Tomcat网络信息服务作为应用服务器。网络商城系统的功能已基本实现…

pdf转word在线转换免费软件有没有?安利10款pdf转换器,亲测实用!

pdf和 word是两种广泛使用的文件格式&#xff0c;主要用于分享和存储文档。pdf文件能够保留文档的格式和布局。因此&#xff0c;与word文档相比&#xff0c;pdf更适合用于共享和打印。而word文件则易于编辑&#xff0c;使用也比pdf更加普遍。你可以方便地对文本进行修改、添加或…

花排口径的含义

第一种&#xff1a;固定花排模式 第二种&#xff1a;滚动花排模式 实际使用中&#xff0c;可以根据使用用途&#xff0c;选用不同的口径。

【趣味实验】当狼人杀遇上AI:一场颠覆认知的反向图灵测试

「你看&#xff0c;人类一败涂地了」 这是一次「反向图灵测试」&#xff0c;几个全球最先进的大模型坐在一起&#xff0c;坐着火车唱着歌&#xff0c;但其中混进了人类&#xff1a; 而 AI 的任务&#xff0c;是把这个人类揪出来。 最近&#xff0c;一位昵称「Tore Knabe」的网…

新手学习Gazebo+ros仿真控制小车-----易错和自己理解

赵虚左老师讲的很详细&#xff0c;这里只是理一下思路&#xff0c;说下突然出现“新”概念之间的关系。 urdf文件:里面是配置模型的&#xff0c;既有模型的位置、尺寸、颜色&#xff0c;也包含复杂的物理模型信息比如&#xff1a;转动惯量&#xff0c;碰撞box大小等等&#xff…

internlm开源体系

开源体系核心思想 3. nlp的大海捞针实验 当给模型提供一个非常长的背景知识时&#xff0c;模型是否能够完美的定位超长背景知识中任何位置的任何信息 5. minerU可以解析pdf文档为文本 6. 部署 7. 智能体 三种主流的智能体构建方案

国内外最顶级的五款项目管理软件(推荐)

在项目管理中&#xff0c;项目管理软件已成为企业高效运作不可或缺的工具。无论是国内还是国外&#xff0c;市场上都涌现出众多优秀的项目管理软件&#xff0c;它们以各自独特的功能和优势&#xff0c;助力企业实现项目目标&#xff0c;提升团队协作效率。 1、进度猫 Jinduma…

微信失效图片怎么恢复?iPhone用户请收藏这4个策略!

微信在我们的工作和生活中扮演着重要的角色。但有时候我们也会遇到一些小小的困扰&#xff0c;比如微信失效图片怎么恢复。在这篇文章中&#xff0c;小编将为你分享4个实用的策略&#xff0c;帮助你轻松解决这个问题。所以&#xff0c;如果你正在为微信失效图片而烦恼&#xff…

闪耀STIF2023国际科创节,望繁信科技荣获年度行业创新典范奖

2023年12月15日&#xff0c;望繁信科技在STIF2023第四届国际科创节暨DSC2023国际数字服务大会&#xff08;数服会&#xff09;活动评选中&#xff0c;斩获“2023年度行业创新典范”大奖。 作为科技创新与数字化服务领域最具影响力的年度盛会之一&#xff0c;STIF2023国际科创节…

Python对腾讯课程视频链接自动化抓取

近期看到腾讯课堂停服的通知&#xff0c;心痛之余&#xff0c;想到啊&#xff0c;我还有很多课程没看完&#xff0c;就剩下两个月的事件&#xff0c;我也来不及看完了。怎么办&#xff1f; 索性&#xff0c;我研究下&#xff0c;怎么把视频保存下来。 接下来请听我分析。 所…

U盘格式化了怎么恢复数据?教你U盘恢复妙招

U盘作为便携式存储设备&#xff0c;在我们的日常生活和工作中发挥着重要作用。然而&#xff0c;有时由于操作失误或其他原因&#xff0c;我们可能会格式化U盘&#xff0c;从而导致数据丢失。当遭遇这种情况时&#xff0c;很多人会感到焦虑和困惑。不过&#xff0c;幸运的是&…

DeEcoStudio注释改变颜色

第一步&#xff1a;点击文件——>设置 第二步&#xff1a;编辑器——>配色方案 第三步&#xff1a;找到javaScript——>找到Comment——>找到颜色 第四步&#xff1a;颜色

自定义记录日志的注解

自定义记录日志的注解 建日志表实现代码定义注解与表对应的实体类Mapper 和 Service实现自定义注解 使用注解 建日志表 CREATE TABLE system_log (id bigint unsigned NOT NULL AUTO_INCREMENT COMMENT 主键,method_name varchar(255) COLLATE utf8mb4_general_ci NOT NULL CO…

该买 USB 集线器还是 USB 服务器?一文搞懂!

一、引言 当我们遇到USB 设备与电脑的连接问题时&#xff0c;会看到市面上有 USB 集线器和 USB 服务器两种看起来差不多的产品&#xff0c;搞不清楚它们的区别。 接下来给大家详细一下这两种设备&#xff0c;看看它们分别适合什么情况&#xff0c;帮助你做出明智的选择。 二、…

【Material-UI】Autocomplete 组件的局限性(Limitations)详解

文章目录 一、自动完成/自动填充1. 浏览器自动完成的影响2. 自动填充建议 二、iOS VoiceOver三、自定义 ListboxComponent示例代码 四、总结 Material-UI 的 Autocomplete 组件为开发者提供了便捷的自动补全功能&#xff0c;但在实际使用中也有一些需要注意的局限性。本文将详细…

线程 【Linux】

文章目录 线程页表POSIX线程库pthread_create线程等待pthread_join 线程终止pthread_cancelpthread_self 分离线程 线程ID&&进程地址空间布局 线程 在一个程序里的一个执行路线就叫做线程&#xff08;thread&#xff09;。更准确的定义是&#xff1a;线程是“一个进程…

聊聊ChatGLM-6B医疗数据微调

前言 参考了多个医疗大模型&#xff0c;如扁鹊、灵心等&#xff0c;重新思考了下微调的方案以及数据集的格式&#xff1b;基于ChatGLM/其它LLM整合多种微调方法的非官方实现的框架&#xff0c;审视其数据集格式&#xff0c;以及调试效果&#xff0c;进行微调。 最终基于liucon…

通配符/泛域名HTTPS证书怎么申请?

通配符SSL证书允许您为一个主域名下的所有次级子域名提供加密连接&#xff0c;这非常适用于拥有多个子域名的网站。以下是申请通配符SSL证书的一般步骤&#xff1a; 一、选择证书类型&#xff1a; 确定需要何种类型的通配符SSL证书&#xff0c;如DV&#xff08;域验证&#x…