【Python】本地版 Whisper 自动转录器(附源码网址)

news2024/11/24 19:28:50

目   录

  • 一、实时自动语音转录器简介             

  • 二、开源Whisper实时转录器             

  • 三、pyinstaller 打包发布exe应用程序

  • 四、修改版源代码                             


一、实时自动语音转录器简介

实时自动语音转录器是一种能够自动将语音信号转换为文字的应用程序。它通常具有以下几个主要功能:1. 语音检测与采集实时监测麦克风或其他输入信号,检测并录制用户的语音输入。要求具有较低延迟,以进行实时转录。2. 语音识别与转录使用语音识别技术对录制的语音信号进行识别与转录,将语音转换为文本。需要选择合适的语音识别模型,如神经网络模型等。3. 自动修正分析语音识别的结果,自动检测并修正一些常见错误,如将数字“13”识别为“30”等情况。这需要制定一定的修正规则和算法。4. 格式化与输出对转录结果进行必要的格式化,如加工标点符号、大写等,然后将结果实时显示给用户或导出为文本文档等格式。5. 操作交互提供一定的交互操作,如暂停/继续转录、修改转录结果、选择语音识别模型等。可以通过图形界面实现交互,也可以通过自定义语音指令等方式实现。6. 支持多种语言理想的实时自动语音转录器应支持多种常用语言,以满足不同用户的需求。这需要准备不同语言的语音识别模型与修正规则。总体来说,实时自动语音转录器是一款功能较为复杂的应用程序。要想开发出一款实用的自动转录器,需要具备一定的语音识别与人工智能技术,并投入大量时间用于测试、修订与改进。但随着语音识别技术的不断发展,以及许多开源工具的出现,开发一款基本的自动语音转录器已经变得更加简单和可行。有一定技术基础的开发者,都可以尝试完成这样一个项目,以增进自己的技能与丰富项目经验。

二、开源Whisper实时转录器

fee61970916f1088ba53c34179bee0f5.png

主界面

视频演示(播放youtube视频,实时语音转录)

三、pyinstaller 打包发布exe应用程序

3e89a9b0c81b975fdbe28f2d913dd3a8.png

claude指导

pip install PyInstaller
pyinstaller WAT.py

打包完成,会在dist文件夹下有个WAT的文件夹,所有程序都在这里。

1697e08617fe05a5c0f39f02971a4dc1.png

记得把图标 icon.ico手动拷贝进去。 运行时,提示缺少whisper文件夹下的内容(可能是因为没有添加 PYTHONPATH 环境变量导致),检查发现WAT文件夹下没有whisper文件夹,于是找到下面路径

C:\Users\cxy\AppData\Local\Programs\Python\Python310\Lib\site-packages\whisper

e349db2bbe9e1070cba119661b73ce30.png

将whisper文件夹拷贝到WAT目录下。运行WAT.exe 即可。

注:设置全局变量 用于下载和读取 语音识别模型 (medium.pt)。

XDG_CACHE_HOME=V:\learn\AI\SpeechToText\WhisperAutoTranscriber-main\models

四、修改版源代码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/508270.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【机器学习】机器学习相关概念简述

一、什么是机器学习 机器学习指的是,在没有明确设置的情况下,使得计算机拥有自我学习能力的领域。 二、监督学习和无监督学习 2.1 监督学习 监督学习是指,我们给予算法一个数据集,其中的数据包含了若干个标签。一个例子就是给…

pdf怎么转换成jpg图片

pdf怎么转换成jpg图片?PDF格式可以在电脑和手机上使用,而且其内容不会被篡改。同时,PDF的通用兼容性较强,而且PDF文件操作简单,易于创作。PDF文件格式应用较为广泛。在我们创建PDF文件时,无论在何处查看数据…

OpenGL超级宝典第七章学习笔记:顶点处理与绘图命令

前言 本篇在讲什么 OpenGL蓝宝书第七章学习笔记 本篇适合什么 适合初学OpenGL的小白 本篇需要什么 对C语法有简单认知 对OpenGL有简单认知 最好是有OpenGL超级宝典蓝宝书 依赖Visual Studio编辑器 本篇的特色 具有全流程的图文教学 重实践,轻理论&…

Playground AI:免费绘画图像创作工具

【产品介绍】 Playground AI是一个免费的在线 AI绘画 图像创作工具。你可以用它来创作艺术作品、社交媒体帖子、演示文稿、海报、视频、logo 等等。 Playground AI 的核心技术是基于深度学习的图像生成模型,它可以根据你的输入文字或图片,自动合成出高质…

数组的应用

数组的应用 一、数组的定义二、切片替换删除数值元素 二、数组追加元素三、数组与函数相结合 一、数组的定义 相当于一串数据的集合,以空格相间隔的字符串列表,两边用括号括起来 echo ${shuzu[]}中的代表着显示所有的下标内容,当然&#…

【C++初阶】类和对象(三)

​ ​📝个人主页:Sherry的成长之路 🏠学习社区:Sherry的成长之路(个人社区) 📖专栏链接:C初阶 🎯长路漫漫浩浩,万事皆有期待 上一篇博客:【C初阶】…

无线蓝牙耳机佩戴舒适的有哪几款?佩戴舒适的蓝牙耳机推荐

自从真无线蓝牙耳机产品推出以来,它已经逐渐成为了当代年轻人外出必带的随身数码产品。虽然市面上不缺好产品,但大家对于蓝牙耳机的佩戴舒适度害死更加重要的,下面就来分享几款佩戴舒适的蓝牙耳机吧。 一、南卡小音舱Lite2蓝牙耳机 参考价格…

Android studio单独导入官方例程camera-calibration

1.官方例程camera-calibration 2.将官方例程camera-calibration copy到AndroidStudioProjects项目目录下 3修改AndroidManifest.xml <?xml version"1.0" encoding"utf-8"?> <manifest xmlns:android“http://schemas.android.com/apk/res/andr…

2007年计算机真题

2007年计算机真题 数学基础部分 一、用逻辑符号表达下列语句&#xff08;每小题 2 分&#xff0c;共 4 分&#xff09; 1&#xff0e;分别用两种量词形式写出&#xff1a;在北京居住的人未必都是北京人。 答: 全域: 所有人 P ( x ) \mathrm{P}(\mathrm{x}) P(x) 表示 x \…

「企业应用架构」应用架构概述

在信息系统中&#xff0c;应用架构或应用架构是构成企业架构&#xff08;EA&#xff09;支柱的几个架构域之一 应用架构描述了业务中使用的应用程序的行为&#xff0c;重点是它们如何相互之间以及如何与用户交互。它关注的是应用程序消费和生成的数据&#xff0c;而不是它们的内…

问题杂谈(三十)项目中引入Geotools

步骤 在pom.xml中确定好需要引入的模块&#xff0c;根据自己的需要修改 <!--geotool工具包--><dependency><groupId>org.geotools</groupId><artifactId>gt-epsg-hsql</artifactId><version>27.1</version></dependency&g…

这个学期,110多所高校把AI和大模型带进校园

2023 年春季学期&#xff0c;飞桨校园 AI Day 已登陆全国 114 所高校&#xff0c;为同学们提供了丰富的 AI 学习交流机会。 截至目前&#xff0c;超过 400 所高校的同学线上参与 AI 知识竞赛 PK &#xff0c;累计 2 万余名同学参与春季 AI Day 活动&#xff0c;更有 65 所高校举…

Express框架的路由配置

Express 是一个流行的基于 Node.js 的 Web 开发框架&#xff0c;它可以帮助我们快速搭建一个 Web 应用程序。在 Express 中&#xff0c;路由是一个非常重要的概念。路由指的是根据客户端请求的不同路径和 HTTP 方法来执行不同的处理逻辑。在本篇博客中&#xff0c;我们将介绍如…

美团太细了,HashMap可以存null,ConcurrentHashMap不可以,为什么?

△Hollis, 一个对Coding有着独特追求的人△ 这是Hollis的第 420 篇原创分享 作者 l Hollis 来源 l Hollis&#xff08;ID&#xff1a;hollischuang&#xff09; 我们知道&#xff0c;ConcurrentHashMap在使用时&#xff0c;和HashMap有一个比较大的区别&#xff0c;那就是HashM…

基于Spring Boot的在线考试系统

系统分析 可行性分析 一个完整的系统&#xff0c;可行性分析是必须要有的&#xff0c;因为关系到系统生存问题&#xff0c;对开发的意义进行分析&#xff0c;能否通过本系统来补充线下在线考试管理模式中的缺限&#xff0c;去解决其中的不足等&#xff0c;通过对本系统&#…

FastStone Capture安装、注册及使用教程(截屏、滚动截图、录屏、图片编辑工具)

FastStone Capture是一款集截屏、滚动截图、录屏、图片编辑为一体轻量级截图软件。免费试用30天。 如果你需要找一个具有上述红色字描述的功能的软件的话&#xff0c;可以继续往下阅读。若是你想找一个截图贴图的软件&#xff0c;可以参考&#xff1a; Snipaste介绍、安装、使用…

学系统集成项目管理工程师(中项)系列19b_成本管理(下)

1. 成本估算 1.1. 编制完成项目活动所需资源的大致成本 1.2. 在设计阶段多做些额外的工作可能减少执行阶段和产品运行时的成本 1.3. 项目估算的准确性随着项目的进展而提高 1.3.1. 【19下选48】 1.4. 针对完成活动所需资源的可能成本进行的量化评估 1.5. 容易被忽视的主要…

如何从0开始系统的学习kotlin?

Kotlin强大的静态语言特性相信不用我多讲&#xff0c;大家都或多或少明白一些。无论是对于安卓程序员还是JavaEE程序员来说&#xff0c;掌握Kotlin都是十分有必要的。 Kotlin作为谷歌官方支持的编程语言&#xff0c;目前&#xff0c;不少公司的Android开发工程师岗位表示要有K…

基于springboot广场舞团

系统分析 系统可行性分析 1、经济可行性 由于本系统本身存在一些技术层面的缺陷&#xff0c;并不能直接用于商业用途&#xff0c;只想要通过该系统的开发提高自身学术水平&#xff0c;不需要特定服务器等额外花费。所有创造及工作过程仅需在个人电脑上就能实现&#xff0c;使…

[架构之路-193]-《软考-系统分析师》-2-应用数学 - 项目周期与关键路径(PERT图、甘特图、单代号网络图、双代号网络图)

1. 关键概念 1.1 关键路径 关键路径通常&#xff08;但并非总是&#xff09;是决定项目工期的进度活动序列。它是项目中最长的路径&#xff0c;即使很小浮动也可能直接影响整个项目的最早完成时间。关键路径的工期决定了整个项目的工期&#xff0c;任何关键路径上的终端元素…