这次是从一个微信公众号发现的,尝试了一下其中的方法1,果然强大好用。
方法1
使用 OpenAI 开源的语音转文字模型 Whisper,通过这个模型可以实现语音转文字,即使是离线也能使用。
因为开源的 Whisper 需要通过 python 和命令行来执行,所以我们找到了已经封装好的软件,可以直接使用。
打开软件下载:https://github.com/Const-me/Whisper/releases/
下载 WhisperDesktop.zip 文件,解压出来即可。
下面则是用到的离线库的下载地址:
https://huggingface.co/ggerganov/whisper.cpp/tree/main
我挑了最大个儿的多语言库,尝试11分钟的语音文件,电脑显卡是集成的,速度很慢,但转换出来的效果非常好,而且可以导出为特定格式的文本形式: