SenseVoice实现语音转文字

news2026/2/12 18:29:48

之前使用了阿里的CosyVoice实现了文字生成语音和声音的复刻，这章使用阿里的的另一个工具，SenseVoice实现语音转文字，首先需要下载好软件，这里使用docker部署，下载好整合包后：

按照顺序执行

docker load -i sensevoice.tar
docker run -d --name sensevoice --gpus all -p 7860:7860 sensevoice:1   # 有nvidia显卡
docker run -d --name sensevoice -p 7860:7860 sensevoice:1    # 没有nvdia显卡使用cpu运算

部署完成后打开ip+7860，进入首页，可以看到上面一段介绍，下面的左侧是放入的语音消息，右侧是支持的语音类型

添加语音后，会显示语音时长，可以试听以及剪辑等操作，确认无误后，点击Start按钮开始转换，如果语音不长的话很快就完成了，我的电脑没有英伟达显卡，三十个字左右的语音只需要2~3秒就完成了。

同时，SenseVoice也是支持API调用的，可以在页面的下方看到通过API使用的字，点击可以看到开发手册。

以上就是全部内容啦。可以部署好SenseVoice和CosyVoice，再对接下大模型就可以实现语音输入和语音回复了。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1967461.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

SenseVoice实现语音转文字

相关文章

手把手教你用Windows安装Python，轻松开启编程之旅

vue3配置permission.js和router、pinia实现路由拦截

Web页面基础

小程序购物商城系统2024

非全尺寸婴儿床和游戏围栏美国CPC认证16CFR1121测试 ASTM F406报告

Stack Rolling Shutter是什么技术？

Springboot 开发之 Scheduled 定时任务详解及实战

无心剑七绝《潘展乐神》

日本央行首次加息，同时缩减国债购买规模

第十八天内容

RabbitMQ知识总结（基本概念）

数据结构与算法-二分搜索树节点的查找

【源码+文档+调试讲解】学生党务学习系统的设计与实现

MySQL基础练习题7-销售分析

手持式洗地机该怎么选购？多款性能超好的洗地机推荐

某RED书旋转验证码识别（一）

视频编辑SDK提供配套DEMO源码，提高开发效率

Ubuntu系统下，截图软件（飞书，flameshot等）无法正常截图与编辑

iOS ------ 持久化

2024小卷Spring Boot3.0教程思维导图整理