小蜗语音工具1.9、文本,小说,字幕生成语音、多角色对话,语音识别、读取音频字幕

news2024/11/23 22:08:10

小蜗语音免费工具

  • 一、文本转字幕
    • 文本内容和TXT文件
  • 二、文本转语音
    • 1、文本内容生成语音
    • 2、字幕生成语音
    • 3、多角色对话
    • 4、选择文件
    • 5、批量处理
  • 三、语音识别、音频MP3
    • 1、语音识别
    • 2、下载模型
    • 下载地址

一、文本转字幕

可以把正本小说,生成字幕文件。不限制文件的大小

文本内容和TXT文件

a、分割字符:默认通过**,。!–:?“”** 来把内容分割成一句一句的字幕,可以自定义
b、删除符号:默认删除【】=、等符号,删除内容里面的这些特殊符号并且替换为空格,可以自定义
c、删除文字第(.)章(.)|正文卷,这个很有用。比如小说里面的章节,正文卷 一些广告词 都可以通过这个来删除。 这是一个正则表达式
多个表达式之前 | 分割。 第(.)章(.):其中(.)这是匹配所有内容。**第(.)章(.*)** 会匹配类似 第(任何内容)章(任何内容),这会删除整行。
而单单输入 正文卷 。就只会删除正文卷三个字
d、 字符分段:会自动把一行较长的内容,自动2段或多段字幕
e、文字长度:指一行字幕的长度,默认20个字。
f、时间微调:调整一行字幕的时间长短。
文本转字幕

二、文本转语音

1、文本内容生成语音

生成数字数量不限可以是几百万
**自动播放:**生成完后,小于10M的会自动播放
**生成srt字幕:**勾选后默认会生成 SRT和VTT格式的字幕,字幕语声音一一对应
**分段合成:**文字大于10万字就会分成一段,10万字大概一段70M。多个文件合成很慢
右边可以选择不同的声音、控制语速等

文本生成语音

2、字幕生成语音

自动播放:生成完后,小于10M的会自动播放
声音缩进:指一行字幕声音的伸缩,越大播放时间越短,越短播放时间越长。如果遇到噪声,请使用右边的语速调整

字幕生成语音

3、多角色对话

在内容区域右键鼠标,可以显示已保存配置的角色
自动播放:生成完后,小于10M的会自动播放
生成srt字幕:勾选后默认会生成 SRT和VTT格式的字幕,字幕语声音一一对应
分段合成:文字大于10万字就会分成一段,10万字大概一段70M。多个文件合成很慢
多角色对话

4、选择文件

这里可以选择TXT文件文本转为语音
在这里插入图片描述

5、批量处理

这里是批量把txt文件文本转为语音
在这里插入图片描述

三、语音识别、音频MP3

1、语音识别

可以处理 .wav .mp3 .fla .aac .ogg .m4a ,wma .aiff .amr等文件音频转为txt 或者srt
同时支持多个国家的语言。但是要下载模型,完全本地运行。
在这里插入图片描述

2、下载模型

在这里插入图片描述

下载地址

https://www.vutool.com/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/942197.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Exchange-CVE-2020-0688(RCE)

漏洞描述 当攻击者通过各种手段获得一个可以访问Exchange Control Panel (ECP)组件的用户账号密码,就可以在被攻击的exchange上执行任意代码,直接获取服务器权限。 CVE-2020-0688也是因为viewstate反序列化 漏洞版本 利用条件&…

雅思听力考点词 积累

目录 雅思听力4个部分 雅思听力答题策略 雅思听力12大场景词汇 1 求职 2 图书馆 3 生活 4 天气地形 5 医疗 6 旅游 7 住宿 8 入学 9 运动 10 环境 11 教育 12 音乐 雅思听力 Part 1 4.1 听力Part 1主要内容 4.2 听力Part 1主要题型:Form Completi…

jq插件:jqgrid和validform的二次封装

做久了vue和react框架项目,偶尔也需要做做原生的项目。不可否认vue的双向绑定机制确实很香,但是也是建立在原生js基础上。所以,只有做更多的原生js项目,才能更加了解vue框架的底层原理。在日常开发中,也会不可避免的会…

element-ui 弹窗里面嵌套弹窗,解决第二个弹窗被遮罩层掩盖无法显示的问题

当我们在 element-ui 中使用弹窗嵌套弹窗时,会出现第二个弹窗打开时被一个遮罩层挡着,就像下面这样: 下面提供两种解决方案 : 一、第一种方案 我们查询element-ui 官网可以发现 el-dialog 有这样几个属性: 具体使用就…

【C语言基础】const关键词的使用方法

📢:如果你也对机器人、人工智能感兴趣,看来我们志同道合✨ 📢:不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 📢:文章若有幸对你有帮助,可点赞 👍…

App卡帧与BlockCanary

作者:图个喜庆 一,前言 app卡帧一直是性能优化的一个重要方面,虽然现在手机硬件性能越来越高,明显的卡帧现象越来越少,但是了解卡帧相关的知识还是非常有必要的。 本文分两部分从app卡帧的原理出发,讨论屏…

《Flink学习笔记》——第六章 Flink的时间和窗口

6.1 时间语义 6.1.1 Flink中的时间语义 对于一台机器而言,时间就是系统时间。但是Flink是一个分布式处理系统,多台机器“各自为政”,没有统一的时钟,各自有各自的系统时间。而对于并行的子任务来说,在不同的节点&…

mysql 8 jdbc连接报错:Caused by: java.sql.SOLNonTransientConnectionException: Cannot load connection clas

问题现象:如下图所示: 错误信息为: Caused by: java.sql.SOLNonTransientConnectionException: Cannot load connection class because of underlying exception: com.mysql.cj.e 32 xceptions.WrongArgumentException: Malformed database …

高亮img、pdf重点部分(html2canvas、pdfjs-dist、react-pdf)

可用业务场景 报销单据审批中,高亮发票部分 需求 后台返回一张图片或者pdf、返回一组坐标,坐标类型[number,number,number,number],分别代表了x、y、width、height。需要根据坐标在图片上高亮出来坐标位置。如下图 高亮的坐标是&#xff1…

java-便签

--其实最痛的。不是离别。而是离别后的那些回忆。 java length( ) javalength中文占多长 1.一个中文字符或符号 2 个字节,一个英文字符或符号 1 个字节。 System.out.println("abc你好,".getBytes("gbk").length); System.out.pr…

Nuxt 菜鸟入门学习笔记四:静态资源

文章目录 public 目录assets 目录全局样式导入 Nuxt 官网地址: https://nuxt.com/ Nuxt 使用以下两个目录来处理 CSS、fonts 和图片等静态资源: public 目录 public 目录用作静态资产的公共服务器,可通过应用程序定义的 URL 公开获取。 换…

nvm安装及使用说明

1.说明: nvm 一个nodejs版本管理工具! 2.官网:https://nvm.uihtm.com/ 3.卸载node.js(没安装的话忽略) 4.下载 链接:https://nvm.uihtm.com/nvm-1.1.10-setup.zip 5.nvm安装 卸载之前的node后安装nvm…

<C++> SSE指令集

SSE指令集 include库 #include <mmintrin.h> //MMX #include <xmmintrin.h> //SSE(include mmintrin.h) #include <emmintrin.h> //SSE2(include xmmintrin.h) #include <pmmintrin.h> //SSE3(include emmintrin.h) #include <tmmintrin.h> /…

外部库/lib/maven依赖项 三者关系

外部库(存放项目初始配置的jar包)(它的文件夹里并没有包含lib文件夹的引的外部的依赖的jar包) lib(存放外部导入到项目的依赖的jar包) maven依赖项(管理项目所有的jar包依赖) 三者存放jar包的关系 项目所依赖的全部的jar包 maven依赖项的jar包 外部库中的jar包 lib中的…

基于STM32的酒精浓度检测报警防酒驾仿真设计(仿真+程序+讲解视频)

基于STM32的酒精浓度检测报警防酒驾仿真设计 讲解视频1.主要功能2.仿真3. 程序4. 资料清单&下载链接 基于STM32的酒精浓度检测报警防酒驾仿真设计(仿真程序讲解&#xff09; 仿真图proteus 8.9 程序编译器&#xff1a;keil 5 编程语言&#xff1a;C语言 设计编号&#…

Oracle创建控制列表ACL(Access Control List)

Oracle创建控制列表ACL&#xff08;Access Control List&#xff09; Oracle ACL简介一、先登陆163邮箱设置开启SMTP。二、Oracle ACL控制列表处理&#xff08;一&#xff09;创建ACL&#xff08;create_acl&#xff09;&#xff08;二&#xff09;添加ACL权限&#xff08;add_…

2023热门短剧小剧场APP小程序系统介绍

迈特的短剧saas项目买来能干什么 系统上线推广已经半个月&#xff0c;很多朋友还不懂这项目是干什么的&#xff0c;我来给大家讲一下我所见识的&#xff08;非专业见解&#xff0c;说错了见谅&#xff09; 玩法由来 这种热门短剧玩法在去年就已经出现了&#xff0c;但是今年20…

13.毛玻璃动画特效

效果 源码 <!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8"><title>Glassmorphism Animation Effects</title><link rel="stylesheet" href="style.css"> </head> &…

最新AI创作系统ChatGPT源码+详细图文部署教程/支持GPT-4/AI绘画/H5端/Prompt知识库/思维导图生成

一、AI系统 如何搭建部署AI创作ChatGPT系统呢&#xff1f;小编这里写一个详细图文教程吧&#xff01;SparkAi使用Nestjs和Vue3框架技术&#xff0c;持续集成AI能力到AIGC系统&#xff01; 1.1 程序核心功能 程序已支持ChatGPT3.5/GPT-4提问、AI绘画、Midjourney绘画&#xf…

sql:SQL优化知识点记录(五)

&#xff08;1&#xff09;explain之例子 &#xff08;2&#xff09;索引单表优化案例 上面的功能已经实现&#xff0c;但是分析功能&#xff0c; 使用explain分析这条sql&#xff1a; 发现type为All Extra&#xff1a;有Using filesort &#xff08;文件内排序&#xff09; 这…