语音识别技术对比分析

news2024/11/6 3:11:33

文章目录

  • 一、语音识别产品对比
  • 二、百度语音识别产品
    • 1、套餐及价格:
    • 2、官网
    • 3、调研结果
  • 三、华为语音识别产品
  • 四、阿里云语音识别产品
    • 1、套餐及价格:
    • 2、官网地址
    • 3、调研结果
  • 五、科大讯飞语音识别产品
    • 1、套餐及价格:
    • 2、官网
    • 3、调研结果
  • 六、有道语音识别产品
    • 1、套餐及价格
    • 2、官网
    • 3、调研结果
  • 七、结论

一、语音识别产品对比

近二十年来,语音识别技术取得显著进步。人工智能的新宠ChatGPT聊天机器人模型更进一步推动了语音识别技术的发展。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。

当你的业务场景想要音频转文字语音转文字,比如直播、字幕识别等等,这时候就要用到语音识别技术了,这里我们先针对市面上目前相对通用的百度、华为、阿里云、科大讯飞、有道等几款语音识别产品的技术对接方案、套餐、价格、超时后费用、直接购买还是预付费、官网说明、业务场景等进行简单比对

上述为个人结合自身业务场景调研结果,可供参考。

调研业务背景:实现脚本视频跟拍功能,处理音频流、视频流、以及语音识别为字幕等。

二、百度语音识别产品

1、套餐及价格:

名称:实时语音识别套餐内:实时语音识别1000小时50路并发,超出部分1小时最高3元额外加并发100元/路/月
套餐价格:1800元/年
特点:是支持预付费,也支持后付费

2、官网

https://ai.baidu.com/tech/speech?track=cp:ainsem|pf:pc|pp:878-chanpin-yuyinjishu|pu:yuyinshibie|ci:|kw:10521656

3、调研结果

测试后识别率低、有乱码

三、华为语音识别产品

调研结果由于深度绑定华为云,无法单独购买,暂时不考虑。

四、阿里云语音识别产品

1、套餐及价格:

名称:录音文件识别极速版
套餐内:实时语音识别1000小时
10路并发,超出部分1小时最高3.3元额外加并发200元/路/月
套餐价格:1560元/年

超出后价格:

2、官网地址

https://ai.aliyun.com/nls/trans?spm=5176.21213303.8115314850.1.6cfd53c978f7Ri&scm=20140722.S_card@@%E5%95%86%E5%93%81@@591326.S_cardgbdt.ID_card@@%E5%95%86%E5%93%81@@591326-RL_%E8%AF%AD%E9%9F%B3%E8%BD%AC%E5%86%99-OR_ser-V_2-P0_0

3、调研结果

测试识别率高,响应速度快

五、科大讯飞语音识别产品

我们知道科大讯飞在语音识别领域做的比较成熟,比较有名了,所以也相对比较贵。

1、套餐及价格:

名称:极速语音转写
套餐内:实时语音识别1000小时
20路并发,超出部分收费未明示
套餐价格:5070元/年


2、官网

https://www.xfyun.cn/services/fast_lfasr

3、调研结果

测试识别率高,识别响应时间长

六、有道语音识别产品

1、套餐及价格

2、官网

https://ai.youdao.com/doc.s#docs

3、调研结果

只有短语音识别,字符计费,与当前业务不匹配

七、结论


最后结论,推荐使用阿里云。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/380684.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一、Redis入门概述(是什么,能干嘛,去哪下,怎么玩)

一. redis是什么? Redis:REmote Dictionary Server(远程字典服务器)官方解释: Remote Dictionary Server(远程字典服务)是完全开源的,使用ANSIC语言编写遵守BSD协议,是一个高性能的Key-Value数据库提供了丰富的数据结构&#xff…

何谓dB , dB怎么理解?

dB 是什么单位 ?愈低愈好吗?对于声频 ( 声学及电子声学 ) 方面的单位,它是以分贝(decibel ,dB ) 来做结果的。斯多里一生专注于科学,1876 发明电话,我们都知道贝尔发明了电话,然而重要的是,他发现我们人类耳朵对声音…

一文带你了解什么是PACS系统源码

▷ 运维级带三维重建和还原的医院PACS系统有源码,有演示,带使用手册和操作说明书。 ▷ PACS系统及影像存取与传输系统( Picture Archiving and Communication System),为以实现医学影像数字化存储、诊断为核心任务,从医学影像设备…

uniapp小程序接入腾讯地图sdk

新建一个项目。配置uniapp配置文件设置小程序的appid注意:匿名用户可能存在地理定位失效。查uniapp官网官网->apiuni.getLocation(OBJECT) 获取当前的地理位置、速度。属性:success匿名函数返回值:uni.getLocation({type: gcj02,success: …

工作实战之密码防重放攻击

目录 前言 一、登录认证密码加密 二、bcrypt加密密码不一样,匹配原理 1.程序运行现象 2.原理解释 三、密码防重放 总结 前言 密码重放攻击:请求被攻击者获取,并重新发送给认证服务器,从而达到认证通过的目的 一、登录认证密…

系列八、SQL优化

一、插入数据 如果我们需要一次性往数据库表中插入多条记录,可以从以下三个方面进行优化。1.1、优化方案一(批量插入数据) Insert into tb_test values(1,Tom),(2,Cat),(3,Jerry); 1.2、优化方案二(手动控制事务) s…

CEC2005:星雀优化算法(Nutcracker optimizer algorithm,NOA)求解CEC2005(提供MATLAB代码)

一、星雀优化算法NOA 星雀优化算法(Nutcracker optimizer algorithm,NOA)由Mohamed Abdel-Basset等人于2023年提出,该算法模拟星雀的两种行为,即:在夏秋季节收集并储存食物,在春冬季节搜索食物的存储位置。 星鸦单独或成对活动&…

C语言循环语句do while和嵌套循环语句讲解

C do…while 循环 不像 for 和 while 循环,它们是在循环头部测试循环条件。在 C 语言中,do…while 循环是在循环的尾部检查它的条件。 do…while 循环与 while 循环类似,但是 do…while 循环会确保至少执行一次循环。 语法 C 语言中 do…w…

杂谈:数组index问题和对象key问题

面试题一: var arr [1, 2, 3, 4] 问:arr[1] ?; arr[1] ?答:arr[1] 2; arr[1] 2 这里可以再分为两个问题: 1、数组赋值 var arr [1, 2, 3, 4]arr[1] 10; // 数字场景 arr[10] 1; // 字符串场景 arr[a] 1; // 字符串…

索莫菲模型的一些理解 Smomerfeld Model

如何解释传统热容算出来的数值与量子模型下的区别? 因为只有费米能附近的电子才能够进行移动,这个是问题的差别所在 我们下面就来介绍如何求费米能(费米能的计算) 既然费米能附近的电子很重要,那么附近的电子有多少很…

语义分割前储知识

CNN中的Layers 除了正向传播计算loss,反向传播更新parameters,我们还需要知道参数是如何计算的,这个很重要。 我们这里介绍几个在deep learning中经常用到的几个层,dense layer(全连接层),con…

Redis源码---有序集合为何能同时支持点查询和范围查询

目录 前言 Sorted Set 基本结构 跳表的设计与实现 跳表数据结构 跳表结点查询 跳表结点层数设置 哈希表和跳表的组合使用 前言 有序集合(Sorted Set)是 Redis 中一种重要的数据类型,它本身是集合类型,同时也可以支持集合中…

记一次Nodejs减低npm版本的踩坑日记

使用了npm install -g npm6.4.1指令之后,把npm版本减低了,让后悲催的就来了。 由于npm 6.4.1 已经过时,导致运行npm时出现 npm does not support Node.js v18.14.2 版本不兼容问题 升级npm版本,npm install -g npmlatest 没用还是…

DM-VIO论文翻译

简介 DM-VIO: Delayed Marginalization Visual-Inertial Odometry DM-VIO: 延迟边缘化惯性视觉里程计 花了两天时间捏着鼻子把这篇论文翻译完了,很多术语和状态的表达方式可能是和这个团队以前的工作DSO以及VI-DSO保持了一致,所以看起来很是费劲&#…

STM32开发(17)----CubeMX配置CRC

CubeMX配置CRC前言一、什么是CRC?二、实验过程1.STM32CubeMX配置2.代码实现重载printf3.实验结果总结前言 本章介绍使用STM32CubeMX对CRC进行配置的方法,CRC的目的是保证数据的完整性,所有的STM32芯片都内置了一个硬件的CRC计算模块&#xf…

指针的进阶【下篇】

文章目录📀8.指向函数指针数组的指针📀9.回调函数📀8.指向函数指针数组的指针 🌰请看代码与注释👇 int Add(int x, int y) {return x y; } int Sub(int x, int y) {return x - y; } int main() {int (*pf)(int, int…

T3 出行云原生容器化平台实践

作者:林勇,就职于南京领行科技股份有限公司,担任云原生负责人,也是公司容器化项目的负责人。主要负责 T3 出行云原生生态相关的所有工作,如服务容器化、多 Kubernetes 集群建设、应用混部、降本增效、云原生可观测性基…

2023年中小企业实施智能制造的建议

智能制造的载体是制造系统,制造系统从微观到宏观有不同的层次,主要包括制造装备、制造单元、制造车间(工厂)、制造企业和企业生态等。随着智能制造的深入推进,未来智能制造将向以下五个方向发展。 (一&…

FPGA采集AD7606全网最细讲解 提供串行和并行2套工程源码和技术支持

目录1、前言2、AD7606数据手册解读输入信号采集范围输出模式选择过采样率设置3、AD7606串行输出采集4、AD7606并行输出采集5、vivado仿真6、上板调试验证7、福利:工程代码的获取1、前言 AD7606是一款非常受欢迎的AD芯片,因为他支持8通道同时采集数据&am…

CFT Show 信息收集篇

CFT Show 信息收集篇1.CFT Show 信息收集篇1.1.WEB-11.1.1.打开靶场1.1.2.寻找Flag1.2.WEB-21.2.1.打开靶场1.2.2.寻找Flag1.3.WEB-31.3.1.打开靶场1.3.2.寻找Flag1.3.2.1.F12查看器1.3.2.2.查看源码1.3.2.3.抓包1.4.WEB-41.4.1.打开靶场1.4.2.寻找Flag1.4.2.1.robots介绍1.4.2…