使用百度开发者平台处理语音朗读

news2024/9/27 12:25:55

--TIME

--百度开发者中心-汇聚、开放、助力、共赢

--注册账号

 -- 准备工作

准备工作

更新时间:2023-01-13

成为开发者

三步完成账号的基本注册与认证:

STEP1:点击进入控制台,选择需要使用的AI服务项。若为未登录状态,将跳转至登录界面,请您使用百度账号登录。如还未持有百度账户,可以点击此处注册百度账号。

STEP2:首次使用,登录后将会进入开发者认证页面,请填写相关信息完成开发者认证。注:(如您之前已经是百度云用户或百度开发者中心用户,此步可略过。)

STEP3:通过控制台左侧导航,选择语音技术,进入语音技术的控制面板,进行相关操作。

BB4979E6-CF98-4639-BFAE-696361D6EE1F.JPG

领取免费额度

新用户使用语音技术可以在控制台领取相应接口的免费测试额度进行接口调用,免费额度有效期自领取成功之日开始计算,有效期截止后,免费调用额度清零。详情可点击此处查看 语音识别免费额度 | 语音合成免费额度 | 呼叫中心语音免费额度。

微信截图_20221130182012.png

创建应用

您需要创建应用才可正式调用语音技术能力,应用是您调用服务的基本操作单元,您可以基于应用创建成功后获取的API Key及Secret Key,进行接口调用操作,及相关配置。您可按照下图所示的操作流程,完成创建操作。

微信截图_20221130182124.png

微信截图_20221130182151.png

应用名称: 用于标识您所创建的应用的名称,支持中英文、数字、下划线及中横线,此名称一经创建完毕,不可修改。

接口选择: 每个应用可以勾选业务所需的所有AI服务的接口权限(仅可勾选具备免费试用权限的接口能力),语音技术下全部接口已默认勾选,创建应用完毕,此应用即具备了所勾选服务的调用权限。

语音包名:如果您需要使用语音技术SDK服务(iOS/Android),需要绑定包名信息,以便生成授权License。

应用归属:可选择个人使用或公司使用服务,若为公司使用,可与专属商务经理沟通,获取专业的售前支持。

应用描述: 对此应用的业务场景进行描述。

获取密钥

在您创建完毕应用后,平台将会分配给您此应用的相关凭证,主要为AppID、API Key、Secret Key。以上三个信息是您应用实际开发的主要凭证,请您妥善保管。下图为示例内容:

image.png

生成签名

您需要使用创建应用所分配到的AppID、API Key及Secret Key,进行Access Token(用户身份验证和授权的凭证)的生成,方法详见 Access Token获取,我们为您准备了几种常见语言的请求示例代码。

温馨提示:Access Token的有效期为30天(以秒为单位),请您集成时注意在程序中定期请求新的token。

启动开发

目前语音技术主要有两种方式使用:API与SDK,您可以选择各产品的文档,查看具体使用方法及参数。详情可点击此处查看 语音识别导览 | 语音合成导览 | 呼叫中心语音导览。

 

如何用可视化工具调用

更新时间:2023-01-13

如何使用 Postman 调用语音技术服务 API

本文提供了通过可视化工具 Postman 调用短文本语音合成 API 的样例,帮助您零编码快速体验并熟悉语音技术服务。

1. 下载并安装接口调用工具

1.1 下载接口调用工具 — Postman

下载地址如下:

Mac 下载地址,点击前往>>

Windows 下载地址,点击前往>>

1.2 Postman 安装教程

(1)双击安装包。

(2)初次登录无账号,可直接进入 postman 主界面。

2. 获取 Access Token

将请求格式改为 “POST” 并填写请求地址:https://aip.baidubce.com/oauth/2.0/token

微信截图_20221130185421.png

点击 Body,选择“x-www-form-urlencoded”,在 key 和 value 中分别输入以下3个请求参数。

grant_type: 必须参数,固定为 client_credentials

client_id: 必须参数,应用的 API Key

client_secret: 必须参数,应用的 Secret Key

微信截图_20221130185459.png

点击右上角蓝色“send”,即可在下方返回值区域中获取 access_token。

微信截图_20221130185603.png

3. 进行接口调用

3.1 接口调用 具体操作如下:

(1) 将请求格式改为 “POST” 并填写请求地址(以短文本语音合成为例):https://tsn.baidu.com/text2audio

微信截图_20221130190152.png

(2)点击 Body,选择“x-www-form-urlencoded”,在 key 和 value 中分别输入以下请求参数。

tex: 必须参数,合成文本

tok: 必须参数,获取到的access_token参数

cuid: 必须参数,用户唯一标识

ctp: 必须参数,客户端类型选择,web端填写固定值 1

lan: 必须参数,固定值 zh

(更多参数请到短文本语音合成页面查看)

微信截图_20221130190448.png

(3) 修改请求头,点击 Headers,在 key 和 value 中分别输入1个请求参数。

key 栏输入:Content-Type

value 栏输入:application/x-www-form-urlencoded

微信截图_20221130190958.png

(4)点击右上角蓝色“send”,即可在下方返回值区域中获取音频。

微信截图_20221130190455.png

语音识别SDK

更新时间:2023-01-13

Android SDK快速集成指南

只需四步,即可完成语音识别SDK的应用集成,让您的应用获得稳定一致的识别体验。

Step1:成为百度AI开放平台的开发者

要调用百度AI开放平台的语音识别能力先要成为百度AI开放平台的开发者,首先让我们花5分钟来注册百度AI开放平台的开发者,并新建一个百度语音识别应用。

1. 创建帐户

先点击此处注册百度账户,快速建立一个百度账号,请参考下图: 

屏幕截图 2021-12-29 144649.png

2. 创建应用

创建账号之后,登录百度AI开放平台,并且点击此处创建一个应用,如下图:

创建APP1.png

创建应用时请务必输入应用名称、语音包名(输入示例demo包名:com.baidu.speech.recognizerdemo)等信息,创建完成后就可以看到创建的应用信息了:

创建APP2.png

创建完成的应用信息如下图所示:

APP3.png

Step2:申请语音识别额度

1. 实名认证

语音识别SDK需要完成实名认证后才能使用,第一步需要按照提示完成个人认证或企业认证。完成实名认证的用户可以领取免费额度。如下图所示进行实名认证: 

实名认证.png

2. 领取免费额度

完成实名认证后,需领取语音识别的免费额度。如下图所示:

领取免费额度.png

Step3:下载语音识别SDK,填写授权信息

1. 获取鉴权信息

准备好创建应用后获取到的3个鉴权信息,AppID、API Key、Secret Key,需要您登陆控制台查看应用详情获取。

2. 下载语音识别SDK

在SDK下载页面下载 语音识别Android SDK 文件,链接:SDK下载_文字识别SDK_语音识别SDK-百度AI开放平台

3. 不修改SDK,直接运行

解压sdk文件,不做任何修改,直接安装运行程序可以看到以下界面:

安卓修改1.png

4. 填写鉴权信息

填入 AppID、API Key、Secret Key 3个鉴权信息测试,请按照以下步骤全部修改:

修改参数.JPG

Step4: 测试语音识别功能

1. 按照上述文档修改完成后,安装app打开后进入在线识别,点击开始录音可进行在线语音识别:

安卓修改2.png

简单的 语音识别Android SDK 测试完成了,其他各子功能可以按照详细的技术文档进行集成。


 

iOS SDK快速集成指南

只需四步,即可完成语音识别SDK的应用集成,让您的应用获得稳定一致的识别体验。

Step1:成为百度AI开放平台的开发者

要调用百度AI开放平台的语音识别能力先要成为百度AI开放平台的开发者,首先让我们花5分钟来注册百度AI开放平台的开发者,并新建一个百度语音识别应用。

1. 创建帐户

先点击此处注册百度账户,快速建立一个百度账号,请参考下图: 

屏幕截图 2021-12-29 144649.png

2. 创建应用

创建账号之后,登录百度AI开放平台,并且点击此处创建一个应用,如下图:

创建APP1.png

创建应用时请务必输入应用名称、语音包名(输入示例demo包名:com.baidu.speech.BDSClientSample)等信息,创建完成后就可以看到创建的应用信息了:

ios包名创建.png

创建完成的应用信息如下图所示:

iosapp2.png

Step2:申请语音识别额度

1. 实名认证

语音识别SDK需要完成实名认证后才能使用,第一步需要按照提示完成个人认证或企业认证。完成实名认证的用户可以领取免费额度。如下图所示进行实名认证: 

实名认证.png

2. 领取免费额度

完成实名认证后,需领取语音识别的免费额度。如下图所示:

领取免费额度.png

Step3:下载语音识别SDK,填写授权信息

1. 获取鉴权信息

准备好创建应用后获取到的3个鉴权信息,AppID、API Key、Secret Key,需要您登陆控制台查看应用详情获取

2. 下载语音识别SDK

在SDK下载页面下载 语音识别IOS SDK 文件,链接:SDK下载_文字识别SDK_语音识别SDK-百度AI开放平台

3. 填写鉴权信息

填入 AppID、API Key、Secret Key 3个鉴权信息测试,请按照以下步骤全部修改:

IOS鉴权修改.png

Step4: 测试语音识别功能

1. 按照上述文档修改完成后,安装app打开后可进行在线语音识别:

ios识别.png

简单的 语音识别IOS SDK 测试完成了,其他各子功能可以按照详细的技术文档进行集成。

 

百度AI开放平台 语音文档~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1284373.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CleanMyMac X2024破解注册激活码

CleanMyMac X for Mac中文2024版只需两个简单步骤就可以把系统里那些乱七八糟的无用文件统统清理掉,节省宝贵的磁盘空间。 cleanmymac x个人认为X代表界面上的最大升级,功能方面有更多增加,与最新macOS系统更加兼容,流畅地与系统性…

MacBook Pro 安装Redis【超详细图解】

目录 一、使用brew安装Redis 二、查看安装及配置文件位置 三、启动Redis 3.1 查看redis服务进程 3.2 redis-cli连接redis服务 四、关闭Redis 因项目需要,顺便记录安装过程 一、使用brew安装Redis brew install redis 如图所示即为安装成功! 二…

csdn语法说明/csdn新手指导/csdn入门指导/csdn博文助手

文章目录 1、文章目录2、标题3、文本样式3.1、强调、加粗、黄色标记、删除、引用、乘方,化学表达式3.2、标红、按钮效果 4、功能快捷键5、注脚、注释6、链接7、图片8、列表9、表格 本篇博文主要写一下csdn博文中的语法说明。 1、文章目录 [TOC](这里写自定义目录标…

谈谈压测方案的那点事

📢专注于分享软件测试干货内容,欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!📢交流讨论:欢迎加入我们一起学习!📢资源分享:耗时200小时精选的「软件测试」资…

论文解读:EfficientViT-提高吞吐量

摘要 要解决的问题 Vision transformers have shown great success due to their high model capabilities. However, their remarkable performance is accompanied by heavy computation costs, which makes them unsuitable for real-time applications. vit计算开销大&a…

人工智能学习7(决策树算法)

编译工具:PyCharm 文章目录 编译工具:PyCharm 决策树算法信息熵信息熵例题计算: 信息增益(决策树划分依据之一ID3)信息增益例题计算: 信息增益率(决策树划分依据之一C4.5)基尼值和基尼指数(决策树划分依据之…

蓝桥杯物联网竞赛_STM32L071KBU6_全部工程及源码

包含stm32L071kbu6全部实验工程、源码、原理图、官方提供参考代码及原理图 链接:https://pan.baidu.com/s/1xm8mLotLBvOULQlg76ca7g?pwdp0mx 提取码:p0mx

边缘计算网关构建智慧楼宇新生态,打造未来建筑管理

边缘计算网关在无人值守环境中的应用十分广泛,尤其在智慧楼宇管理方面发挥着重要作用。它能够实现多个地点多楼宇之间的数据实时互通,通过边缘计算网关物联网应用构建智慧楼宇生态系统,解决传统楼宇管理网络布线、人员巡检以及后期运维等问题…

SQL Server 数据库,创建数据表(使用T-SQL语句)

2.3表的基本概念 表是包含数据库中所有数据的数据库对象。数据在表中的组织方式与在电子表格中相似,都是 按行和列的格式组织的,每行代表一条唯一的记录,每列代表记录中的一个字段.例如,在包含公 司员工信息的表中,每行…

深度学习模型部署与优化:关键考虑与实践策略

4. 深度学习模型部署与优化:关键考虑与实践策略 4.1 FLOPS TOPS 首先,我们来解释FLOPS和TOPS的含义: FLOPS:是Floating Point Operations Per Second的缩写,意思是每秒浮点运算次数。它是衡量计算机或计算设备在每秒…

深入理解JVM虚拟机第二十七篇:详解JVM当中InvokeDynamic字节码指令,Java是动态类型语言么?

😉😉 学习交流群: ✅✅1:这是孙哥suns给大家的福利! ✨✨2:我们免费分享Netty、Dubbo、k8s、Mybatis、Spring...应用和源码级别的视频资料 🥭🥭3:QQ群:583783824 📚📚 工作微信:BigTreeJava 拉你进微信群,免费领取! 🍎🍎4:本文章内容出自上述:Sp…

前端漏洞--front(系统有user1/user1,admin1/admin1两个用户)

任务一:挖掘反射型XSS漏洞(以弹窗test13)证明 任务二:复现环境中的CSRF漏洞,设计表单,当管理员点击URL后自动将自己密码重置为:123456 任务三:复现环境中的JSON Hijacking漏洞&#…

【MySQL环境配置在虚拟机中】

MySQL环境配置在虚拟机中 先检查虚拟机中是否有MySQL在线安装1.下载yum Repository2.安装yum Repository3.安装mysql5.7的服务4.开机自启动5.启动mysql6.查看状态7.获取临时密码8.登录mysql9.关闭密码复杂验证10.设置密码11.修改权限12.卸载yum Repository 离线安装1.先找一下机…

【题目】栈和队列专题

文章目录 专题一:栈系列1. 中缀表达式转后缀表达式(逆波兰式)2. 有效的括号3. 用栈实现队列4. 最小栈 专题一:栈系列 1. 中缀表达式转后缀表达式(逆波兰式) 算法原理 2. 有效的括号 题目链接 算法原理 代…

uniapp:如何使用uCharts

目录 第一章 前言 第二章 安装插件uCharts 第三章 使用uCharts 第四章 注意 第一章 前言 需求:这是很久之前的一个项目的需求了,当时我刚接触app,有这么一个需求,在uniapp写的app项目中做一些图表统计,最开始以为…

基础堆溢出原理与DWORD SHOOT实现

堆介绍 堆的数据结构与管理策略 程序员在使用堆时只需要做三件事情:申请一定大小的内存,使用内存,释放内存。 对于堆管理系统来说,响应程序的内存使用申请就意味着要在"杂乱"的堆区中"辨别"出哪些内存是正在…

登录校验过滤器

会话技术 JWT令牌 过滤器Filter 拦截器 interceptor cookise package com.it.controller;import com.it.pojo.Result; import lombok.extern.slf4j.Slf4j; import org.springframework.web.bind.annotation.GetMapping; import org.springframework.web.bind.annotation.Re…

密集书库是什么意思?图书馆密集书库的书可以借出吗

密集书库是一种用于存储大量书籍和资料的高密度储存设施。它通常包括一系列钢制书架和可移动的储存架,使得书籍可以被紧密地排列和存储,以最大程度地利用存储空间。同时,密集书库还有各种自动化系统,如自动化取书系统、气候控制系…

bad_python

攻防世界 (xctf.org.cn) 前戏 下载文件,解压完成后是这个 一个pyc文件 这里要用到python的反编译 要用到的工具有两个 1.python自带的uncompyle6 2.pycdc文件——比uncompyle6强大一点 我们一个一个来尝试一下 uncompyle6: 我是直接在pycharm里面…

骨传导耳机音量大了有害吗?骨传导能保护听力吗?

无论是传统耳机还是骨传导耳机,只要使用音量过大,都会对有一定的损伤,然而由于骨传导耳机的传声原理和佩戴方式比较特殊,所以对人体的损伤比较小,想要知道骨传导耳机能否保护听力,就要先了解骨传导耳机的传…