PHP对接百度语音识别技术

news2025/1/10 19:12:25

PHP对接百度语音识别技术

引言

在目前的各种应用场景中,语音识别技术已经越来越常用,并且其应用场景正在不断扩大。

百度提供的语音识别服务允许用户通过简单的接口调用,将语音内容转换为文本。

本文将通过PHP语言集成百度的语音识别服务,并分享一些实施过程中的技巧和需要注意的问题。

准备工作

1.注册百度开放平台账号

在百度官网https://open.baidu.com/ 注册一个账号

2.创建应用并获取API Key和Secret Key

注册完毕后,登录百度开放平台;

点击左侧菜单栏中的"AI开放平台";

然后选择"语音技术",再选择"语音识别"。

在语音识别页面中,点击"创建应用",填写相关信息并提交。

创建成功后,我们可以在应用管理页面中获得API Key和Secret Key;

这两个密钥将在后续中使用。

在这里插入图片描述

3.运行命令安装Laravel框架百度平台扩展包

composer require zhangyu-cq/laravel-baidu-aip

发布配置

php artisan vendor:publish --provider="ZhangyuCq\LaravelBaiduAip\BaiduAipServiceProvider"

配置对应的密钥

    return [
        'app_id' => env('BAIDU_APP_ID',''),
        'app_key' => env('BAIDU_APP_KEY',''),
        'app_secret' => env('BAIDU_APP_SECRET','')
    ];

封装百度语音识别接口

百度语音转文字

public function asrChar(Request $request)
    {
        $this->validate($request, [
            'file' => 'required',
        ]);
        $file = $request->file('file');
        $name = $file->getClientOriginalName();
        $file_info = pathinfo($name);
        $file = file_get_contents($file);
        $data = AipSpeech::asr($file, $file_info['extension'], 16000, ['dev_pid' => 1537]);
        if ($data['err_no'] == 0) {
            $text = $data['result'][0];
            echo $text;
        } else {
            echo '转译失败:'.$data['err_msg'];
        }
    }

百度文字转语音

    public function synthesis(Request $request)
    {
        $this->validate($request, [
            'content' => 'required',
        ]);
        $content = $request->get('content');
        $data = AipSpeech::synthesis($content, 'zh', 1, array(
            'vol' => 5,
        ));
        $time = date('YmdHis') . rand(111111, 999999);
        //设置上传到哪个目录下
        $path = '/uploads/synthesis';
        $file_name = "/$time.mp3";
        //没有则创建
        if (!file_exists(public_path() . $path)) {
            mkdir(public_path() . $path, 0755, true);
        }
        file_put_contents(public_path() . $path . $file_name, $data);
        echo '文件路径如下:'.$path . $file_name;
    }

踩坑日记

百度语音识别接口对音频文件有特定的要求:它仅接受16KHz采样率的wav格式文件。

如果需要识别的音频文件不符合这些要求,必须先转换成合适的格式和采样率。

此外,接口对音频的长度也有限制,单次识别不能超过60秒,因此长音频需要被分割成多个短片段。

在使用接口时,还需要注意错误处理:

通过检查返回结果中的err_no来判断识别是否成功,并根据err_msg字段来处理识别失败的情况。

结论

我们已经能够成功地集成PHP与百度语音识别接口,并根据接口返回的数据执行相应的操作。

在实际的开发过程中,我们还可以进一步扩展功能,例如实现实时的语音识别服务或语音合成技术,以满足更广泛的业务需求。

– 欢迎点赞、关注、转发、收藏【我码玄黄】,gonghao同名

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1709191.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C# 读取 CSV 文件的方法汇总

文章目录 1. 使用System.IO命名空间中的类2. 处理标题行和指定列3. 使用CsvHelper库4. 高级功能和异常处理5. 使用 LINQ6. 总结 CSV(Comma-Separated Values,逗号分隔值)文件是一种简单的文本文件格式,用于存储表格数据。在C#中&a…

C/C++连接MySQL

本章Gitee仓库地址:mysql连接基本操作 文章目录 1. mysql connect库2. mysql相关接口2.1 mysql_init()2.2 mysql_real_connect()2.3 mysql_query()2.4 mysql_store_result()2.41 mysql_num_rows2.42 mysql_num_fields2.43 mysql_fetch_row2.44 mysql_fetch_fields 2…

Enable Full Line suggestions 启用全行建议

开启后效果如下: 直接提示可能要输入的参数

【UE5.1 角色练习】06-角色发射火球-part2

目录 效果 步骤 一、火球生命周期 二、添加可被伤害的NPC 三、添加冲量 在上一篇(【UE5.1 角色练习】06-角色发射火球-part1)基础上继续实现角色发射火球相关功能 效果 步骤 一、火球生命周期 为了防止火球没有命中任何物体而一直移动下去&#…

React@16.x(12)ref 转发-forwardRef

目录 1,介绍2,类组件如何使用4,应用场景-高阶组件HOC 1,介绍 上篇文章中提到,ref 只能对类组件使用,不能对函数组件使用。 而 ref 转发可以对函数组件实现类似的功能。 使用举例: import Re…

【Linux】线程安全及锁的使用

文章目录 前言一、锁1.定义一个锁变量2.pthread_mutex_init3.pthread_mutex_destroy4.pthread_mutex_lock/pthread_mutex_unlock5.静态变量锁和全局变量锁的初始化 二、问题描述及锁的运用三、RAII风格的锁 前言 临界资源: 在多个线程或进程间共享的资源. 临界区: 代码中访问临…

《TCP/IP网络编程》(第十二章)I/O复用(1)

本章将讨论实现并发服务器的第二种办法,基于I/O复用的服务器端构建。 I/O复用它允许单个进程或线程同时处理多个输入/输出(I/O)操作,而无需为每个I/O操作创建一个独立的线程或进程。这种技术可以显著提高应用程序的效率和性能&…

2024最新TikTok抖音国际版,tiktok正版免拔卡安装来了!

保姆级教程!2024最新TikTok抖音国际版,无限制!tiktok正版免拔卡安装方法来了! TikTok这款APP为何让全球都为之疯狂?因为它更懂人性,懂的人都懂! 我是你的老朋友阿星,今天阿星要给大…

CTF网络安全大赛简单的web抓包题目:HEADache

题目来源于&#xff1a;bugku 题目难度&#xff1a;简单 题目 描  述: > Wanna learn about some types of headache? > Lets dig right into it! 下面是题目源代码&#xff1a; <!DOCTYPE html> <html> <head><meta charset"utf-8"&…

通过提示工程将化学知识整合到大型语言模型中

在当今快速发展的人工智能领域&#xff0c;大型语言模型&#xff08;LLMs&#xff09;正成为科学研究的新兴工具。这些模型以其卓越的语言处理能力和零样本推理而闻名&#xff0c;为解决传统科学问题提供了全新的途径。然而&#xff0c;LLMs在特定科学领域的应用面临挑战&#…

《java数据结构》--队列详解

一.认识队列&#x1f431; 初识队列&#x1f638; 队列和栈类似都对数据的存取有着严格的要求&#xff0c;不同的是栈遵循先进后出的原则&#xff0c;而队列遵循先进先出的原则&#xff0c;栈是只有一端可以存取&#xff0c;队列是一端存&#xff0c;一端取。这里我来画一个图…

echarts-象形柱图

象形柱图 一般的柱图都是纯色柱图&#xff0c;使用象形柱图可以给柱图定义自己的样式。 样式的调节与柱图一样&#xff0c;核心在于symbol调节柱图的组成。 let options {tooltip: {},xAxis: {type: "category",data: ["d1", "d2", "d3&qu…

Golang | Leetcode Golang题解之第103题二叉树的锯齿形层序遍历

题目&#xff1a; 题解&#xff1a; func zigzagLevelOrder(root *TreeNode) (ans [][]int) {if root nil {return}queue : []*TreeNode{root}for level : 0; len(queue) > 0; level {vals : []int{}q : queuequeue nilfor _, node : range q {vals append(vals, node.V…

啊哈!算法-第2章-栈、队列、链表

啊哈!算法-第2章-栈、队列、链表 第1节 解密qq号——队列第2节 解密回文——栈第3节 纸牌游戏——小猫钓鱼第4节 链表第5节 模拟链表 第1节 解密qq号——队列 新学期开始了&#xff0c;小哈是小哼的新同桌(小哈是个大帅哥哦~)&#xff0c;小哼向小哈询问 QQ 号&#xff0c; 小…

揭秘:如何使用Python统计女友生日还剩几天?

新书上架~&#x1f447;全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我&#x1f446;&#xff0c;收藏下次不迷路┗|&#xff40;O′|┛ 嗷~~ 目录 一、引言&#xff1a;为何需要统计生日天数&#xff1f; 二、需求分析与准备 1. 用户输入格…

【设计模式】JAVA Design Patterns——Curiously Recurring Template Pattern(奇异递归模板模式)

&#x1f50d;目的 允许派生组件从与派生类型兼容的基本组件继承某些功能。 &#x1f50d;解释 真实世界例子 对于正在策划赛事的综合格斗推广活动来说&#xff0c;确保在相同重量级的运动员之间组织比赛至关重要。这样可以防止体型明显不同的拳手之间的不匹配&#xff0c;例如…

云服务器平台AutoDL--基本介绍与使用感受

因为课程作业需要复现DreamBooth&#xff0c;找了几个教程之后&#xff0c;发现了AutoDL这个好东西&#xff0c;芜湖~ 相关概念 以下回答来自于ChatGPT。 云计算平台&#xff1a;云服务器平台是提供按需计算资源和服务的在线平台&#xff0c;通常包括存储、处理能力、数据库、…

Servlet跳转404(解决)

1.解决无法跳转的404问题&#xff08;最根本&#xff0c;最重要&#xff09; 查看Project Structure&#xff0c;检查你的JDK版本不要选错版本&#xff1b; 2.页面跳转&#xff0c;url栏输入的是web.xml中的url-pattern内容&#xff0c;请仔细检查 3.关于配置信息Applicatio…

TIM输出比较

一、OC&#xff08;Output Compare&#xff09;输出比较 1、输出比较可以通过比较CNT&#xff08;计数器&#xff09;与CCR&#xff08;捕获/比较寄存器&#xff09;寄存器值的关系&#xff0c;来对输出电平进行置1、置0或翻转的操作&#xff0c;用于输出一定频率和占空比的PW…

C++之对象的使用

1、static成员 2、static成员优点 2、static成员函数 静态成员函数不能访问非静态成员原因&#xff1a;因为没有this指针。也不可以访问非静态成员函数。 可以通过对象来访问静态成员&#xff0c;但是不推荐这么使用&#xff0c;会让人误解成这个x_是属于对象的&#xff0c;但…