Android集成科大讯飞语音识别与语音唤醒简易封装

news2024/11/24 17:50:54

一、语音唤醒部分

1、首先在科大讯飞官网注册开发者账号

控制台-讯飞开放平台

2、配置唤醒词然后下载sdk

3、选择对应功能下载

4、语音唤醒lib包全部复制到工程目录下

5、把语音唤醒词文件复制到工程的assets目录

6、复制对应权限到AndroidManifest.xml中

    <uses-permission android:name="android.permission.INTERNET" />
    <uses-permission android:name="android.permission.RECORD_AUDIO" />
    <uses-permission android:name="android.permission.READ_PHONE_STATE" />

     <!-- App 需要使用的部分权限 -->
    <uses-permission android:name="android.permission.READ_PHONE_STATE" />
    <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />
    <!-- 科大讯飞 -->
    <uses-permission
        android:name="android.permission.MOUNT_UNMOUNT_FILESYSTEMS"
        tools:ignore="ProtectedPermissions" />
    <uses-permission
        android:name="android.permission.READ_PRIVILEGED_PHONE_STATE"
        tools:ignore="ProtectedPermissions" />
    <uses-permission
        android:name="android.permission.MANAGE_EXTERNAL_STORAGE"
        tools:ignore="ProtectedPermissions" />
    <uses-permission
        android:name="android.permission.READ_PHONE_NUMBERS"
        tools:ignore="ProtectedPermissions" />

7、唤醒工具类封装

 其中IflytekAPP_id为科大讯飞平台的应用id


public abstract class WakeUpUtil {
    private static AutoTouch autoTouch = new AutoTouch();//自动点击屏幕
    /**
     * 唤醒的回调
     */
    public abstract void wakeUp(String resultString);

    // Log标签
    private static final String TAG = "WakeUpUtil";

    // 上下文
    private static Context mContext;
    // 语音唤醒对象
    private VoiceWakeuper mIvw;

    //唤醒门限值
    //门限值越高,则要求匹配度越高,才能唤醒
    //值范围:[0,3000]
    //默认值:1450
    private static int curThresh = 1450;

    public WakeUpUtil(Context context) {
        initKedaXun(context);

        mContext = context;
        // 初始化唤醒对象
        mIvw = VoiceWakeuper.createWakeuper(context, null);
        Log.d("initLogData", "===进入唤醒工具类====");

    }

    /**
     * 获取唤醒词功能
     *
     * @return 返回文件位置
     */
    private static String getResource() {
        final String resPath = ResourceUtil.generateResourcePath(mContext, RESOURCE_TYPE.assets, "ivw/" + "cf22564a" + ".jet");
        return resPath;
    }

    /**
     * 唤醒
     */
    public void wake() {
        Log.d("initLogData", "===进入唤醒工具类====");
        // 非空判断,防止因空指针使程序崩溃
        VoiceWakeuper mIvw = VoiceWakeuper.getWakeuper();
        if (mIvw != null) {
            // textView.setText(resultString);
            // 清空参数
            mIvw.setParameter(SpeechConstant.PARAMS, null);
            // 设置唤醒资源路径
            mIvw.setParameter(SpeechConstant.IVW_RES_PATH, getResource());
            // 唤醒门限值,根据资源携带的唤醒词个数按照“id:门限;id:门限”的格式传入
            mIvw.setParameter(SpeechConstant.IVW_THRESHOLD, "0:" + curThresh);
            // 设置唤醒模式
            mIvw.setParameter(SpeechConstant.IVW_SST, "wakeup");
            // 设置持续进行唤醒
            mIvw.setParameter(SpeechConstant.KEEP_ALIVE, "1");
            mIvw.startListening(mWakeuperListener);
            Log.d("initLogData", "====唤醒====");
        } else {
            Log.d("initLogData", "===唤醒未初始化11====");
//            Toast.makeText(mContext, "唤醒未初始化1", Toast.LENGTH_SHORT).show();
        }
    }

    public void stopWake() {
        mIvw = VoiceWakeuper.getWakeuper();
        if (mIvw != null) {
            mIvw.stopListening();
        } else {
            Log.d("initLogData", "===唤醒未初始化222====");
//            Toast.makeText(mContext, "唤醒未初始化2", Toast.LENGTH_SHORT).show();
        }
    }

    String resultString = "";
    private WakeuperListener mWakeuperListener = new WakeuperListener() {

        @Override
        public void onResult(WakeuperResult result) {
            try {

                String text = result.getResultString();
                JSONObject object;
                object = new JSONObject(text);
                StringBuffer buffer = new StringBuffer();
                buffer.append("【RAW】 " + text);
                buffer.append("\n");
                buffer.append("【操作类型】" + object.optString("sst"));
                buffer.append("\n");
                buffer.append("【唤醒词id】" + object.optString("id"));
                buffer.append("\n");
                buffer.append("【得分】" + object.optString("score"));
                buffer.append("\n");
                buffer.append("【前端点】" + object.optString("bos"));
                buffer.append("\n");
                buffer.append("【尾端点】" + object.optString("eos"));
                resultString = buffer.toString();
                stopWake();
                autoTouch.autoClickPos( 0.1, 0.1);

                wakeUp(resultString);
//                MyEventManager.postMsg("" + resultString, "voicesWakeListener");

            } catch (JSONException e) {
                MyEventManager.postMsg("" + "结果解析出错", "voicesWakeListener");
                resultString = "结果解析出错";
                wakeUp(resultString);
                e.printStackTrace();
            }

//            Logger.d("===开始说话==="+resultString);
        }

        @Override
        public void onError(SpeechError error) {

            MyEventManager.postMsg("" + "唤醒出错", "voicesWakeListener");
        }

        @Override
        public void onBeginOfSpeech() {
            Log.d("initLogData", "===唤醒onBeginOfSpeech====");
        }

        @Override
        public void onEvent(int eventType, int isLast, int arg2, Bundle obj) {
//            Log.d("initLogData", "===唤醒onEvent===" + eventType);
        }

        @Override
        public void onVolumeChanged(int i) {
//            Log.d("initLogData", "===开始说话==="+i);
        }
    };

    /**
     * 科大讯飞
     * 语音sdk
     * 初始化
     */
    public void initKedaXun(Context context) {

        // 初始化参数构建
        StringBuffer param = new StringBuffer();
        //IflytekAPP_id为我们申请的Appid
        param.append("appid=" + context.getString(R.string.IflytekAPP_id));
        param.append(",");
        // 设置使用v5+
        param.append(SpeechConstant.ENGINE_MODE + "=" + SpeechConstant.MODE_MSC);
        SpeechUtility.createUtility(context, param.toString());
        Log.d("initLogData", "===在appacation中初始化=====");
    }

}

使用直接调用即可


    /**
     * 科大讯飞
     * 语音唤醒
     * 对象
     */
    private WakeUpUtil wakeUpUtil;

    private void voiceWake() {

        Log.d("initLogData", "===执行唤醒服务====");
        wakeUpUtil = new WakeUpUtil(this) {
            @Override
            public void wakeUp(String result) {
                MyEventManager.postMsg("" + "唤醒成功", "voicesWakeListener");
                Log.d("initLogData", "====唤醒成功===========" + result);

                // 开启唤醒
                wakeUpUtil.wake();
            }
        };
        wakeUpUtil.wake();

    }

到此语音唤醒已经集成结束,接下来是语音识别。

二、语音识别

1、工具类


/**
 * 科大讯飞
 * 语音识别
 * 工具类
 */
public class KDVoiceRegUtils {

    private SpeechRecognizer mIat;
    private RecognizerListener mRecognizerListener;
    private InitListener mInitListener;

    private StringBuilder result = new StringBuilder();
    // 函数调用返回值
    private int resultCode = 0;

    /**
     * 利用AtomicReference
     */
    private static final AtomicReference<KDVoiceRegUtils> INSTANCE = new AtomicReference<KDVoiceRegUtils>();

    /**
     * 私有化
     */
    private KDVoiceRegUtils() {

    }

    /**
     * 用CAS确保线程安全
     */
    public static final KDVoiceRegUtils getInstance() {
        for (; ; ) {
            KDVoiceRegUtils current = INSTANCE.get();
            if (current != null) {
                return current;
            }
            current = new KDVoiceRegUtils();
            if (INSTANCE.compareAndSet(null, current)) {
                return current;
            }

            Log.d("initLogData", "===科大讯飞实例化===大哥大哥==");
        }
    }

    /**
     * 初始化
     * 监听
     */
    public void initVoiceRecorgnise(Context ct) {

        if (mInitListener != null || mRecognizerListener != null) {
            return;
        }

        mInitListener = new InitListener() {

            @Override
            public void onInit(int code) {
//            Log.e(TAG, "SpeechRecognizer init() code = " + code);
                Log.d("initLogData", "===科大讯飞唤醒初始化===" + code);
                if (code != ErrorCode.SUCCESS) {
//                showToast("初始化失败,错误码:" + code + ",请点击网址https://www.xfyun.cn/document/error-code查询解决方案");
                }
            }
        };

        //识别监听
        mRecognizerListener = new RecognizerListener() {
            @Override
            public void onBeginOfSpeech() {
                // 此回调表示:sdk内部录音机已经准备好了,用户可以开始语音输入
                Log.d("initLogData", "=====开始说话======");
            }

            @Override
            public void onError(SpeechError error) {
                // Tips:
                // 错误码:10118(您没有说话),可能是录音机权限被禁,需要提示用户打开应用的录音权限。
//                Log.d("initLogData", "====错误说话=====" + error.getPlainDescription(true));
                senVoicesMsg(300, "识别错误 ");//100启动语音识别    200识别成功   300识别错误
                mIat.stopListening();
                hideDialog();
            }

            @Override
            public void onEndOfSpeech() {
                // 此回调表示:检测到了语音的尾端点,已经进入识别过程,不再接受语音输入
                mIat.stopListening();
//                Log.d("initLogData", "=====结束说话======");
                hideDialog();

            }

            @Override
            public void onResult(RecognizerResult results, boolean isLast) {

                String text = parseIatResult(results.getResultString());
//                Log.d("initLogData", "==说话==语音识别结果==initVoice==" + text);
                result.append(text);
                if (!text.trim().isEmpty() && boxDialog != null) {
                    senVoicesMsg(200, "识别成功");//100启动语音识别    200识别成功   300识别错误
                    boxDialog.showTxtContent(result.toString());
                    senVoicesMsg(200, "" + result.toString());
                }

                if (isLast) {
                    result.setLength(0);
                }

            }

            @Override
            public void onVolumeChanged(int volume, byte[] data) {
                //showToast("当前正在说话,音量大小:" + volume);
                if (volume > 0 && boxDialog != null) {
                    boxDialog.showTxtContent("录音中...");
                }
                Log.d("initLogData", "===说话==onVolumeChanged:====" + volume);
            }

            @Override
            public void onEvent(int eventType, int arg1, int arg2, Bundle obj) {
                // 以下代码用于获取与云端的会话id,当业务出错时将会话id提供给技术支持人员,可用于查询会话日志,定位出错原因
                // 若使用本地能力,会话id为null
                if (SpeechEvent.EVENT_SESSION_ID == eventType) {
                    String sid = obj.getString(SpeechEvent.KEY_EVENT_SESSION_ID);

                }
            }
        };

        // 初始化识别无UI识别对象
        // 使用SpeechRecognizer对象,可根据回调消息自定义界面;
        mIat = SpeechRecognizer.createRecognizer(ct, mInitListener);
        if (mIat != null) {
            setIatParam();//参数配置
        }

    }

    /**
     * 执行语音
     * 识别
     */
    public void startVoice(Context context) {
        senVoicesMsg(100, "启动语音识别");//100启动语音识别    200识别成功   300识别错误
        if (mIat != null) {
            showDialog(context);
            mIat.startListening(mRecognizerListener);
        }
    }

    /**
     * 科大讯飞
     * 语音识别
     * 参数配置
     */
    private void setIatParam() {

        // 清空参数
        mIat.setParameter(com.iflytek.cloud.SpeechConstant.PARAMS, null);

        // 设置听写引擎
        mIat.setParameter(com.iflytek.cloud.SpeechConstant.ENGINE_TYPE, com.iflytek.cloud.SpeechConstant.TYPE_CLOUD);

        // 设置返回结果格式
        mIat.setParameter(com.iflytek.cloud.SpeechConstant.RESULT_TYPE, "json");

        // 设置语言
        mIat.setParameter(com.iflytek.cloud.SpeechConstant.LANGUAGE, "zh_cn");
        // 设置语言区域
        mIat.setParameter(com.iflytek.cloud.SpeechConstant.ACCENT, "mandarin");

        // 设置语音前端点:静音超时时间,即用户多长时间不说话则当做超时处理
        mIat.setParameter(com.iflytek.cloud.SpeechConstant.VAD_BOS, "4000");

        // 设置语音后端点:后端点静音检测时间,即用户停止说话多长时间内即认为不再输入, 自动停止录音
        mIat.setParameter(com.iflytek.cloud.SpeechConstant.VAD_EOS, "500");

        // 设置标点符号,设置为"0"返回结果无标点,设置为"1"返回结果有标点
        mIat.setParameter(com.iflytek.cloud.SpeechConstant.ASR_PTT, "0");

        Log.d("initLogData", "==语音是被==初始化成功:====");
        // 设置音频保存路径,保存音频格式支持pcm、wav,设置路径为sd卡请注意WRITE_EXTERNAL_STORAGE权限
        // 注:AUDIO_FORMAT参数语记需要更新版本才能生效
//        mIatDialog.setParameter(SpeechConstant.AUDIO_FORMAT, "wav");
//        mIatDialog.setParameter(SpeechConstant.ASR_AUDIO_PATH, Environment.getExternalStorageDirectory() + "/MyApplication/" + filename + ".wav");
    }


    /**
     * 语音
     * 识别
     * 解析
     */
    public static String parseIatResult(String json) {

        StringBuffer ret = new StringBuffer();
        try {
            JSONTokener tokener = new JSONTokener(json);
            JSONObject joResult = new JSONObject(tokener);

            JSONArray words = joResult.getJSONArray("ws");
            for (int i = 0; i < words.length(); i++) {
                // 转写结果词,默认使用第一个结果
                JSONArray items = words.getJSONObject(i).getJSONArray("cw");
                JSONObject obj = items.getJSONObject(0);
                ret.append(obj.getString("w"));

            }
        } catch (Exception e) {
            e.printStackTrace();
        }
        return ret.toString();
    }

    /**
     * 对话框
     * getApplicationContext()
     */
    private VoiceDialog boxDialog;

    private void showDialog(Context context) {

        View inflate = LayoutInflater.from(context).inflate(R.layout.donghua_layout, null, false);
        boxDialog = new VoiceDialog(context, inflate, VoiceDialog.LocationView.BOTTOM);
        boxDialog.show();
    }

    /**
     * 隐藏
     * 对话框
     */
    private void hideDialog() {

        if (boxDialog != null) {
            boxDialog.dismiss();
        }

    }

    /**
     * 发送语音
     * 识别消息
     *
     * @param code
     * @param conn
     */
    private void senVoicesMsg(int code, String conn) {

        VoiceRecognizeResult voiceRecognizeResult = new VoiceRecognizeResult();
        voiceRecognizeResult.setCode(code);//100启动语音识别    200识别成功   300识别错误
        voiceRecognizeResult.setMsg("" + conn);

        String std = JSON.toJSONString(voiceRecognizeResult);

        MyEventManager.postMsg("" + std, "VoiceRecognizeResult");
    }

    /**
     * 科大讯飞
     * 语音sdk
     * 初始化
     */
    public void initKedaXun(Context context) {

        // 初始化参数构建
        StringBuffer param = new StringBuffer();
        //IflytekAPP_id为我们申请的Appid
        param.append("appid=" + context.getString(R.string.IflytekAPP_id));
        param.append(",");
        // 设置使用v5+
        param.append(SpeechConstant.ENGINE_MODE + "=" + SpeechConstant.MODE_MSC);
        SpeechUtility.createUtility(context, param.toString());
        Log.d("initLogData", "===在appacation中初始化=====");
    }

}

2、使用

        KDVoiceRegUtils.getInstance().initKedaXun(mWXSDKInstance.getContext());
        KDVoiceRegUtils.getInstance().initVoiceRecorgnise(mUniSDKInstance.getContext());//语音识别初始化
        KDVoiceRegUtils.getInstance().startVoice(mUniSDKInstance.getContext());

注意其实代码还可以优化,由于公司业务需要,封装的不怎么彻底,使用者可在此基础上进一步封装。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1288978.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

同旺科技 USB TO RS-485 定制款适配器--- 拆解(二)

内附链接 1、USB TO RS-485 定制款适配器 ● 支持USB 2.0/3.0接口&#xff0c;并兼容USB 1.1接口&#xff1b; ● 支持USB总线供电&#xff1b; ● 支持Windows系统驱动&#xff0c;包含WIN10 / WIN11系统32 / 64位&#xff1b; ● 支持Windows RT、Linux、Mac OS X、Windo…

【开源】基于Vue+SpringBoot的固始鹅块销售系统

项目编号&#xff1a; S 060 &#xff0c;文末获取源码。 \color{red}{项目编号&#xff1a;S060&#xff0c;文末获取源码。} 项目编号&#xff1a;S060&#xff0c;文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 鹅块类型模块2.3 固…

CentOS关闭 swap分区

临时关闭swap分区: swapoff -a # 永久关闭swap分区: sed -ri s/.*swap.*/#&/ /etc/fstab 或者 vim /etc/fstab free -m

《opencv实用探索·八》图像模糊之均值滤波、高斯滤波的简单理解

1、前言 什么是噪声&#xff1f; 该像素与周围像素的差别非常大&#xff0c;导致从视觉上就能看出该像素无法与周围像素组成可识别的图像信息&#xff0c;降低了整个图像的质量。这种“格格不入”的像素就被称为图像的噪声。如果图像中的噪声都是随机的纯黑像素或者纯白像素&am…

批量免费AI写作工具,批量免费AI写作软件

人工智能&#xff08;AI&#xff09;的应用在各个领域不断创新。面对繁重的写作任务,我们应该怎么完成&#xff1f;本文将专心分享批量免费AI写作的方法、工具以及选择时需要注意的事项。 批量免费AI写作的方法 利用开源AI模型 一种常见的批量免费AI写作方法是利用开源的AI模…

Unity中动态合批

文章目录 前言一、动态合批的规则1、材质相同是合批的前提&#xff0c;但是如果是材质实例的话&#xff0c;则一样无法合批。2、支持不同网格的合批3、动态合批需要网格支持的顶点条件二、我们导入一个模型并且制作一个Shader&#xff0c;来测试动态合批1、我们选择模型的 Mesh…

企业级SQL开发:如何审核发布到生产环境的SQL性能

自从上世纪 70 年代数据库开始普及以来&#xff0c;DBA 们就不停地遭遇各种各样的数据库管理难题&#xff0c;其中最为显著的&#xff0c;可能就是日常的开发任务中&#xff0c;研发人员们对于核心库进行变更带来的一系列风险。由于针对数据库的数据变更是一项非常常见的任务&a…

老师如何管理课堂纪律?

1 .与学生建立良好的师生关系&#xff0c;加强沟通。建立互相尊重的关系&#xff0c;让学生感受到老师的理解和关心 2. 制定合理的课堂规则和纪律&#xff0c;让学生了解规则的重要性和必要性&#xff0c;并遵守规则。 3. 在课堂上保持秩序&#xff0c;避免嘈杂的行为和讨论。…

MAMBA介绍:一种新的可能超过Transformer的AI架构

有人说&#xff0c;“理解了人类的语言&#xff0c;就理解了世界”。一直以来&#xff0c;人工智能领域的学者和工程师们都试图让机器学习人类的语言和说话方式&#xff0c;但进展始终不大。因为人类的语言太复杂&#xff0c;太多样&#xff0c;而组成它背后的机制&#xff0c;…

如何使用Python核对文件夹内的文件

说明&#xff1a;日常工作中&#xff0c;我们经常会遇到这样的场景&#xff1a;核对A、B文件夹中文件的差异&#xff0c;找出A、B文件夹中不同部分的文件&#xff1b; 本文介绍如何使用Python来实现&#xff1b; 第一步&#xff1a;获取文件清单 首先&#xff0c;我们要获取…

Go 语言中的反射机制

欢迎大家到我的博客浏览&#xff0c;更好的阅读体验请点击 反射 | YinKais Blog 反射在大多数的应用和服务中并不常见&#xff0c;但是很多框架都依赖 Go 语言的反射机制简化代码。<!--more-->因为 Go 语言的语法元素很少、设计简单&#xff0c;所以它没有特别强的表达能…

基于c++版本数组队列改-Python数组队列的总结

##队列部分-猫猫排队 是一种遵循先入先出规则的线性数据结构。 是一种模拟排队现象&#xff0c;新来的人不断加入到队列尾部&#xff0c;而位于队列头部的人不断离开。 ##抽象数据类型队列的定义 队列是一种先进先出的线性表&#xff0c;它只允许在表的一端进行插入&#xf…

Word使用相关——(待完善)

1.word 怎样删除分节符 2.word 怎样删除目录中的分节符 欢迎使用Markdown编辑器 你好&#xff01; 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章&#xff0c;了解一下Markdown的基本语法知识。 新的改变 我…

Linux上使用独立显卡Tesla T4(测试视频压缩)

背景 将视频处理程序单独部署至K8S之外&#xff0c;使用独立GPU显卡的一台服务器上。 需事先对GPU性能做简单测试。 已通过zabbix对Linux进行了系统资源监控。 已通过PrometheusGrafana对显卡Tesla T4做了性能监控。 逐步补充&#xff0c;稍等 2023年12月6日 操作 查看当前…

【GPU】linux 安装、卸载 nvidia 显卡驱动、cuda 的官方文档、推荐方式(runfile)

文章目录 1. 显卡驱动1.1. 各版本下载地址1.2. 各版本文档地址1.3. 安装、卸载方式 2. CUDA2.1. 各版本下载地址2.2. 各版本文档地址2.3. 安装、卸载方式2.4. 多版本 CUDA 切换方式 1. 显卡驱动 1.1. 各版本下载地址 https://www.nvidia.com/Download/Find.aspx?langzh-cn 1…

【zip密码】如何删除zip压缩包的密码?

大家都知道压缩包可以进行加密&#xff0c;但是当我们不需要加密压缩包的时候&#xff0c;该如何删除zip压缩包密码呢&#xff1f;那么zip压缩包密码取消都有什么方法呢&#xff1f;今天将方法总结分享给大家。 最原始的方法&#xff0c;就是通过解压文件&#xff0c;将解压出…

class038 经典递归解析【算法】

class038 经典递归解析 算法讲解038【必备】常见经典递归过程解析 code1 字符串的全部子序列 // 字符串的全部子序列 // 子序列本身是可以有重复的&#xff0c;只是这个题目要求去重 // 测试链接 : https://www.nowcoder.com/practice/92e6247998294f2c933906fdedbc6e6a pac…

c++搭建http服务器

HTTP请求协议格式如下&#xff1a; HTTP响应协议格式如下&#xff1a; #include <iostream> #include <winsock2.h> #include <ws2tcpip.h> #include <string>#pragma comment(lib, "ws2_32.lib")//std::string generateResponse(const st…

华为OD机试 - 九宫格按键输入 - 逻辑分析(Java 2023 B卷 200分)

目录 专栏导读一、题目描述二、输入描述三、输出描述四、解题思路五、Java算法源码六、效果展示1、输入2、输出3、说明 华为OD机试 2023B卷题库疯狂收录中&#xff0c;刷题点这里 专栏导读 本专栏收录于《华为OD机试&#xff08;JAVA&#xff09;真题&#xff08;A卷B卷&#…

固定Microsoft Edge浏览器的位置设置,避免自动回调至中国

问题描述 在使用Copilot等功能时&#xff0c;需要将Microsoft Edge浏览器的位置设置为国外。但每次重新打开浏览器后&#xff0c;位置设置又自动回调至中国&#xff0c;导致每次均需要手动调整。 原因分析 这个问题的出现是因为每次启动Microsoft Edge时&#xff0c;默认打开…