人声检测原理VAD

news2025/4/27 6:48:42

在机器人的研究中，机器人与人语音交互是一个重要的功能，在语音交互中，人声检测至关重要。不论是在手机中，还是在esp32芯片上，都需要一种简单快捷的方式来检测本地语音，滤掉杂音和噪音。

机器人启动后会一直在后台工作采集环境的声音，当本地检测到人声时，会发送给大模型识别，当大模型正确识别语音后，会把识别后的文字转给大模型分析回复，回复的结果通过超拟人合成人声发出来。通过这样的设定，机器人会在工作过程中随时接受语音指令，陪人聊天和与人交互。

package com.example.sparkchaindemo.llm.online_llm.bm;

import android.util.Log;

public class VAD {
    private int sampleRate;
    private int frameSize;
    private double energyThreshold; // 能量阈值

    public VAD(int sampleRate, int frameSize) {
        this.sampleRate = sampleRate;
        this.frameSize = frameSize;
        this.energyThreshold = 0.01; // 根据实际情况调整
    }

    // 检测音频帧是否包含人声
    public boolean detectVoice(byte[] audioFrame) {
        double energy = calculateEnergy(audioFrame);
        Log.i("jiaAAA", "energy="+energy);
        return energy > energyThreshold;
    }

    // 计算音频帧的能量
    private double calculateEnergy(byte[] audioFrame) {
        double sum = 0;
        for (int i = 0; i < audioFrame.length; i +=2) {
            //short sampleShort = (short)0xffff;
            //sampleShort &=audioFrame[i+1];
            //sampleShort = (short)((sampleShort<<8)|audioFrame[1]);
            short sampleShort = (short)((audioFrame[i]&0xff)|(audioFrame[i+1]<<8));

            double sample = sampleShort / 32768.0;
            sum += sample * sample;
        }
        return sum / audioFrame.length;
    }
}

演示：

【讯飞机器狗对话豆包大模型-哔哩哔哩】 https://b23.tv/EolJbEq

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2281229.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！