Qt音频采集:QAudioInput详解与示例

news2025/4/18 10:22:37

1. 简介

QAudioInput是Qt Multimedia模块中用于音频采集的核心类,能够从麦克风等输入设备实时获取原始音频数据(PCM格式)。本文将通过原理讲解和代码示例,帮助开发者快速掌握音频采集的核心技术。


2. 核心功能

  • 支持多种音频格式(采样率/声道/位深)

  • 提供实时音频流访问

  • 自动管理音频设备资源

  • 支持多平台(Windows/Linux/macOS/移动端)


3. 开发准备

3.1 环境要求

# .pro文件添加
QT += multimedia

3.2 头文件

#include <QAudioInput>
#include <QAudioDeviceInfo>

4. 核心类说明

4.1 QAudioInput

  • 核心方法

    • start(): 开始采集

    • stop(): 停止采集

    • setBufferSize(): 设置缓冲区大小

4.2 QAudioFormat

  • 常用配置

    format.setSampleRate(16000);      // 16kHz采样率
    format.setChannelCount(1);        // 单声道
    format.setSampleSize(16);         // 16位采样
    format.setCodec("audio/pcm");     // PCM编码
    format.setByteOrder(QAudioFormat::LittleEndian);
    format.setSampleType(QAudioFormat::SignedInt);

5. 基础使用流程

5.1 初始化设备

// 创建音频格式
QAudioFormat format;
// ...(设置格式参数)

// 获取输入设备
QAudioDeviceInfo inputDevice = QAudioDeviceInfo::defaultInputDevice();
if (!inputDevice.isFormatSupported(format)) {
    format = inputDevice.nearestFormat(format);
}

// 创建音频输入对象
QAudioInput* audioInput = new QAudioInput(inputDevice, format, this);

5.2 数据采集与保存

// 创建文件保存原始数据
QFile outputFile("raw.pcm");
outputFile.open(QIODevice::WriteOnly);

// 开始采集
audioInput->start(&outputFile);

6. 完整示例代码

示例1:保存为WAV文件(含文件头)

#include <QCoreApplication>
#include <QAudioInput>
#include <QFile>
#include <QDataStream>

// WAV文件头结构(44字节)
struct WavHeader {
    // ...(完整文件头结构定义,此处省略)
};

int main(int argc, char *argv[]) {
    QCoreApplication a(argc, argv);

    // 配置音频格式
    QAudioFormat format;
    format.setSampleRate(16000);
    format.setChannelCount(1);
    format.setSampleSize(16);
    format.setCodec("audio/pcm");
    format.setByteOrder(QAudioFormat::LittleEndian);
    format.setSampleType(QAudioFormat::SignedInt);

    // 初始化设备
    QAudioInput audioInput(QAudioDeviceInfo::defaultInputDevice(), format);

    // 创建WAV文件
    QFile file("recording.wav");
    file.open(QIODevice::WriteOnly);
    
    // 写入空文件头
    WavHeader header = createWavHeader(format);
    file.write((const char*)&header, sizeof(header));

    // 开始录音
    audioInput.start(&file);

    // 录音5秒后停止
    QTimer::singleShot(5000, [&]() {
        audioInput.stop();
        file.close();
        qApp->quit();
    });

    return a.exec();
}

示例2:实时音量监测

class AudioMonitor : public QIODevice {
public:
    explicit AudioMonitor(QObject* parent = nullptr) : QIODevice(parent) {}

protected:
    qint64 readData(char*, qint64) override { return 0; } // 不需要实现
    
    qint64 writeData(const char* data, qint64 len) override {
        // 计算音量(16位样本)
        const qint16* samples = reinterpret_cast<const qint16*>(data);
        int sampleCount = len / 2; // 每个样本占2字节
        
        qreal peak = 0;
        for (int i=0; i<sampleCount; ++i) {
            peak = qMax(peak, qAbs(samples[i]/32768.0));
        }
        
        emit volumeChanged(peak * 100); // 百分比
        return len;
    }

signals:
    void volumeChanged(qreal percent);
};

// 使用方式:
AudioMonitor* monitor = new AudioMonitor;
audioInput->start(monitor);
QObject::connect(monitor, &AudioMonitor::volumeChanged, [](qreal vol){
    qDebug() << "当前音量:" << vol << "%";
});

7. 常见问题解决方案

7.1 无输入数据

  • 检查项

    1. 系统麦克风权限

    2. 音频格式与设备兼容性

    3. 缓冲区大小设置(setBufferSize(2048)

7.2 录音文件杂音

  • 解决方法

    • 添加静音检测逻辑

    • 使用噪声抑制算法

    • 调整麦克风增益

7.3 延迟过高

  • 优化方法

    audioInput->setBufferSize(512);  // 减小缓冲区
    QThread::highPriority();         // 提升线程优先级

8. 关键知识点总结

要点说明
格式匹配必须与硬件支持格式一致
实时性处理避免在回调中进行耗时操作
资源释放stop()后及时释放设备
跨平台差异特别注意移动端权限问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2331568.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

rkmpp 解码 精简mpi_dec_test.c例程

rkmpp 解码流程&#xff08;除 MPP_VIDEO_CodingMJPEG 之外&#xff09; 源码 输入h264码流 输出nv12文件 /** Copyright 2015 Rockchip Electronics Co. LTD** Licensed under the Apache License, Version 2.0 (the "License");* you may not use this file exce…

怎么构造思维链数据?思维链提示工程的五大原则

我来为您翻译这篇关于思维链提示工程的文章&#xff0c;采用通俗易懂的中文表达&#xff1a; 思维链(CoT)提示工程是生成式AI(GenAI)中一种强大的方法&#xff0c;它能让模型通过逐步推理来解决复杂任务。通过构建引导模型思考过程的提示&#xff0c;思维链能提高输出的准确性…

网络安全之-信息收集

域名收集 域名注册信息 站长之家 https://whois.chinaz.com/ whois 查询的相关网站有:中国万网域名WHOIS信息查询地址: https://whois.aliyun.com/西部数码域名WHOIS信息查询地址: https://whois.west.cn/新网域名WHOIS信息查询地址: http://whois.xinnet.com/domain/whois/in…

JdbcTemplate基本使用

JdbcTemplate概述 它是spring框架中提供的一个对象&#xff0c;是对原始繁琐的JdbcAPI对象的简单封装。spring框架为我们提供了很多的操作模板类。例如:操作关系型数据的JdbcTemplate和MbernateTemplate&#xff0c;操作nosql数据库的RedisTemplate&#xff0c;操作消息队列的…

openEuler24.03 LTS下安装Spark

目录 安装模式介绍 下载Spark 安装Local模式 前提条件 解压安装包 简单使用 安装Standalone模式 前提条件 集群规划 解压安装包 配置Spark 配置Spark-env.sh 配置workers 分发到其他机器 启动集群 简单使用 关闭集群 安装YARN模式 前提条件 解压安装包 配…

使用 DeepSeek API 实现新闻文章地理位置检测与地图可视化

使用 DeepSeek API 实现新闻文章地理位置检测与地图可视化 | Implementing News Article Location Detection and Map Visualization with DeepSeek API 作者&#xff1a;zhutoutoutousan | Author: zhutoutoutousan 发布时间&#xff1a;2025-04-08 | Published: 2025-04-08 标…

如何精准控制大模型的推理深度

论文标题 ThinkEdit: Interpretable Weight Editing to Mitigate Overly Short Thinking in Reasoning Models 论文地址 https://arxiv.org/pdf/2503.22048 代码地址 https://github.com/Trustworthy-ML-Lab/ThinkEdit 作者背景 加州大学圣迭戈分校 动机 链式推理能显…

【力扣hot100题】(078)跳跃游戏Ⅱ

好难啊&#xff0c;我愿称之为跳崖游戏。 依旧用了两种方法&#xff0c;一种是我一开始想到的&#xff0c;一种是看答案学会的。 我自己用的方法是动态规划&#xff0c;维护一个数组记录到该位置的最少步长&#xff0c;每遍历到一个位置就嵌套循环遍历这个位置能到达的位置&a…

WES与WGS数据线粒体DNA数据分析及检测工具

1. 线粒体DNA的异质性 传统的全外显子组测序&#xff08;WES&#xff09;和全基因组测序&#xff08;WGS&#xff09;的二代测序&#xff08;SGS&#xff09; 数据分析流程&#xff0c;能够识别多种类型的基因改变。但大多数用于基因变异分析和注释的工具&#xff0c;在输出文…

word表格间隔设置

1.怎么解决word表格间隔达不到我们想要的要求 其实很简单, 我们直接在word表格里面, 全选表格中里面的内容。接着,我们选择自动调整---->根据内容自动调整表格,即可达到我们想要的要求

SpringBoot 接口限流Lua脚本接合Redis 服务熔断 自定义注解 接口保护

介绍 Spring Boot 接口限流是防止接口被频繁请求而导致服务器负载过重或服务崩溃的一种策略。通过限流&#xff0c;我们可以控制单位时间内允许的请求次数&#xff0c;确保系统的稳定性。限流可以帮助防止恶意请求、保护系统资源&#xff0c;并优化 API 的可用性&#xff0c;避…

I/O进程4

day4 九、信号灯集 1.概念 信号灯(semaphore)&#xff0c;也叫信号量。它是不同进程间或一个给定进程内部不同线程间同步的机制&#xff1b;System V的信号灯是一个或者多个信号灯的一个集合。其中的每一个都是单独的计数信号灯。 通过信号灯集实现共享内存的同步操作。 2.编程…

【语法】C++的list

目录 为什么会有list&#xff1f; 迭代器失效&#xff1a; list和vector的迭代器不同的地方&#xff1a; list的大部分用法和vector都很像&#xff0c;例如push_back&#xff0c;构造&#xff0c;析构&#xff0c;赋值重载这些就不再废话了&#xff0c;本篇主要讲的是和vecto…

【Ai/Agent】Windows11中安装CrewAI过程中的错误解决记录

CrewAi是什么&#xff0c;可以看之下之前写的 《初识CrewAI多智能代理团队协框架》 (注&#xff1a;这篇是基于linux系统下安装实践的) 基于以下记录解决问题后&#xff0c;可以再回到之前的文章继续进行CrewAI的安装 遇到问题 在windows系统中安装 CrewAi 不管是使用 pip 或者…

OSPF的数据报文格式【复习篇】

OSPF协议是跨层封装的协议&#xff08;跨四层封装&#xff09;&#xff0c;直接将应用层的数据封装在网络层协议之后&#xff0c;IP协议包中协议号字段对应的数值为89 OSPF的头部信息&#xff1a; 所有的数据共有的信息字段 字段名描述版本当前OSPF进程使用的版本&#xff08;…

【力扣刷题实战】Z字形变换

大家好&#xff0c;我是小卡皮巴拉 文章目录 目录 力扣题目&#xff1a;Z字形变换 题目描述 解题思路 问题理解 算法选择 具体思路 解题要点 完整代码&#xff08;C&#xff09; 兄弟们共勉 &#xff01;&#xff01;&#xff01; 每篇前言 博客主页&#xff1a;小卡…

力扣题解:142. 环形链表 II

在链表学习中&#xff0c;我们已经了解了单链表和双链表&#xff0c;两者的最后一个结点都会指向NULL&#xff1b;今天我们介绍的循环列表则不同&#xff0c;其末尾结点指向的这是链表中的一个结点。 循环链表是一种特殊类型的链表&#xff0c;其尾节点的指针指向头节点&#…

latex模板文件

LaTeX 是一款广泛应用于学术领域的​​文档排版系统​​&#xff0c;尤其以其在数学公式、科学符号和复杂技术文档排版中的强大能力著称。虽然它本身并非专门的“数学软件”&#xff0c;但在处理数学相关内容时表现尤为出色。 1. LaTeX 的核心特点​ 数学公式支持​​&#xff…

BLE 协议栈事件驱动机制详解

在 BlueNRG-LP 等 BLE 系统中,事件驱动是控制状态转移、数据交互和外设协作的基础。本文将深入讲解 BLE 协议栈中事件的来源、分发流程、处理结构与实际工程实践策略,帮助你构建稳定、可维护的 BLE 系统。 📦 一、BLE 事件的来源分类 BLE 协议栈中的事件严格来自协议栈本身…

Rust 之四 运算符、标量、元组、数组、字符串、结构体、枚举

概述 Rust 的基本语法对于从事底层 C/C 开发的人来说多少有些难以理解&#xff0c;虽然官方有详细的文档来介绍&#xff0c;不过内容是相当的多&#xff0c;看起来也费劲。本文通过将每个知识点简化为 一个 DEMO 每种特性各用一句话描述的形式来简化学习过程&#xff0c;提高学…