音频基础知识和音频指标

news2025/1/22 12:52:14

音频基础知识

声音

声音(sound)是由物体振动产生的声波。物体在一秒钟之内振动的次数叫做频率,单位是赫兹,字母Hz。人耳可以识别的声音频率在         20 Hz~20000 Hz之间;

声音三要素:

响度
    响度,又称声强或音量,它表示的是声音能量的强弱程度,主要取决于声波振幅的大小。

音调
    音高也称音调,表示人耳对声音调子高低的主观感受。客观上音高大小主要取决于声波基频的高低,频率高则音调高,反之则低。

音色
    音色又称音品,由声音波形的谐波频谱和包络决定。声音波形的基频所产生的听得最清楚的音称为基音,各次谐波的微小振动所产生的声音称泛音

DAC与喇叭

DAC: 将数字信号转换成模拟信号的电路,称为数模转换器(简称D/A转换器或DAC,Digital to Analog Converter),D/A转换的作用是将时间离散、幅值也离散的数字信号转换为时间连续、幅值也连续的模拟信号。

喇叭:是一种将电能转换成声音的一种转换设备。当喇叭接收到由音源设备输出的电信号时,电流会通过喇叭上的线圈,并产生磁场反应。利用磁场的吸引或者排斥使振膜产生振动,发出声音。

ADC与麦克风

麦克风是将声音信号转换为电信号的能量转换器件。(声波带动振膜振动使两极板间的距离改变,即电容C改变,会引起电压的变化,这种电压变化频率反映了外界声音的频率,这就是驻极体传声器地工作原理。)

ADC:将模拟信号转换成数字信号的电路,称为模数转换器(简称A/D转换器或ADC,Analog to Digital Converter),A/D转换的作用是将时间连续、幅值也连续的模拟信号转换为时间离散、幅值也离散的数字信号。

模拟信号-直流与交流

音频的系统的输入和输出的有效信号都是交流信号。直流信号是不能使喇叭发声振动的,也不能传送声音信号。轻微的直流偏移会使耳机/喇叭的音圈不在磁隙的最佳位置,对音效有影响。严重的直流偏置,使音圈剧烈发热,音圈胶融化,线圈烧毁,振膜在巨大的磁推力和音圈的热量作用下变形损坏

偏置电压

输入输出的偏置电压:

因为大部分芯片没有负电压,所以如果直流偏置点在 0V电平,信号的压值负半轴部分将会丢失。所以如果要完整地输入/输出一段交流信号,需要抬升一定的偏置电压作为信号输入/输出的参考 0 点,此时理论上能输入/输出的信号最大不失真幅度为偏置电压的 2 倍.

DAC隔直输出

       隔直输出时,在 DAC 输出端与喇叭间串一个电容可以起到隔绝直流的作用。电抗分感抗和容抗,与电阻一样都起到阻碍电流通过的作用单位也都用欧姆,不同的是:电阻对所有频率的电流都有相同的阻碍作用,感抗与频率成正比,电流的频率越大,相应的感抗就越大容抗与频率成反比,电流的频率越大,相应的容抗就越小,

DAC差分输出

        差分输出时,喇叭两端各接DAC的一端输出,其中一段输出偏置直流加信号,另一端输出偏置直流加反向信号,所以喇叭的电压等于DAC两端电压之差,同时偏置直流被抵消,所以差分输出时最大幅度为单端最大输出幅度的两倍。

DAC直推输出

       直推输出时,喇叭两端分别DAC的一端输出和一个输出DAC直流偏置的公共地,所以喇叭的电压等于DAC端与公共地间电压之差,同时偏置直流被抵消,所以直推输出时最大幅度与单端隔直最大输出幅度相同.

MIC隔直输入

       MIC隔直输入时,电源串联电阻分压得到一个使麦克风正常工作状态的偏置电压,该偏置电压与芯片引脚偏置电压不一定相等,所以电容起到了隔绝两边偏置电压的作用,使MIC_IN可以正常输入麦克风的交流信号.

 MIC省电容输入

       MIC省电容方式输入时,麦克风直接正端接 MIC_IN 引脚,负端接模拟地。芯片内部会给麦克风提供一个满足正常工作的偏置电压,并产生一个与偏置电压相同压值的参考电压,在后级处理中把 MIC_IN 的直流分量处理掉,得到麦克风采集到的交流信号

LINEIN隔直输入

        LINEIN隔直输入时,在输出设备的输出端与芯片的输入端间串联一个电阻,可以起到隔绝两个不同系统的偏置电压作用。
        LINEIN选模拟输入时,可以简单理解为芯片通过模拟电路把LINEIN输入端口的信号直接连接到DAC输出端。优点是延时短,信噪比好。
        LINEIN选数字输入时,则是通过ADC采集成数字信号,再通过DAC把数字信号转为模拟信号输出。优点是CPU可以获取到输入的音频数据流,并可以进行一些效果处理再输出.

数字信号调制方式

PCM:脉冲编码调制(Pulse Code Modulation)
PDM:脉冲密度调制(Pulse Density Modulation)
PWM:脉冲宽度调制(Pulse Width Modulation)
PPM:脉冲位置调制(Pulse Position Modulation)
...

脉冲编码调制(PCM)

       脉冲编码调制(Pulse Code Modulation,PCM)就是把一个时间连续,取值连续的模拟信号变换成时间离散,取值离散的数字信号后在信道中传输。脉冲编码调制就是对模拟信号先抽样,再对样值幅度量化,编码的过程。

PCM数据格式

PCM数据格式可以理解成把采样后每个点的量化值按时间顺序一直排列。多声道时候也是把每个点的量化值按通道顺序和时间顺序交叉排列。
采样位数为 8 时,每个点占 1 个字节,数值范围 -128 ~ 127。
采样位数为16时,每个点占 2 个字节,数值范围 -32768 ~ 32767。
采样位数为24时,每个点占 3 个字节,数值范围 -16777216 ~ 16777215。
采样位数为32时,每个点占 4 个字节,数值范围 -2147483648 ~ 2147483647。

时域信号与频域信号

音频数字信号的属性

一、采样率
每秒从连续信号中提取并组成离散信号的采样个数,单位赫兹(Hz)。在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,采样频率越高,声音的质量也就越好,声音的还原也就越真实,但同时它占的资源比较多。采样频率必须大于等于需要采集音频信号的最大频率的两倍。
例如:8KHz    16KHz    44.1KHz       48KHz
二、采样位数
样位数也叫采样大小或量化位数,用来衡量声音波动变化的一个参数,也可以理解为采样的分辨率或者声音的解析度。数值越大,量化分辨率也就越高,采集到的数字信号越能还原实际的模拟信号。
例如:8bit:256级    16bit:65536级    32bit:4294967296级
三、通道数
声音的通道的数目。常见的单声道和立体声(双声道),现在发展到了四声环绕(四声道)和5.1声道。

傅里叶变换

时域与频域

常见的各种噪声

白噪声

白噪声(white noise)是指功率谱密度在整个频域内是常数的噪声。 所有频率具有相同能量密度的随机噪声称为白噪声。白噪声是一种功率谱密度为常数的随机信号。换句话说,此信号在各个频段上的功率谱密度是一样的,由于白光是由各种频率(颜色)的单色光混合而成,因而此信号的这种具有平坦功率谱的性质被称作是“白色的”,此信号也因此被称作白噪声。

 

 粉红噪声

粉红噪声(pink noise)是物理学概念,它在每个倍频程的强度相等,即在一定的范围(倍频程)内具有相同或类似的能量。粉红噪音虽然是一个功率谱密度与频率成反比的频谱的信号或过程。但由于听觉是对数(倍频程)感知,在高频处每个倍频程带宽更大,功率谱密度与带宽抵消,所以每个倍频程的强度其实是相等的

频率噪声

频率噪声是一种有频率信息的噪声,噪声的频率往往和瞬时强度与干扰源的工作频率和瞬时功率相关,可以根据噪声的频率和瞬时强弱关系去排除干扰的来源(例如有些短短续续的干扰,可以从干扰出现时正在工作的模块去分析)。噪声有可能来自于外部的电磁辐射干扰,电源干扰,接地回路干扰。

po声

po声是一种短暂的爆破性杂音,是由于幅度不连续,变化太大导致。很多情况都会产生这个声音,例如DAC偏置电压上抬太快、数据突然中断、音频数据不连续等等情况都会导致po声的产生。

 

常用的音频指标

峰峰值与有效值

峰峰值(peak-to-peak value)是指一个周期内信号最高值和最低值之间的距离,描述了信号值的变化范围的大小。

有效值是根据电流的热效应规定的,让交变电流和直流电通过同样的电阻,如果它们在同一时间内产生的热量相等,就把这一直流电的数值叫做这一交流电的有效值。直流的有效值就是其本身。

信噪比(SNR)

信噪比(SIGNAL NOISE RATIO,SNR or S/N)是指信号电平与噪声电平之比,单位为分贝(dB)。音频信噪比是指音响设备播放时,正常声音信号强度与噪声信号强度的比值。当信噪比低,小信号输入时噪音严重,严重影响音质。信噪比的大小是用有用信号功率(或电压)和噪声功率(或电压)比值的对数来表示的。

频率响应范围

频率响应是对MP3播放器的数模/模数转换器频率响应能力的一个评价标准。好的频率响应,是在每一个频率点都能输出稳定足够的信号,不同频率点彼此之间的信号大小均一样。然而在低频与高频部分,信号的重建比较困难,所以在这两个频段通常都会有衰减的现象。输出品质越好的装置,频率响应曲线就越平直,反之不但在高低频处衰减得很快,在一般频段,也可能呈现抖动的现象。

总谐波失真加噪声(THD+N)

THD+N 是英文Total Harmonic Distortion +Noise 的缩写,译成中文是“总谐波失真加噪声”。它是音频功率放大器的一个主要性能指标,也是音频功率放大器的额定输出功率的一个条件。

THD(Total Harmonic Distortion)总谐波失真是指输出信号比输入信号多出的谐波成分。谐波失真是系统不完全线性造成的。所有附加谐波电平之和称为总谐波失真。总谐波失真与频率有关。一般说来,1000Hz频率处的总谐波失真最小,因此不少产品均以该频率的失真作为它的指标。一般产品的总谐波失真都小于1%@1000Hz,但这个数值越小,表明产品的品质越高。

动态范围(Dynamic Range)

动态范围(Dynamic Range)是指音响系统重放时最大不失真输出功率与静态时系统噪声输出功率之比的对数值,又指一个多媒体硬盘播放器输出图像的最亮和最暗部分之间的相对比值。一般性能较好的音频设备动态范围在100dB以上。最大不失真时候失真度的取值有所不同,常见的有1%、3%、5%、和10%,在多媒体音箱中一般都取值为10%,而在高保真放大器中一般取值为1%。

动态范围是指设备能够处理的最大信号与最小信号的比值。这个概念容易与“信噪比”的概念混淆,那么二者有什么区别呢?可以理解,小于噪声幅度的信号是无法正确还原的,但是有的设备能够在无信号或信号特别低时从某些环节将噪声连同小信号切除,从而得出更好的信噪比指标(这就是“动态降噪”的基本原理)。这时实质上还是无法正确处理小信号的,而动态范围的测量就可以避免这样的人为优化。动态范围的测量是用一个小信号(一般用-60dB/1000Hz的正弦波)输给设备,然后滤除信号,测量其余频率的噪声和谐波水平,再用最大信号与之相比,结果就是动态范围。可以预见动态范围一般要低于信噪比,但在没有特殊电路或软件处理噪声的情况下,一般二者差距不大,可以互相参考。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1837561.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

谷歌Google广告开户是怎么收费的?

谷歌Google广告无疑是企业拓展全球视野、精准触达目标客户的强大引擎。而作为这一旅程的启航站,开户流程的便捷性与成本效益成为了众多企业关注的焦点。云衔科技,作为数字化营销解决方案与SaaS软件服务的领军者,正以其专业、高效的服务体系&a…

【凤凰房产-注册安全分析报告-缺少轨迹的滑动条】

前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 1. 暴力破解密码,造成用户信息泄露 2. 短信盗刷的安全问题,影响业务及导致用户投诉 3. 带来经济损失,尤其是后付费客户,风险巨大,造…

Eureka 学习笔记(1)

一 、contextInitialized() eureka-core里面,监听器的执行初始化的方法,是contextInitialized()方法,这个方法就是整个eureka-server启动初始化的一个入口。 Overridepublic void contextInitialized(ServletContextEvent event) {try {init…

Win32:第一个窗口程序-注册窗口类(Part.2)

在part 1中我们阐述了窗口模板程序中的相关宏、全局函数和相关函数声明后我们Part2就来说一下part 1中声明的一个函数MyRegisterClass注册窗口类函数(函数中也使用到了定义的一些全局变量),为什么要注册窗口类在part 1中已经阐述过了&#xf…

本地快速部署 SuperSonic

本地快速部署 SuperSonic 0. 引言1. 本地快速部署 supersonic2. 访问 supersonic3. 支持的数据库4. github 地址 0. 引言 SuperSonic融合Chat BI(powered by LLM)和Headless BI(powered by 语义层)打造新一代的BI平台。这种融合确…

Python 数据可视化 散点图

Python 数据可视化 散点图 import matplotlib.pyplot as plt import numpy as npdef plot_scatter(ref_info_dict, test_info_dict):# 绘制散点图,ref横,test纵plt.figure(figsize(80, 48))n 0# scatter_header_list [peak_insert_size, median_insert…

如何实现埋点日志精准监控

作者 | 张小七 导读 日志中台承载了百度千亿量级PV的埋点流量,如何对这些流量进行准确监控,并支持个性化字段的抽取、下钻,是日志中台的一大难题。本文简单介绍了日志中台的基本概念及实时流架构,并基于此深入讲解了低成本实现可扩…

【调试笔记-20240618-Windows- Tauri 调试中关闭自动重构的功能】

调试笔记-系列文章目录 调试笔记-20240618-Windows- Tauri 调试中关闭自动重构的功能 文章目录 调试笔记-系列文章目录调试笔记-20240618-Windows- Tauri 调试中关闭自动重构的功能 前言一、调试环境操作系统:Windows 10 专业版调试环境调试目标 二、调试步骤搜索相…

【CSS in Depth2精译】1.1.2 行内样式~1.1.3 选择器的优先级

文章目录 1.1.2 行内样式1.1.3 选择器的优先级1.1.3.1 优先级的写法1.1.3.2 关于优先级的思考 1.1.2 行内样式 如果无法通过样式表来源规则解决样式冲突,浏览器则会考察它们是否通过 行内样式 作用于该元素。当使用 HTML 的 style 属性声明样式时,该样式…

kaggle notebook和jupyter notebook读取csv

kaggle本地比赛用打开notebook的示例代码可以获取当前比赛的文件数据路径,进而后续直接复制读取 jupyter notebook读取csv 直接下载数据集到电脑上,并用本地路径读取就行。

ElasticSearch学习篇13_《检索技术核心20讲》进阶篇之LSM树

背景 学习极客实践课程《检索技术核心20讲》https://time.geekbang.org/column/article/215243,文档形式记录笔记。 内容 磁盘和内存数据读取特点 工业界中数据量往往很庞大,比如数据无法全部加载进内存,无法支持索引的高效实时更新&…

QT day04

一、思维导图 二、登录界面优化 代码: 界面: *{background-color: rgb(255, 255, 255); }QFrame#frame{border-image: url(:/Logo/shanChuan.jpg);border-radius:15px; }#frame_2{background-color: rgba(110, 110, 110, 120);border-radius:15px; }Q…

ionic 项目通过 android studio 打开报错 capacitor.settings.gradle 文件不存在

问题出现 原因分析 在程序相应的目录上面,没有找到对应的配置文件,但是这个文件不是我们自己生成的,而是通过 ionic 编译之后生成。 处理方案 先执行 ionic build,将 ionic 项目打包出来然后执行 npx cap sync 再使用 Android…

【小白专用 已验证24.6.18】C# SqlSugar操作MySQL数据库实现增删改查

【小白专用24.6.18】C# SqlSugar:连接数据库实现简单的,增、删、改、查-CSDN博客 SqlSugar .Net ORM 5.X 官网 、文档、教程 - SqlSugar 5x - .NET果糖网 SqlSugar项目创建 通过NuGet包管理器搜索SqlSugar(MySql还要安装MySql.Data、Newton…

C++ | Leetcode C++题解之第165题比较版本号

题目&#xff1a; 题解&#xff1a; class Solution { public:int compareVersion(string version1, string version2) {int n version1.length(), m version2.length();int i 0, j 0;while (i < n || j < m) {long long x 0;for (; i < n && version1[…

HTML+CSS+PHP实现网页留言板功能(需要创建数据库)

话说前头&#xff0c;我这方面很菜滴。这是我网页作业的一部分。 1.body部分效果展示&#xff08;不包括footer&#xff09; 2、代码 2.1 leaving.php&#xff08;看到的网页&#xff09; <!DOCTYPE html> <html lang"en"> <head> <met…

Flask之模板

前言&#xff1a;本博客仅作记录学习使用&#xff0c;部分图片出自网络&#xff0c;如有侵犯您的权益&#xff0c;请联系删除 目录 一、模板的基本用法 1.1、创建模板 1.2、模板语法 1.3、渲染模板 二、模板辅助工具 2.1、上下文 2.2、全局对象 2.3、过滤器 2.4、测试…

低市值Pow赛道解析,探寻百倍潜力项目

随着铭文的火爆出圈&#xff0c;比特币减半的到来&#xff0c;关于Pow赛道的讨论也在变得火热&#xff0c;不少投资机构都将Pow赛道作为2024年分析的重点。Pow赛道又来已久&#xff0c;不少项目的市值都超过10亿美元&#xff0c;而对于大多数投资者来说&#xff0c;低市值高回报…

Mp3文件结构全解析(一)

Mp3文件结构全解析(一) MP3 文件是由帧(frame)构成的&#xff0c;帧是MP3 文件最小的组成单位。MP3的全称应为MPEG1 Layer-3 音频 文件&#xff0c;MPEG(Moving Picture Experts Group) 在汉语中译为活动图像专家组&#xff0c;特指活动影音压缩标准&#xff0c;MPEG 音频文件…

Spring事务 和 事务传播机制

这里的 事务 和之前 MySQL的事务 一样&#xff0c;都是表示将⼀组操作封装成⼀个执⾏单元&#xff08;封装到⼀起&#xff09;&#xff0c;要么全部成功&#xff0c;要么全部失败。 Spring 中事务的实现 1. 编程式事务&#xff08;手动档&#xff09;。 package com.example.…