ALSA音频框架

Alsa是Advanced Linux Sound Architecture的缩写，即高级Linux声音架构，在Linux操作系统上提供了对音频和MIDI的支持。在Linux 2.6的内核版本后，Alsa目前已经成为了linux的主流音频体系结构。

除了 alsa-driver，ALSA 包含在用户空间的 alsa-lib 函数库，具有更加友好的编程接口，并且完全兼容于 OSS，开发者可以通过这些高级 API使用驱动，不必直接与内核驱动 API 进行交互。

一、系统框架

User空间：主要由Alsa Libray API对应用程序提供统一的API接口，各个APP应用程序只要调用 alsa-lib 提供的 API接口来实现放音、录音、控制。现在提供了两套基本的库，tinyalsa是一个简化的alsa-lib库，现在Android的系统中主要使用它。
ALSA CORE：alsa 核心层，向上提供逻辑设备（PCM/CTL/MIDI/TIMER/…）系统调用，向下驱动硬件设备（Machine/I2S/DMA/CODEC）
ASOC Core：是 ALSA 的标准框架，是 ALSA-driver 的核心部分，提供了各种音频设备驱动的通用方法和数据结构，为 Audio driver提供 ALSA Driver API
Hardware Driver：音频硬件设备驱动，由三大部分组成，分别是 Machine、Platform、Codec，提供的 ALSA Driver API 和相应音频设备的初始化及工作流程，实现具体的功能组件，这也是驱动开发人员需要具体实现的部分。

二、ASoC 硬件驱动结构

ASoC–ALSA System on Chip , 是建立在标准ALSA驱动层上, 为了更好地支持嵌入式处理器和移动设备中的音频Codec的一套软件体系.

嵌入式设备的音频系统可以被划分为板载硬件(Machine)、Soc(Platform)、Codec三大部分。

1. ASoC Platform Driver

指某款 SoC 平台的音频模块，如IMX6 等等。

包括 dma 和 cpu_dai 两部分：

dma：负责把 dma buffer 中的音频数据搬运到 I2S tx FIFO。音频 dma 驱动通过snd_soc_register_platform() 来注册。
cpu dai：指 SoC 的 I2S、PCM 总线控制器，负责把音频数据从 I2S tx FIFO 搬运到 CODEC（这是回放的情形，录制则方向相反）。cpu_dai 通过 snd_soc_register_dai() 来注册。

2. ASoC Machine Driver

作为链结 Platform 和 Codec 的载体，通过配置 dai_link 把 cpu_dai、codec_dai、modem_dai 各个音频接口给链结成一条条音频链路，然后注册 snd_soc_card。

snd_soc_dai_link：音频链路描述及板级操作函数，它指定链路用到的 codec、codec_dai、cpu_dai、platform，这四者就构成了一条音频数据链路用于多媒体声音的回放和录制。
snd_soc_dai_driver：音频数据接口描述及操作函数，根据 codec 端和 soc 端，分为 codec_dai 和 cpu_dai。
- linux 4.4 内核中支持两种方式创建dai_driver, 一种是通用的simple-audio-card 架构（简单通用的 machine driver）, 一种是传统的编写自定义的 machine driver 来创建。
snd_soc_codec_driver：音频编解码芯片描述及操作函数，如控件/微件/音频路由的描述信息、时钟配置、IO 控制等
snd_soc_platform_driver：音频 dma 设备描述及操作函数

1）simple-audio-card

简单通用的 machine driver, 是一个为了简化音频框架，在alsa上面的一个封装。如果 simple-audio-card 框架足够满足需求, 建议优先使用 simple-audio-card 框架。

simple-audio-card的框架主要配置说明

status:声卡目前的状态，目前是未激活；
compatible:设备文件中的的名字，系统靠这个去匹配驱动代码中的simple-audio-card层的驱动程序；
simple-audio-card,name:声卡在系统中的名字；
simple-audio-card,cpu {
      sound-dai:soc端的dai 配置，就是rk3399的spdif或i2s接口的配置；
}
simple-audio-card,codec {
      sound-dai:codec端的dai配置，就是soc外界codec的接口的配置，这里是虚拟声卡；
}

3. ASoC Codec Driver

Codec 字面意思是编解码器，可以是用于回放或录制音频的。对于回放来说，userspace 送过来的音频数据是经过采样量化的数字信号，在 codec 经过 DAC 转换成模拟信号然后输出到外放或耳机，这样就可以听到声音了（对于录制则相反）。

Codec 芯片里面的功能部件很多，常见的有 AIF、DAC、ADC、Mixer、PGA、Line-in、Line-out，有些高端的 codec 芯片还有 EQ、DSP、SRC、DRC、AGC、Echo-Canceller、Noise-Suppression 等部件。

Codec驱动主要提供以下特性：

Codec DAI 和 PCM的配置信息；
Codec的IO控制方式（I2C，SPI等）；
Mixer和其他的音频控件；
Codec的ALSA音频操作接口；
DAPM描述信息；
DAPM事件处理程序；
DAC数字静音控制

1）dummy_codec

ASoC Codec Driver之一，dummy_codec 是虚拟声卡，在soc外部没有外接codec的情况下，为了匹配声卡驱动框架，虚拟的一个设备，类似于占位符之类的东西的作用。

对一些名词的解释：

Codec：编解码器， PCM：脉冲编码调制

脉冲编码调制就是把一个时间连续，取值连续的模拟信号变换成时间离散，取值离散的数字信号后在信道信道中传输。脉冲编码调制就是对模拟信号先抽样，再对样值幅度量化，编码的过程。
DAPM：Dynamic audio power management-动态电源管理
dai：[digital](javascript:😉 [audio](javascript:😉 [interface](javascript:😉-数字音频接口

三、接口介绍

音频芯片数据时钟接口：

ADCDAT：ADC 数据输出引脚，采集到的音频数据转换为数字信号以后通过此引脚传输给主控制器。

ADCLRC：ADC 数据对齐时钟，也就是帧时钟(LRCK)，用于切换左右声道数据，此信号的频率就是采样率。此引脚可以配置为 GPIO 功能，配置为 GPIO 以后 ADC 就会使用 DACLRC引脚作为帧时钟。

DACDAT：DAC 数据输入引脚，主控器通过此引脚将数字信号输入给音频芯片的 DAC。

DACLRC：DAC 数据对齐时钟，功能和 ADCLRC 一样，都是帧时钟(LRCK)，用于切换左右声道数据，此信号的频率等于采样率。

BCLK：位时钟，用于同步。

MCLK：主时钟，工作的时候还需要一路主时钟

控制接口：

标准IIC，这个 I2C 接口用于配置音频芯片的工作模式等，用来cpu和codec间通信

SCLK

SDA

CPU-IIS接口：

用到四个引脚

SCLK：串行时钟信号

WS：字段(声道)选择信号

SDI：串行数据输入

SDO：串行数据输出

在总线上，只能同时存在一个主设备和发射设备；提供时钟的设备为主设备，可以是发射设备也可以是接收设备，或者是协

调两者的其他控制设备。在高端应用场合中，CODEX经常作为主设备以便精确控制IIS的数据流。

下面以8960为例介绍一下四种工作状态：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v0ZJuDfA-1670813790685)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20220802144132738.png)]$

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fHtFFDYJ-1670813790686)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20220802144216834.png)]$

四、时钟介绍和计算

下图是一个简单的时序图：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NjiA4J0K-1670813790686)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20220802143536112.png)]$

PCM是英文Pulse-code modulation的缩写，中文译名是脉冲编码调制。我们知道在现实生活中，人耳听到的声音是模拟信号，PCM就是要把声音从模拟转换成数字信号的一种技术，他的原理简单地说就是利用一个固定的频率对模拟信号进行采样，采样后的信号在波形上看就像一串连续的幅值不一的脉冲，把这些脉冲的幅值按一定的精度进行量化，这些量化后的数值被连续地输出、传输、处理或记录到存储介质中，所有这些组成了数字音频的产生过程。

  1.采样率(rate)：也称为采样速度或者采样率，定义了每秒从连续信号中提取并组成离散信号的采样个数，它用赫兹（Hz）来表示。采样频率的倒数是采样周期或者叫作采样时间，它是采样之间的时间间隔。通俗的讲采样频率是指计算机每秒钟采集多少个声音样本，是描述声音文件的音质、音调，衡量声卡、声音文件的质量标准。采样频率常有：8khz，16khz，44.1khz，48khz。
  
  2.量化位数（bits）：是对模拟音频信号的振幅进行的数字化。常用的8位,16位,32位。量化度越高，音频信号越可能接近原生信号。

  3.声道数(channels): 是指支持能不同发声的音响的个数，它是衡量音响设备的重要指标之一，一般分单声道和双通道。

  4.帧（frame）：桢记录了一个声音单元，其长度为样本长度与通道数的乘积。其大小等于=bits *  channels /8  ，单位是btye。

  5.周期(period_size)  周期大小，即每次dma硬件中断处理音频数据的帧数。如果周期设定得较大，则单次处理的数据较多，这意味着单位时间内硬件中断的次数较少，CPU也就有更多时间处理其他任务，功耗也更低，但这样也带来一个显著的弊端——数据处理的时延（latency）会增大   period_size=frame*rate*framecount. framecount的值是底层定义好的。

  6.周期数（period_count）  应用程序缓存区的大小可以通过ALSA库函数调用来控制。缓存区可以很大，一次传输操作可能会导致不可接受的延迟，我们把它称为延时(latency)。为了解决这个问题，ALSA将缓存区拆分成一系列周期(period)(OSS/Free中叫片断fragments).ALSA以period为单元来传送数据。
     
  7.声音缓存(buffer)和数据传输：
每个声卡都有一个硬件缓存区来保存记录下来的样本。当缓存区足够满时，声卡将产生一个中断。内核声卡驱动然后使用直接内存(DMA)访问通道将样本传送到内存中的应用程序缓存区。类似地，对于回放，任何应用程序使用DMA将自己的缓存区数据传送到声卡的硬件缓存区中。
这样硬件缓存区是环缓存。也就是说当数据到达缓存区末尾时将重新回到缓存区的起始位置。ALSA维护一个指针来指向硬件缓存以及应用程序缓存区中数据操作的当前位置。从内核外部看，我们只对应用程序的缓存区感兴趣，所以本文只讨论应用程序缓存区。

应用程序缓存区的大小可以通过ALSA库函数调用来控制。缓存区可以很大，一次传输操作可能会导致不可接受的延迟，我们把它称为延时(latency)。为了解决这个问题，ALSA将缓存区拆分成一系列周期(period)(OSS/Free中叫片断fragments).ALSA以period为单元来传送数据。

一个周期(period)存储一些帧(frames)。每一帧包含时间上一个点所抓取的样本。对于立体声设备，一个帧会包含两个信道上的样本。分解过程：一个缓存区分解成周期，然后是帧，然后是样本。左右信道信息被交替地存储在一个帧内。这称为交错 (interleaved)模式。在非交错模式中，一个信道的所有样本数据存储在另外一个信道的数据之后。

时钟的计算公式：

mclk（主时钟）= fs（分频系数） x rclk（采样率）

bclk（位时钟）= rclk（采样率）x length x channel （帧长度）

参考链接：

(70条消息) Linux ALSA音频框架及RK3399 DTS音频配置_pingis58的博客-CSDN博客_alsa音频架构

(70条消息) RK3399 Audio驱动讲解_Free飝Fly的博客-CSDN博客_rk3399 音频

(70条消息) Linux ALSA声卡驱动之六：PCM的注册流程_Bill_xiao的博客-CSDN博客

(70条消息) Linux 音频驱动(一) ASoC音频框架简介__Modest_的博客-CSDN博客_音频驱动框架

(70条消息) wm8960介绍_北极……星的博客-CSDN博客_wm8960

(70条消息) Linux 音频驱动(三) ASoC音频驱动之Codec驱动__Modest_的博客-CSDN博客_snd_soc_codec_driver