第三十二章 音频FFT实验
本章将介绍CanMV下FFT的应用,通过将时域采集到的音频数据通过FFT为频域。通过本章的学习,读者将学习到CanMV下控制FFT加速器进行FFT的使用。
本章分为如下几个小节:
32.1 maix.FFT模块介绍
32.2 硬件设计
32.3 程序设计
32.4 运行验证
32.1 maix.FFT模块介绍
Kendryte K210片上拥有一个FFT Accelerator(快速傅里叶变换加速器)可以实现以硬件的方式对FFT的基2时分运算加速,Kendryte K210上的FFT Accelerator特点如下所示:
- 支持多种运算长度,即支持64点、128点、256点以及512点运算
- 支持两种运算模式,即FFT以及IFFT运算
- 支持可配的输入数据宽度,即支持32bit以及64bit输入
- 支持可配的输入数据排列方式,即支持虚部、实部交替,纯实部以及实部、虚部分离三种数据排列方式
- 支持可配的数据搬运方式,即CPU搬运和DMA搬运
在CanMV中可以使用CanMV提供的maix.FFT模块操作Kendryte K210上的FFT Accelerator。maix.FFT模块可以对输入数据进行傅里叶变换并返回相应的频率幅值,可以将时域信号转换为频域信号。
maix.FFT模块提供了run()函数,用于对输入的时域数据进行FFT,run()函数如下所示:
FFT.run(byte=None, points=64, shift=0, direction=1)
run()函数用于对输入的时域数据进行FFT,运算过程会自动调用硬件上的FFT Accelerator,并会同时占用DMAC Channel3和DMAC Channel4。
byte指的是输入的时域数据,需要为bytearray类型。
points指的是FFT的运算长度,可以是64、128、256或512,默认为64。
shift指的是偏移,默认为0。
direction指的是运算模式,当为1时,为FFT,当为0时,是IFFT。
run()函数会返回一个list对象,表示计算后的频域数据,list有points个元组,每个元组都有2个元素,第一个元素为实部,第二个元素为虚部。
run()函数的使用示例如下所示:
from maix import FFT
data = bytearray(64)
res = FFT.run(data, 64)
maix.FFT模块提供了amplitude()函数,用于计算FFT后各个频率点的幅值,amplitude()函数如下所示:
FFT.amplitude(res)
amplitude()函数用于计算FFT后各个频率点的幅值,从而能够直观地看到频域下数据的状态。
res指的是FFT.run()函数运算后返回的频域数据。
amplitude()函数的使用示例如下所示:
from maix import FFT
data = bytearray(64)
res = FFT.run(data, 64)
amp = FFT.amplitude(res)
32.2 硬件设计
32.2.1 例程功能
- 获取板载数字麦克风的音频数据作为时域数据输入maix.FFT模块进行FFT得到频域数据后,计算频域数据各个频率点的幅值并在LCD上进行直观的图像显示
32.2.2 硬件资源 - 数字麦克风
IIS_SDIN - IO30
IIS_BCK - IO32
IIS_LRCK - IO33
32.2.3 原理图
本章实验内容,需要获取板载数字麦克风的音频数据。
DNK210开发板上的数字麦克风的连接原理图,如下所示:
图32.2.3.1 数字功放NS4168连接原理图
关于该数字麦克风的使用方法,可参考MSM261S4030H0R的数据手册——《MSM261S4030H0R.pdf》,读者可在A盘硬件资料芯片资料下找到这份文档。
32.3 程序设计
32.3.1 maix.FFT模块介绍
有关maix.FFT模块的介绍,请见第32.1小节《maix.FFT模块介绍》。
32.3.2 程序流程图
图32.3.2.1 音频FFT实验流程图
32.3.3 main.py代码
main.py中的脚本代码如下所示:
from board import board_info
from fpioa_manager import fm
from maix import GPIO
from maix import I2S
from maix import FFT
import lcd
import image
lcd.init()
img = image.Image(size=(lcd.width(), lcd.height()))
SAMPLE_RATE = 38640
SAMPLE_POINTS = 1024
FFT_POINTS = 512
HIST_NUM = 50
fm.register(board_info.SPK_CTRL, fm.fpioa.GPIO0)
fm.register(board_info.MIC_WS, fm.fpioa.I2S0_WS)
fm.register(board_info.MIC_SCLK, fm.fpioa.I2S0_SCLK)
fm.register(board_info.MIC_SDIN, fm.fpioa.I2S0_IN_D0)
spk_ctl = GPIO(GPIO.GPIO0, GPIO.OUT)
spk_ctl.value(0)
i2s_dev = I2S(I2S.DEVICE_0)
i2s_dev.channel_config(I2S.CHANNEL_0, I2S.RECEIVER, align_mode=I2S.STANDARD_MODE)
i2s_dev.set_sample_rate(SAMPLE_RATE)
hist_width = int(lcd.width() / HIST_NUM)
while True:
data = i2s_dev.record(SAMPLE_RATE)
# 对时域数据进行FFT
res = FFT.run(data.to_bytes(), FFT_POINTS)
# 计算频域数据各频率点的幅值
amp = FFT.amplitude(res)
img.clear()
for hist in range(HIST_NUM):
if amp[hist] > lcd.height():
hist_height = lcd.height()
else:
hist_height = amp[hist]
img.draw_rectangle(hist * hist_width, lcd.height() - hist_height, hist_width, hist_height, lcd.WHITE, 1, True)
lcd.display(img)
del data
del res
del amp
可以看到一开始是先完成分配IO、初始化LCD、GPIO、I2S,为通过I2S获取板载数字扬声器的音频数据做准备。
然后便是在一个循环中不断地通过I2S获取音频数据,然后将音频数据作为时域数据输入进行FFT运算,得到频域数据的计算结果后,再计算频域数据各频率点的幅值,最后将各频率点的幅值通过直方图的形式在LCD上进行显示。
32.4 运行验证
将DNK210开发板连接CanMV IDE,点击CanMV IDE上的“开始(运行脚本)”按钮后,便了看到LCD上显示了板载数字麦克风采集到音频数据的频谱图,如下图所示:
图32.4.1 LCD显示频谱图