前言
本文根据FFT相关原理进行设计构建工程,仿造前文的工程构建的混频功能的工程,设计工程显示该混频信号的功率谱,然后进行仿真分析。
FFT仿真与分析
本文不再针对FFT的原理进行过多赘述,提供一份简单的matlab仿真代码。根据仿真简述下FFT的相关使用注意事项。
clc;clear all;
fs=50e6;%采样率
N=1024;%采样点数
t=[0:N-1]/fs; %时间序列
f1=3e6;%频点1 3MHZ
f2=4e6;%频点2 4MHZ
s1=sin(2*pi*f1*t);%信号1
s2=sin(2*pi*f2*t);%信号2
mixsign=s1.*s2;%混频
fftsign=fft(mixsign);%求fft
fftabs=abs(fftsign);%取模运算
plot(fftabs);
代码设计,模拟生成了两个不同频率的信号3MHz和4MHz,模拟采样了1024,将两个信号进行混频后则产生了7MHz和1MHz的信号。然后通过FFT函数,取模运算,求得FFT的幅度谱,然后进行显示输出。
频率分辨率
频率分辨率是FFT的一个重要的参数,横坐标每一个单位的频率精度等于 fs/N,N 是 FFT 的点数。即求出该仿真情况下的频率分辨率如下:
50
M
H
z
1024
=
48828.125
H
z
\frac {50MHz}{1024}\ = 48828.125Hz
102450MHz =48828.125Hz
将仿真输出的图片放大,并标注坐标,可见,第一个峰值的横坐标为21,第二个峰值的横坐标为144,计算可知,第一个峰值对应的频率为1.0254MHz,第二个峰值对应的频率为1.0254MHz,7.0313MHz。
可见实际FFT出来后的结果,和仿真设置的相差了一点,但是基本上是在设置的附近,这是因为频率分辨率不够,48828.125Hz的分辨率不能恰好对应到设置的1MHz和7MHz。
如果想恰好得到1MHz和7MHz的FFT的处理结果,或者想进一步减小误差,则需要进行相干采样,频率分辨率恰好是所求的频率的倍数。
关于频谱泄露
频率分辨率欠佳后,就会造成频谱泄露。
当信号X(t)的频率f0是fs/N的整数倍时,这说明在处理长度NT内有信号的K个整周期。这时由X(t)构成的以NT为周期的周期性信号是连续的。当信号X(t)的频率f0不是fs/N的整数倍时,则在NT的处理长度内,就不是恰好为信号周期的整数倍,有X(t)以NT为周期进行周期延拓所得到的周期性信号就出现了不连续点,造成了频谱分量从其正常频谱扩展开来,就这样形成了频谱泄露现象。
整周期截断,不会造成频谱泄露;非整周期截断,必然造成频谱泄露。
前面提到的相干采样,正式因为进行了整数周期的截断才使得频谱不进行泄露,并且FFT后的信号尖峰也恰好能对应我们设置的预期的频率。
使用FFT IP进行工程设计
可以将DDS应用实例的工程进行复制备份,然后添加相关 IP,进行工程适配。
实现功率谱逻辑
FFT 的原理是可以通过实部和虚部的数据恢复出周期信号的相位和幅值; 假如 a 是实部数据, b 是虚部数据, a+bj 是复数;对应的模运算是=sqrt(a2+b2),FFT处理后取模运算中的开更号在FPGA中实现比较麻烦,可以利用自带的cordic IP去处理,这里可以简化一下求FFT处理后的功率谱,也即(a2+b2)。
因此在调用FFT函数后,将输出的数据的实部虚部进行平方再相加即可得到FFT处理后的功率谱。
添加FFT IP
在配置界面可配置FFT的通道个数,傅里叶变换的长度,该结构的时钟,以及采用的算法架构。改变通道个数为N后,对应的数据位宽会变成一个通道的N倍。这里设置 IP 核 1024 点 FFT, 采样率 50MHz, 选择基 2 突发结构。
数据格式选择定点数类型,放缩设置为块浮点模式, 输出 FFT 结果选择顺序输出。
在侧边栏可以看到IP的接口状态,以及具体实现架构的相关细节,从实现细节界面可看到,在CONFIG接口处的数据位,有一个FWD_INV的配置参数,该参数是配置正变换还是反变换,因为 FFT 的计算正变换和反变换可以用一套算法实现。 这里 FWD_INV=1 为正变换, 为 0 是反变换。
这里看到 CHAN_0_XN_IM_0(31:16)是复数的虚部数据,并且使用的是 fix16_15 定点数, 意思是最高位为符号位, 小数部分有15位。CHAN_0_XN_RE_0(15:0)是复数的实部数据;这里的FFT混频信号只提供了实部的信号,因此,在信号连接时,只需要把低 16 位赋值为乘法器输出值, 而高 16 位赋值为 0即可。
从侧边栏还可以对FFT进行延时分析,从图中可知,该架构的FFT变化需要146.820us才能完成。
添加DDS IP
添加DDS IP,配置输出两路信号分别为3MHz和4MHz。匹配FFT的IP采样频率的50MHz,修改SFDR为45。
配置完成基本信息配置下一页,基本保持默认即可,这里只想查看波形,所以相位输出就关闭。
DDS的IP核多通道之间是分时复用的,所以在细节实现配置界面最好使能通道ID以供进行区别单个通道的信号波形。其余可以保持默认。
配置输出频率为3MHz和4MHz。其余保持默认,点击OK,完成配置。
修改乘法器IP
将乘法器适配当前的数据位宽,并保存设置。该乘法器用于实现混频乘法。
调用第二个乘法器,配置输入位宽为16位,输出为32位,有符号类型。该乘法器用于实现FFT处理后的功率谱逻辑。
编写.V文件
根据上面的逻辑结构,例化IP、编写代码依次实现DDS的信号产生、混频、FFT处理、以及功率谱运算逻辑。
`timescale 1ns / 1ps
module top(
input clk
);
wire m_axis_data_tvalid_ch3;
wire [7 : 0] m_axis_data_tdata_ch3;
wire [0 : 0] m_axis_data_tuser_ch3;
//多通道测试
dds_compiler_1 multi_ch_dds(
.aclk(clk), // input wire aclk
.m_axis_data_tvalid(m_axis_data_tvalid_ch3), // output wire m_axis_data_tvalid
.m_axis_data_tdata(m_axis_data_tdata_ch3), // output wire [7 : 0] m_axis_data_tdata
.m_axis_data_tuser(m_axis_data_tuser_ch3)
);
reg [7 : 0] data3MHz;
reg [7 : 0] data4MHz;
always @(posedge clk) begin
case(m_axis_data_tuser_ch3)
0:data3MHz<=m_axis_data_tdata_ch3;
1:data4MHz<=m_axis_data_tdata_ch3;
endcase
end
//混频测试
wire [15 : 0] mixer_singal;
mult_gen_0 mult_mixer (
.CLK(clk), // input wire CLK
.A(data3MHz), // input wire [7 : 0] A
.B(data4MHz), // input wire [7 : 0] B
.P(mixer_singal) // output wire [15 : 0] P
);
reg div_clk=0;
always @(posedge clk ) begin
div_clk<=!div_clk;
end
wire mixer_singal_tready;
wire [31 : 0] after_fft_data;
wire [7 : 0] m_axis_data_tuser;
wire m_axis_data_tvalid;
xfft_0 uut_fft(
.aclk(div_clk), // input wire aclk
.s_axis_config_tdata('d1), // input wire [7 : 0] s_axis_config_tdata
.s_axis_config_tvalid(1), // input wire s_axis_config_tvalid
.s_axis_config_tready(), // output wire s_axis_config_tready
.s_axis_data_tdata({16'd0,mixer_singal}), // input wire [31 : 0] s_axis_data_tdata
.s_axis_data_tvalid(1), // input wire s_axis_data_tvalid
.s_axis_data_tready(mixer_singal_tready), // output wire s_axis_data_tready
.s_axis_data_tlast(0), // input wire s_axis_data_tlast
.m_axis_data_tdata(after_fft_data), // output wire [31 : 0] m_axis_data_tdata
.m_axis_data_tuser(m_axis_data_tuser), // output wire [7 : 0] m_axis_data_tuser
.m_axis_data_tvalid(m_axis_data_tvalid), // output wire m_axis_data_tvalid
.m_axis_data_tready(1), // input wire m_axis_data_tready
.m_axis_data_tlast(), // output wire m_axis_data_tlast
.m_axis_status_tdata(), // output wire [7 : 0] m_axis_status_tdata
.m_axis_status_tvalid(), // output wire m_axis_status_tvalid
.m_axis_status_tready(1), // input wire m_axis_status_tready
.event_frame_started(), // output wire event_frame_started
.event_tlast_unexpected(), // output wire event_tlast_unexpected
.event_tlast_missing(), // output wire event_tlast_missing
.event_status_channel_halt(), // output wire event_status_channel_halt
.event_data_in_channel_halt(), // output wire event_data_in_channel_halt
.event_data_out_channel_halt() // output wire event_data_out_channel_halt
);
wire [31 : 0] fft_re_2;
mult_gen_1 mult_re (
.CLK(div_clk), // input wire CLK
.A(after_fft_data[15:0]), // input wire [15 : 0] A
.B(after_fft_data[15:0]), // input wire [15 : 0] B
.P(fft_re_2) // output wire [31 : 0] P
);
wire [31 : 0] fft_im_2;
mult_gen_1 mult_im (
.CLK(div_clk), // input wire CLK
.A(after_fft_data[31:15]), // input wire [15 : 0] A
.B(after_fft_data[31:15]), // input wire [15 : 0] B
.P(fft_im_2) // output wire [31 : 0] P
);
wire [32 : 0] sum = fft_re_2 + fft_im_2;
endmodule
运行仿真测试
这里仿真只需要给一个时钟源即可,编写仿真代码实现100MHz的时钟。运行仿真将相关信号添加到波形窗口中,观察信号。这里的sum为做完FFT处理后,实现功率谱逻辑的信号。将波形转换成模拟形式后可看出波形和matlab的代码仿真类似,然后确定下横坐标是否为21和144,即对应信号频率是否为1MHz和7MHz。
从下图可看出,从FFT处理输出的第一个信号到输出第一个峰值花费了420ns,FFT的配置频率和工作频率是50MHz,也就是周期就是20ns,恰好对应了第21个点,和仿真结果一致。
第二个峰值距离FFT输出第一个数据的时间花费了2880ns,换算下来也就是144个时钟周期,和仿真结果一致。