2.1
引言
本课题是来源于雷达辐射源识别项目,需要对雷达辐射源中频信号进行采集传输
和存储。本章基于项目需求,介绍采集卡的总体设计方案。采集卡设计包括硬件设计
和软件设计。首先对采集卡的性能和指标进行分析,接着提出硬件的总体设计,在硬
件设计基础上提出软件的总体设计,最后对用到的相关协议与关键技术进行说明。
2.2
总体设计概述
2.2.1
采集系统指标分析
本项目中雷达辐射源中频信号频带为
760MHz
~
1060MHz
,该雷达信号是一种带
通信号。采用带通采样定理,可以使采样率降低,进而降低数据传输速率。使得硬件
和软件更容易实现。
由公式
2-1
得,雷达辐射源信号的采样率大于
706.6Msa/s
时,就可以从采样的数
据中恢复出原始信号。实际中由于滤波器的特性不很理想,如果信号采样率过低,会
引起频谱混叠现象,导致恢复出的信号质量过差。因此实际采样率要高于理论的采样
率,才能保证恢复出的信号质量。本次设计的
AD
子卡的最大采样率为
1.6Gsa/s
,采
样精度为
12
位,数据最大速率为
19.2Gbps
,可满足项目数据采集要求。
采样后的数据形成高速数据流通过高速接口进入处理器,需要高效稳定的处理器
和高速数据传输协议技术来完成数据的接收、处理和发送。
Zynq7000
系列
SoC
内部
集成了以
FPGA
为基础的
PL
部分和以
ARM
为核心的
PS
部分,可单芯片实现数据
采集和数据处理功能。本文设计提供的
AD
子卡可实现雷达模拟信号的
AD
转换,并
形成高速数据流传输至采集卡。
由于高速接口不同,协议和传输速率也不同,如果采取直连的方式,可能会有数
据丢失的现象发生,在某些情况下,需要一定量的数据才可以进行处理,这需要一种
数据缓存技术解决。一般采用
DDR3 SDRAM
芯片用做高速数据缓存,DDR3 SDRAM
可以在时钟的双边沿进行数据读写,目前
DDR3 SDRAM
芯片颗粒支持最高频率的工
作时钟为
800MHz
,若
DDR3 SDRAM
芯片的数据线宽度为
16
位,则单片
DDR3
SDRAM
读写速率理论上最大为
25.6Gbps
。实际使用中需多片
DDR3
芯片搭配使用,
即可以扩大数据容量和位宽,又可以使数据读写速度得到成倍的提升。本设计从小型
化方面考虑,在
Zynq
芯片的
PL
端和
PS
端分别采用
2
片
16
位的
DDR3 SDRAM
芯
片组成
32
位宽的缓存器。
本设计的高速接口选用
PCIE
接口,为了满足雷达信号采样数据传输速率的要求,
PCIE
接口的速率应不低于
19.2Gbps
。经分析,选择
PCIE2.0
协议,
x8
模式,可提供
40Gbps
的数据传输速率,能满足本项目的数据传输要求。
2.2.2
硬件总体设计
本节基于上一节的分析结果给出硬件总体设计。硬件设计及数据流向框图如图
2.1
所示:
为了灵活设计,采集系统采用载卡
+
子卡的方式,载卡和子卡之间用
FMC
接口
连接,可以满足不同子卡的数据传输。载卡的设计方式为核心板
+
底板,核心板为
Zynq7000 SoC
的最小系统,并经接插件引出芯片的接口至底板,底板主要是给核心
板供电和连接
Zynq7000 SoC
的外围接口。为了使采集系统适用于多种场合,采集系
统提供光纤子卡和
AD
子卡两种方式进行数据采集传输,其中,光纤子卡用来接收高
速数字信号,
AD
子卡用来对辐射源信号进行模
-数转换,形成高速数据流,子卡输出
的高速数据经
FMC
接口进入
Zynq
芯片,再经
PCIE
接口传输至辐射源信号识别平台
进行后续处理。
AD
子卡的模拟信号输入采用
SMB
射频接头,采用
TI
公司的
ADC
芯片,型号
为
ADC12D800
。该
ADC
最大采样率为
1.6Gsa/s
,分辨率为
12bit
,
AD
转换后的数据
线是以
12
路差分并行总线的形式输出的,支持
LVDS
电平。芯片可提供两路模拟信
号转换,支持双边沿采样。将
ADC
芯片的信号线引至
FMC
接口,以方便与采集卡
连接。光纤子卡将光纤接口的信号线连接至
FMC
接口,实现与采集卡的连接。
2.2.3
软件总体设计
采集卡系统软件设计包含两个部分,分别为底层逻辑设计、嵌入式软件设计和上
位机软件设计。底层逻辑设计主要完成各个模块的设计以及各模块之间的数据交互;
嵌入式设计是在虚拟机上完成
Zynq7000SoC
的内核移植;上位机软件完成
PCIE
设备
的检测和初始化,数据的接收,并以文件形式存储至硬盘,用来进行下一步处理。具
体设计如下。
(
1
)逻辑软件总体设计
本次逻辑设计开发是基于
Vivado2017.4
平台,
Vivado
软件是
Xilinx
公司开发推
出的专为
7
系列提供的开发套件。软件内部含有
SDK
开发软件,可以实现
Zynq7000
系列
SoC
的嵌入式开发。
逻辑设计采用自顶而下的方法,本次设计需要用到的协议有
Aurora
协议、
DDR3
SDRAM
接口协议和
PCIE
协议,每种协议对应相应的模块。
Aurora
协议是光纤的传
输协议,用来实现光纤数据的接收和转发;
DDR3 SDRAM
接口协议主要是对
DDR3
SDRAM
的初始化和读写操作,用来实现对高速数据的缓存;
PCIE
模块完成采集卡
与辐射源信号识别平台之间的数据交互。
Vivado
软件提供丰富的
IP
核,可以为高速
数据接口协议和
DDR3 SDRAM
提供解决方案。
由于各个协议不同,需要分模块设计,各个协议单独为一个模块。数据在各个模
块之间传送,各个高速协议之间很难工作在同步状态,如果数据采取直连的方式,可
能导致丢失数据发生。解决方法是采用异步
FIFO
接口,异步
FIFO
接口的读写时钟
是独立的,并且读写位宽可以成倍数关系,使设计更为灵活。整个逻辑设计包含
5
个
模块,时钟、复位模块用来给各模块提供时钟和复位信号;
DDR3 SDRAM
模块实现
了高速数据的缓存功能;
PCIE
模块包含
PCIE
的驱动模块,实现了采集卡与
PC
机的
数据交互;
Aurora
模块是光纤驱动模块,实现光纤数据的接收和转发;
ADC
模块实
现了
ADC
芯片的配置和驱动,实现了雷达信号的模数转换并转发。除了时钟复位模
块,其他模块由各自的驱动模块和数据缓存模块组成,其中数据缓存模块为
FIFO 接口,方便各模块之间的连接。逻辑设计框图如图
2.2
所示。
为了满足雷达辐射源识别项目需求,高速数据传输速率应不小于
19.2Gbps
。
FMC
接口支持的数据最大传输速率为
10Gbps
,为了实现高速率数据传输,光纤采用
4
通
道传输,单通道速率为
10Gbps
,总传输速率为
40Gbps
,为了与光纤速率保持同步,
PCIE
采用
2.0
协议,单通道
5.0Gbps
,
x8
模式,总速率为
40Gbps
,与光纤速率相同。
传输速率能基本满足大多高速数据传输。
(
2
)嵌入式软件总体设计
嵌入式软件设计主要在
PS
端开发,是为将来的用户应用程序做准备。在完成
PL
部分的设计基础上,使用
Vivado
软件自带的
SDK
开发平台,在
Linux
系统的环境下
进行嵌入式的开发设计。本设计在
Ubuntu
下完成嵌入式软件设计,通过运行一系列
脚本文件进行系统编译、内核编译、生成镜像和烧写镜像等操作。
(
3
)上位机软件总体设计
上位机的功能应具有采集卡的识别、检测和初始化,此外还能接收来自
PCIE
接
口的数据,并可以把数据保存成文件。
在
PC
机上开发
PCIE
驱动需要使用驱动开发工具,本次设计的
PCIE
驱动开发
使用
WinDriver
开发工具。
WinDriver
软件是由
Jungo
公司开发的驱动开发平台,能
支持多种操作系统,软件提供了
windrvr.sys
内核,可用来与操作系统实现核心交互,
使开发者不用直接操作系统内核,只用通过函数库来实现与系统内核的通信,这样既
简化了驱动程序开发流程也提高了驱动开发效率。
上位机在
Visual Studio(VS)
开发平台上进行开发,
VS 是微软公司推出的开发工
具,支持多种编程语言。上位机的设计是通过
WinDriver
提供的内核和函数库的调用,
实现
PCIE
设备的初始化和数据交互。由于不同的
PC
机
CPU
处理能力不同,对中断
相应和数据处理的能力也有差别,一般采用
DMA
方式来传递数据。
DMA
长度在合
适的范围内
CPU
可以发挥最佳性能。
DMA
长度的设定既可以由逻辑设计设定也可以
由上位机设定,结合实际,由上位机设定
DMA
长度更方便,
结合以上分析,上位机需要有以下功能:
1) PCIE
设备的打开、关闭和初始化功能;
2) DMA
长度设定功能;
3)
保存数据并形成文件的功能。
2.3
相关协议与技术
2.3.1
PCIE
协议
(
1
)
PCIE
拓扑结构
典型
PCIE
通信链路由
Root Complex
(
RC
)、
Switch
及
End Point
(
EP
)组成。
RC
可支持一个至多个
PCIE
端口,它可以配置总线相关管理的功能,如中断控制、逻辑
报告以及支持热插拔等功能,
PCIE
节点的
ID
以及总线号、设备号、功能号均由
RC
分配并初始化。
Switch
可根据
ID
或者数据包优先级,完成
PCIE
数据包的交换,实
现
PCIE
数据包的转发。由于
PCIE
对
PCI
兼容,因此在
PCIE
系统中,会包含一个
PCI Express-PCI Bridge
,以实现与
PCI
设备的通信。
PCIE
的拓扑结构如图 2.3 所示:
(
2
)
PCIE
协议结构及数据包格式
PCIE
协议是一个三层的分层结构,分别为事务层(
Transaction Layer
)、数据链路
层(
Data Link Layer
)和物理层(
Physical Layer
)。如图
2.4
所示:
事务层是
PCIE
的最高层,主要对事务类型进行定义。在设备的发送端,事务层
接收来自设备内核的数据信息,并封装成事务层包(
TLP
),存放在缓存区,等待发送
给数据链路层;在设备的接收端,事务层接收数据链路层发送的数据包,并将包内信
息转换传输给设备。
数据链路层的主要功能是保证链路上数据包发送和接收的完整性。在设备的发送
端,数据链路层对事务层的
TLP
包添加部分信息进行重新打包,被称为
DLLP
,添加
的信息将在接收端接收
TLP
包时起到错误检查的作用。在设备接收端,数据链路层
对接收的报文进行错误检查,再发送至事务层。
物理层分为逻辑子层和电气子层两个部分。逻辑子层包括编码方式、链路训练等。
电气子层是连接到链路的物理层的模拟接口。在设备发送端,物理层对
TLP
进行解
码,从差分发送器中将信息发送出去。在设备接收端,物理层对
TLP
进行译码操作。
PCIE 1.0
和
2.0
版本的数据包结构如图
2.5
所示。其中起始和结束字节是由物理
层产生,序列和
LCRC
由链路层产生,头信息和
ECRC
由事务层产生。各个数据段
的字节数在下面一行显示。
由图
2.5
看出,
TLP
包的头信息可以使
3DW
也可以是
4DW
,
TLP
包可以不带有
效数据,有效数据载荷最大可达 1024DW。
(
3
)
PCIE
配置空间
配置空间用来存放设备信息,主机可以通过读取配置空间的信息来配置
PCIE
设
备,配置空间是
PCIE
设备实现即插即用功能的基础。
PCIE
协议是在
PCI
协议基础
上发展来的,在
PCI
的基础上,将
256B
的配置空间扩展成了
4KB
。因此
PCIE
设备
可以向下兼容
PCI
设备
[22]
。
PCIE
配置空间如图
2.6
所示。其中设备
ID
、厂商
ID
、分
类代码、
Cache
长度等称为头标区。主要用来检测设备是否存在和获取设备属性;基
址寄存器保存设备的地址空间的基地址;扩充
ROM
基址寄存器的作用是记载一段程
序的基地址,这段程序会完成设备的基本初始化设置。
2.3.2
Aurora
协议
2002
年,
Xilinx
公司首先提出
Aurora
总线协议,它是一种点对点、轻量级、可
裁剪的串行传输通信协议,针对
FPGA
之间的高速数据传输。
Aurora
协议的传输速度
灵活可配,以
Xilinx-V7
系列
FPGA
为例,支持的速度为
500Mbps~13.1Gbps
。
Aurora
总线有两种通信模式:全双工模式和单工模式,单工模式分为只收模式和
只发模式。
Aurora
的通信链路可包含一个至多个通道,可使用组合的方式
(x2
或
x4)
获得更高的数据传输速率。在发送端,用户通过接口(通常为
AXI
接口)与
Aurora
协议进行数据交互,传输用户自定义的协议数据;接收端通过解析协议数据包,提取
原始数据,按照
AXI
总线协议,提供给用户应用程序。由于
Aurora
对用户透明,故
它可以传输多种标准协议数据,如
TCP/IP
、
UDP
协议等。
Aurora
协议支持任意偶数字节的包长度,如果数据长度是奇数,会对数据包进行
填充至偶数个,填充的字节为
0x9C
。之后,链路层进行打包、组帧操作,增加帧头
帧尾。
Aurora
协议数据包的帧头占
2
字节为
K28.2/K27.7
(
0x5CFB
),帧尾占
2
字节
为
K29.7/K30.7(0xFDFE)
。
Xilinx
提供的
Aurora IP
核有
8B/10B
和
64B/66B
两种编码方式,本设计采用
64/66B
的编码方式,带宽利用率更高。接口框图如图
2.7
所示。
Aurora
协议提供帧模式和流模式两种数据传输模式。帧模式接口符合链路接口
规范,而流模式传输数据不需要特殊的帧字符,使操作更简单,耗费资源更少。