概述
RUBIK类似于BDMA,它无需任何数据计算对数据映射格式进行转换。RUBIK有3种工作模式,分别是:
- 合并(Contract)数据立方体
- 将特征数据立方体分割为多平面(multi-planar)格式
- 将多平面(multi-planar)格式合并到数据立方体
由于该模块的功能是转换特征数据立方体,我们称之为RUBIK单元。
合并(contract)
软件反卷积层总是使用几个硬件层或两个阶段。第一阶段是卷积流水线产生结果,第二阶段是contract的合同模式。
正常情况下,SW反卷积层的反卷积 x stride和 y stride大于1。通过这些strides的扩展,第一阶段硬件层的输出是一个通道扩展的数据立方体。RUBIK中的contract模式转换映射格式来扩展立方体。下图显示了一个重新映射示例,其中x stride为2,y stride 为3。
输入立方体大小和输出立方体大小的公式为:
RUBIK引擎slice by sclice 地实现contract,它接受一个Wx1xC输入sclice,并将其转换为一个W'xH'xC '输出子多维数据子立方体。然后继续到下一个输入slice,它从不跨线路边界发送请求。
当执行contract时,输入/输出起始地址和行间距应与32 bytes对齐。它总是试图发送256 bytes的请求,存储效率在80%~100%之间,受起始地址的影响。如果所有地址stride和起始地址都是256 byte对齐的,则存储器效率达到100%。
contract模式的要求:
- 通道大小应能被解卷积x stride、y stride和32 bytes整除。如下式所示:
- 输入和输出数据立方体的每个维度,如输入数据宽度、输出数据宽度、输入通道大小,在一个contract层中不应超过8192。
拆分和合并(Split and Merge)
拆分和合并是RUBIK中两种相反的操作模式。Split将数据立方体转换为M平面格式(M-planar formats, NCHW),平面的数量等于通道尺寸。合并模式将一系列平面转换为要特征据立方体。转换如下图所示。
M平面格式类似于图像格式。它是一种pitch linear格式,包含T_R16_I、T_R8_I或T_R16_F数据。每个平面仅包含1个通道数据或单个元素,所有平面(M平面)的line stride和planar stride应与64bytes对齐。它不同于NVDLA的其他数据格式。
功耗
RUBIK单元在数据路径中应用时钟门控,当单元空闲且可编程寄存器中没有可用的硬件层时,RUBIK数据路径的时钟被选通(gated)。