1、整体思维导图
2、个人收获
这篇论文在理论上对于我来说可能就是让我大致了解了这个领域(因为我的研究方向不是这方面),看完以后也没有看得特别懂(说实话)。
更多的收获应该是在论文的写作思路上吧
3、下面欣赏论文中的图和表:
1)不同方法的性能对比
2)动态稀疏窗口注意力,每一个子集的格子数是相同的。
3)总体架构
4)表1
5)表2
6)表3
7)表4
8)表5消除了我们动态稀疏窗口注意力的建模能力和效率
9)表 6 中进一步消除了旋转集分区的有效性
10)表7显示了不同混合窗口形状的结果
11)表8所示,我们的池化操作优于所有其他基线
12)在表 9 中与其他最先进的方法在推理速度和性能准确性方面进行了比较