neurips 2022
首次将图神经网络用于视觉任务,同时能取得很好的效果
1 方法
2 架构
- 在计算机视觉领域,常用的 transformer 通常是 isotropic 的架构(如 ViT),而 CNN 更喜欢使用 pyramid 架构(如 ResNet)
- 论文两种ViG架构都设置了
- isotropic 架构——主体在整个网络中具有大小和形状相同的特征
- Pyramid架构——层越深提取空间尺寸越小的特征
- isotropic 架构——主体在整个网络中具有大小和形状相同的特征
3 实验
图片分类任务: