研一小白读论文记录，计算机视觉，Transformer

研一小白读论文记录，计算机视觉，Transformer

news2026/2/13 15:38:31

论文是IEEE收录的一篇论文《CrossFormer++: A Versatile Vision Transformer Hinging on Cross-Scale Attention》（《基于跨尺度自注意力机制的多功能视觉Transformer》）

泛读完之后最大的感悟有以下几点：

1、文章在实验的结果中呈现了大量的图片和表格，并且对于自己的数据使用了高亮显示，且在括号里还标注了与最好的模型相比，精度提升的具体数值，从而读来一目了然

2、文章使用了大量的不同模型做比对，目前已知的Transformer模型进行了对比试验，对于首先提出的CrossFormer和后来改进的CrossFormer++，作者对比了现存的模型以及文章中提出的两种模型结构，消融实验也是很丰富——是否存在CEL、PGS、ACL等对准确性的影响等等。

（看来优秀论文还是得用数据说话，还得是多种模型对比下来的大量数据结果呀）

附上简单制作的思维导图，希望各路大神能够指点一二，不胜感激！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2118711.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Getty Images推AI训练样本：3750张高质量照片免费开放

Getty Images推AI训练样本：3750张高质量照片免费开放

近日，全球领先的商业图库Getty Images发布了一项重大决策，宣布将为AI开发者提供一份包含3750张高分辨率照片的免费训练数据集。这份详尽的数据集覆盖了商业、教育、医疗健康、运动健身、物品物体、插图图标等15个不同领域，目的在于助力AI技术…

阅读更多...

unity UGUI高性能飘字解决方案（对象池+合并网格）

unity UGUI高性能飘字解决方案（对象池+合并网格）

本方案仅供参考从需求出发游戏类型：微信小游戏帧数限定：60 已知的几种方案： 1:场上只存在一个mesh，每帧把所有字绘制到一个mesh。优点：每帧都重绘，高度定制化，可以随意添加、删除。 …

阅读更多...

HTTP状态码解析：在Haskell中判断响应成功与否

HTTP状态码解析：在Haskell中判断响应成功与否

在互联网的世界里，HTTP状态码是服务器与客户端之间通信的一种语言。它们告诉我们请求是否成功，或者遇到了什么问题。在进行网络编程时，正确地解析和处理这些状态码是至关重要的。本文将探讨HTTP状态码的基本概念，并展示如何在Hask…

阅读更多...

KUKA中级学习4：修改软件中机器人名字，纠正示教器时间，下载备份文件进示教器

KUKA中级学习4：修改软件中机器人名字，纠正示教器时间，下载备份文件进示教器

这里写目录标题一、修改机器人名字1.1、程序安装下载二、示教器时间修改2.1、时间修改，示教器全英文显示三、下载备份文件一、修改机器人名字 1.1、程序安装下载选下面这个二、示教器时间修改 2.1、时间修改，示教器全英文显示三、下载备份文件 …

阅读更多...

FancyVideo环境搭建推理

FancyVideo环境搭建推理

引子很少关注360开源的代码，最近360AI团队开源了最新视频模型FancyVideo，据说RTX3090可跑。可以在消费级显卡 (如 GeForce RTX 3090) 上生成任意分辨率、任意宽高比、不同风格、不同运动幅度的视频，其衍生模型还能够完成视频扩展、视频回溯…

阅读更多...

springboot+vue+mybatis计算机毕业设计网上购物系统+PPT+论文+讲解+售后

springboot+vue+mybatis计算机毕业设计网上购物系统+PPT+论文+讲解+售后

本文首先实现了网上购物系统设计与实现管理技术的发展随后依照传统的软件开发流程，最先为系统挑选适用的言语和软件开发平台，依据需求分析开展控制模块制做和数据库查询构造设计，随后依据系统整体功能模块的设计，制作系统的功能模…

阅读更多...

《JavaEE进阶》----13.＜Spring Boot【配置文件】＞

《JavaEE进阶》----13.＜Spring Boot【配置文件】＞

本篇博客讲解 1.SpringBoot配置文件的格式以及对应的语法 2.了解两个配置文件格式的差异、优缺点。我们这里只做简单的介绍。看会，了解，学会读取就行了。因为配置文件实在太多了，这里只做基础的介绍。一、配置文件的作用前言计算机中有许…

阅读更多...

E5053A 微波下变频器

E5053A 微波下变频器

_XLT新利通_ E5053A 微波下变频器 E5052B SSA 专用的微波下变频器 Keysight E5053A 是一款与 E5052B 信号源分析仪（SSA）相关的微波下变频器。如果您需要设计和测试微波或毫米波频率的信号源，E5053A 支持您扩展该分析仪的频率范围。从…

阅读更多...

阿卡迈 Akamai 逆向分析2

阿卡迈 Akamai 逆向分析2

在Lzo这个url中点击第一个进入以后有个HPH是我们需要破解的参数我们搜索所有的HPH 大概有10个地方，我们需要全部打上断点(部分HPH用不到) 大约这5个地方的HPH需要破解第一步清除cookie f5进行刷新需要破解K1H， 58位的数组其中下标 1 3 15 25 53需…

阅读更多...

C# winforms 窗口延迟初始化 splash 定时器

C# winforms 窗口延迟初始化 splash 定时器

初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C的，可以在任何平台上使用。源码指引：github源…

阅读更多...

微课录制技巧|高效录制微课的方法，如何高效录制微课？

微课录制技巧|高效录制微课的方法，如何高效录制微课？

在教育领域，微课作为一种新兴的教学方式，越来越受到教师和学生的欢迎。本文将为您详细介绍如何高效录制微课，以及如何利用各种资源来提升备课和教学的质量。微课录制技巧： 录制前的准备在开始录制前，确保您已经明确…

阅读更多...

客服知识库与员工培训：打造专业客服团队的秘密武器

客服知识库与员工培训：打造专业客服团队的秘密武器

在竞争激烈的商业环境中，优质的客户服务已成为企业脱颖而出的关键要素之一。而构建一个高效、专业的客服团队，则离不开一个全面、精准的客服知识库。客服知识库不仅是信息的宝库，更是员工培训与技能提升的秘密武器，它在新员工入职…

阅读更多...

Adobe Illustrator非矢量图片的交集利用剪切蒙版实现

Adobe Illustrator非矢量图片的交集利用剪切蒙版实现

AI不支持对于非矢量图片的交集处理，但是可以通过剪切蒙版类似地实现需求。如下图，字母F是一张PNG图片，为位图文件（非矢量）。现在我需要将这种图片与黑色的矩形求交： 将两个目标全部选中，鼠标…

阅读更多...

AI 浪潮中的一体化数据库｜外滩大会之OceanBase实录

AI 浪潮中的一体化数据库｜外滩大会之OceanBase实录

2024 年 9 月 5 日至 7 日，在上海黄浦世博园区，“2024 Inclusion 外滩大会”盛大举行。期间，9月6日，由OceanBase携手赛迪顾问共同策划并主办了 “AI浪潮中的分布式数据库：探索行业增长新动能与关键业务负载实践”。本…

阅读更多...

优橙240419期就业榜来啦！就业班平均就业薪资8,333.3元！梦想不会发光，发光的是追梦的你！

优橙240419期就业榜来啦！就业班平均就业薪资8,333.3元！梦想不会发光，发光的是追梦的你！

有多坚定的信念，就有多勇毅的行动，就能开辟多光明的未来。时隔3个月，优橙240419就业喜报已送达！ 就业班平均就业薪资8,333.3元，就业学员即将奔赴祖国各地。行百里者半九十。人类的美好理想，都不可能唾手而…

阅读更多...

构建Web3社交平台：DeBox式DApp开发全攻略

构建Web3社交平台：DeBox式DApp开发全攻略

要仿照DeBox构建一款Web3社交平台系统，首先需要理解DeBox的核心功能和技术架构，并根据自己的目标和用户需求进行调整和创新。以下是一个基本的开发步骤指南，帮助你从概念到实践，逐步构建一个类似的Web3社交平台。 1. 明确项目目标…

阅读更多...

vue3 +百度地图实现地点检索，输入联想，经纬度，逆地理编码，创建标记，label等

vue3 +百度地图实现地点检索，输入联想，经纬度，逆地理编码，创建标记，label等

由于百度地图文档确实有点欠缺，在这里记录一下 vue3 百度地图（js api 3.0）实现效果如下实现方式注意事项 vue3 百度地图（js api 3.0） 需求： 地图弹框组件，可以搜索地图点，输入联想…

阅读更多...

算法-双指针技巧

算法-双指针技巧

文章目录算法概述奇偶数字归位寻找重复数字接雨水救生艇问题算法概述设置两个指针的技巧，其实这种说法很宽泛，似乎没什么可总结的有时候所谓的双指针技巧，就单纯是代码过程用双指针的形式表达出来而已。没有单调性(贪心)方面的考虑有时…

阅读更多...

基于Python的网络编程

基于Python的网络编程

现代的应用程序都离不开网络，网络编程是非常重要的技术。Python提供了两个不同层次的网络编程API：基于Socket的低层次网络编程和基于URL的高层次网络编程。Sockrt采用TCP、UDP等协议，这些协议属于低层次的通信协议；URL采用HTTP和H…

阅读更多...

4G工业路由器：SR700的智能连接解决方案

4G工业路由器：SR700的智能连接解决方案

在现代工业环境中，网络连接的稳定性和速度是确保生产效率和数据安全的关键。SR700 4G工业路由器凭借其卓越的性能和多样的功能，成为了工业自动化和物联网应用中的理想选择。本文将详细介绍SR700的产品特点，并结合一个真实的项目案例&#xff…

阅读更多...

推荐文章

最新文章