笔记：transformer系列

笔记：transformer系列

news2025/7/14 23:18:58

1、和其他网络的比较

自注意力机制适合处理长文本，并行度好，在GPU上，CNN和Self-attention性能差不多，在TPU（Tensor Processing Uni）效果更好。

总结：

自注意力池化层将 $x_{i}$ 当做key,value,query来对序列抽取特征。
完全并行，最长序列为1，但对长序列计算复杂度高
位置编码在输入中加入位置信息，使得自注意力能够学习位置信息。

2、输入特点

原生的Transformer中nn.embeding输入需要非负整数，且范围在[0,100]之间（试出来的，未必准确），这是对不同长度的单词维度进行扩展，但是对于图像或者其他类别而言未必是最后一个维度大小不一致，可以参考ViT将nn.embeding换成nn.Linear,还需要修改mask.

3、网络介绍

ViT

DETR基本思想：

1、先用CNN得到各个Patch作为输入，在套用transformer做编码和解码

2、编码和VIT一样，重点在解码，直接预测100个坐标框。

整体网络架构：

object quries是核心：让它学会怎么从原始特征找到物体的位置。

Encoder完成的任务：得到各个目标注意力结果，准备好特征。

Trac

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/921396.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

GitHub的PUSH显示网络超时，小乌龟网络代理办法

GitHub的PUSH显示网络超时，小乌龟网络代理办法

前言 （1）我能够正常访问GitHub，但是每次将代码提交到GitHub常常显示网络超时。这是因为提交是走的国内的网络，对GitHub访问会被进行限速。 （2）为了让小乌龟也拥有魔法，我们可以使用代理工具。注…

阅读更多...

rabbitmq卸载重新安装3.8版本

rabbitmq卸载重新安装3.8版本

卸载之前的版本的rabbitmq 卸载rabbitmq 卸载前先停止rabbitmq服务 /usr/lib/rabbitmq/bin/rabbitmqctl stop查看rabbitmq安装的相关列表 yum list | grep rabbitmq卸载rabbitmq相关内容 yum -y remove rabbitmq-server.noarch 卸载erlang 查看erlang安装的相关列表 …

阅读更多...

Linux CentOS安装抓包解包工具Wireshark图形化界面

Linux CentOS安装抓包解包工具Wireshark图形化界面

1.Wireshark介绍 Wireshark 是一个开源的网络协议分析工具，它能够捕获和分析网络数据包，提供深入的网络故障排除、网络性能优化和安全审计等功能。它支持跨多个操作系统，包括 Windows、macOS 和 Linux。 2.Wireshark主要使用方法捕获数据…

阅读更多...

韶音属于什么档次的品牌，韶音骨传导耳机值得入手吗

韶音属于什么档次的品牌，韶音骨传导耳机值得入手吗

骨传导领域中流传着一句话，就是“配置看南卡，颜值看韶音”，之所以有这句话，是因为韶音的骨传导耳机在颜值方面可以说是无可挑剔的，每款耳机的颜色挑选上基本都能达到六七种，对于户外而言可以说是回头率满满…

阅读更多...

$VSCode\PyCharm23.2+PyQGIS（QGIS3.32.1）插件开发配置相关要点$

VSCode\PyCharm23.2+PyQGIS（QGIS3.32.1）插件开发配置相关要点

近期利用VSCode\PyCharmPyQGIS进行插件开发，现将要点总结一下： 一、VSCode，我没有配置成功，主要是最后一个阶段调试的时候老是不成功。以后会持续关注。但是有几个要点： 1、VSCodePyQIS开发，智能提示的设…

阅读更多...

pip批量下载包、批量安装离线包

pip批量下载包、批量安装离线包

requirements.txt 格式批量下载 pip download -d D:\packs -r requirements.txt-d 参数设置下载包存放的目录 -r 包列表批量在线安装 pip install -r requirements.txt 批量离线安装 pip install --no-index --find-linksD:\packs -r requirements.txt–no-index 参数表…

阅读更多...

c#设计模式-创建型模式之原型模式

c#设计模式-创建型模式之原型模式

概述原型模式是一种创建型设计模式，它允许你复制已有对象，而无需使代码依赖它们所属的类。新的对象可以通过原型模式对已有对象进行复制来获得，而不是每次都重新创建。原型模式包含如下角色： 抽象原型类：规定了具…

阅读更多...

胖小酱之补考也不会

胖小酱之补考也不会

小胖！补考还是要重视起来呀！ 挂科了就要补考，如果不参加补考，毕业时重修该课程。补考不一定能过。挂科后一般都会有补考的，补考一般是在下个学期开学的前几周进行，因此如果自己挂科了要认真复习&#xff0…

阅读更多...

mysql -sql触发器

mysql -sql触发器

1、创建触发器。 //创建一个触发器在给section关系插入后触发 create trigger timeslot_check1 after insert on sectionreferencing new row as nrow//对每个插入的行都执行for each row//when指定一个条件，仅对于满足条件的元组才会执行触发器剩余的部分when (nr…

阅读更多...

SpringCloud入门实战（十四）Sentinel微服务流量防卫兵简介

SpringCloud入门实战（十四）Sentinel微服务流量防卫兵简介

📝 学技术、更要掌握学习的方法，一起学习，让进步发生 👩🏻 作者：一只IT攻城狮 ，关注我，不迷路。 💐学习建议：1、养成习惯，学习java的任何一个技术…

阅读更多...

零基础Java学习路线

零基础Java学习路线

预计阅读时间： 8分钟目录第一阶段： Java 基础第二阶段：数据库第三阶段： Java Web第四阶段：主流框架MavenGitSSM框架Spring Boot 第五阶段：服务器中间件RedisMQElasticsearch项目实践第六阶段&#xff1a…

阅读更多...

NAND Flash Program Operation： One Shot VS. Two Pass

NAND Flash Program Operation： One Shot VS. Two Pass

讲解相关内容的文章很少，开始只搜索到本站一篇相关内容：浅谈NAND FLASH的两种编程方式看完以后思路还不是很清晰，又发现了两篇FMS的主题演讲，在此简单总结分享。 Flash Memory Summit 2016， Thomas Parnell, IBM Res…

阅读更多...

Spring-IoC-加强

Spring-IoC-加强

目录简略介绍理解介绍 IoC的优点 Spring的IoC IoC是如何实现的 IoC能做什么 IoC和DI Spring IoC过程为什么框架需要反射 Spring Bean的循环依赖问题 IoC简单实现简略介绍所谓的IoC（inversion of control），就是控制反转的意思…

阅读更多...

Django基础三——视图函数

Django基础三——视图函数

文章目录一、基本了解1.1 Django内置函数1.2 http请求流程二、HttpRequest对象（接受客户端请求）2.1 常用属性2.2 常用方法2.3 服务端接收URL参数2.4 QueryDict对象2.5 案例2.5.1 表单GET提交2.5.2 表单POST提交2.5.3 上传文件三、HttpResponse对象&am…

阅读更多...

气传导耳机品牌推荐？四大品牌气传导耳机推荐

气传导耳机品牌推荐？四大品牌气传导耳机推荐

越来越多小伙伴开始使用气传导耳机了，面对市面上参差不齐的气传导耳机，导致很多小伙伴找不到适合自己的那款耳机了，面对这些问题，我整理了几款好用的气传导耳机给大家挑选和参考，希望都能找到心仪那款。 ①NANK南卡…

阅读更多...

Docker-compose 容器编排

Docker-compose 容器编排

1. 是什么 Compose 是 Docker 公司推出的一个工具软件，可以管理多个 Docker 容器组成一个应用。你需要定义一个 YAML 格式的配置文件docker-compose.yml，写好多个容器之间的调用关系。然后，只要一个命令，就能同时启动/关闭这些容器…

阅读更多...

vscode+ros开发环境搭建

vscode+ros开发环境搭建

目录介绍前提 vscode安装 vscode插件安装工作空间准备打开vscode 创建catkin包编写cpp代码编译运行启动ros服务监听话题启动ros测试介绍 ros开发是机器人开发中必不可少的工作，语言选择可以是c,也可以是python。工具的话，不能像wi…

阅读更多...

Mysql 基本概念

Mysql 基本概念

数据库的组成数据数据是描述事务的符号记录；包括数字、文字、图形、图像、声音、档案记录等以“记录“形式按统一的格式进行存储表将不同的记录以行和列的方式组合成了表用来存储具体数据数据库它就是所有不同属性表的集合以一定的组织方式存储的…

阅读更多...

vue 简单实验 v-for 循环

vue 简单实验 v-for 循环

1.代码 <script src"https://unpkg.com/vuenext" rel"external nofollow" ></script> <div id"list-rendering"><ol><li v-for"todo in todos">{{ todo.text }}</li></ol> </div> &…

阅读更多...

数据API服务管理功能：解放数据潜力，提升业务效率

数据API服务管理功能：解放数据潜力，提升业务效率

数据API服务的重要性在数字化时代，数据被认为是企业的重要资产。数据API服务的管理功能能够有效帮助企业实现数据的整合和利用。通过合理的数据API服务管理，企业可以更好地解放数据潜力，提升业务效率。解放数据潜力数据API服务管理功…

阅读更多...

推荐文章

最新文章