ECA模块详解

news2025/4/12 7:43:34

注意：本文代码为自己理解之后实现，与原论文代码原理相同但并不完全一样，主要是输入张量的形状不同，若更想了解原文代码，可以访问：https://blog.csdn.net/weixin_45084253/article/details/124282580
（加入超链接不太行,)
假设 $ba t c h s i ze$ 为 $1024$ ，每个元素是一个序列式的特征，比如是一个长为 $23$ 的序列，单个序列元素特征为 $708$ ，则输入进入 $EC A$ 模块的张量形状为 $[1024, 23, 708]$ ，而 $EC A$ 内部的结构为：

    def call(self, inputs, mask=None):
        nn = tf.keras.layers.GlobalAveragePooling1D()(inputs, mask=mask)
        nn = tf.expand_dims(nn, -1)
        nn = self.conv(nn)
        nn = tf.squeeze(nn, -1)
        nn = tf.nn.sigmoid(nn)
        nn = nn[:,None,:]
        return inputs * nn

首先经过一个全局池化层，则张量 $[1024, 23, 708]$ 的形状变为 $[1024, 708]$
$EC A$ 与普通的 $C A$ 不同的地方在于：
普通的 $C A$ 是对通道先进行降采样，然后进行上采样，而 $EC A$ 作者认为这种做法学不到通道之间的关系，而应该转为学习邻居通道之间的关系，这个是比较有道理，因为我这里面的特征是人脸的 $E Y E + NOSE + L I P$ 和手的所有特征，相邻特征之间学习起来更合理，所以作者采用的是一维卷积的方法：
在这里插入图片描述
之后由于要进行一维卷积，所以作者对其最后一个维度进行维度扩展:

nn = tf.expand_dims(nn,-1)

也就是张量的形状变成 $[1024, 708, 1]$ ，经过一维卷积之后：

conv = tf.keras.layers.Conv1D(1,kernel_size=kernel_size,strides=1,padding="same",use_bias=False)

由于这块做了等维的 $p a d$ ，所以张量的形状变成了 $[1024, 708, 1]$ ，注意是对倒数第 $2$ 个进行卷积。到这块其实注意力权重就已经算出来了，接下来需要把最后一维的 $1$ 放到第 $2$ 维上(按照索引来说应该是第 $1$ 维)，也就是：

>>> nn = tf.squeeze(nn,-1)
>>> nn.shape
TensorShape([1024, 708])
>>> nn = nn[:,None,:]
>>> nn.shape
TensorShape([1024, 1, 708])

不要忘记做 $s i g m o i d$ 操作：

        nn = tf.squeeze(nn, -1)
        nn = tf.nn.sigmoid(nn)
        nn = nn[:,None,:]

该过程中所有的张量形状的变化为：
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/900545.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

ECA模块详解

相关文章

使用RDP可视化远程桌面连接Linux系统

SQL助你面大厂（行列转换）

webshell实践，在nginx上实现负载均衡

开发一个文生图的功能

Linux命令200例：nc非常有用的网络工具（常用）

LeetCode128.最长连续序列

回归预测 | MATLAB实现GWO-SVM灰狼优化算法优化支持向量机多输入单输出回归预测（多指标，多图）

Java源码分析（一）Integer

CF 1354 C1 C2 Polygon Embedding(求奇偶正多边形的外接最小正方形的边长）

【VBA_选择区域的关键词更改颜色】

【宝藏系列】一文讲透C语言数组与指针的关系

最全攻略之人工智能顶会论文发表

基于Matlab 代码实现UWB信号的产生和调制、接收和检测系统

STM32使用IIC通信的引脚配置问题

【Redis】Redisson分布式锁原理与使用

flutter 的TextField在有值的情况下再次获取焦点有个水滴的问题

MISRA 2012学习笔记(3)-Rules 8.4-8.7

kafka--kafka的基本概念-副本概念replica

[oneAPI] 使用字符级 RNN 生成名称

修改word正文样式后其他标题样式也跟着改变