WRN: 宽度残差网络（论文复现）

news2025/7/5 8:27:21

WRN: 宽度残差网络（论文复现）

本文所涉及所有资源均在传知代码平台可获取

文章目录

- WRN: 宽度残差网络（论文复现）
- - - 概述
    - 模型结构
    - 核心逻辑
    - 实验
    - 训练与测试
    - 在线部署
    - 使用方式

概述

本文复现论文 Wide Residual Networks提出的深度神经网络模型。

为了解决深度神经网络梯度消失的问题，深度残差网络(Residual Network[2])被提出。然而，仅为了提高千分之一的准确率，也要将网络的层数翻倍，这使得网络的训练变得非常缓慢。为了解决这些问题，该论文对ResNet基本块的架构进行了改进并提出了一种新颖的架构——宽度残差网络（Wide Residual Network），其减少了深度并增加了残差网络的宽度。

我基于Pytorch复现了该网络并在CIFAR-10[3]、CIFAR-100[3]和SVHN[4]数据集上进行试验。此外，我提供了一个基于SVHN数据集训练的数字识别系统用于体验

模型结构

宽度残差网络共包含四组结构。其中，第一组固定为一个卷积神经网络，第二、三、四组都包含 n 个基本残差块。

基本残差块的结构如图所示

在这里插入图片描述

与普通的残差块不同的地方在于，普通残差块中的批归一化层和激活层都放在卷积层之后，而该论文将批归一化层和激活层都放在卷积层之前，该做法一方面加快了计算，另一方面使得该网络可以不需要用于特征池化的瓶颈层。此外，宽度残差网络成倍地增加了普通残差网络的特征通道数。

宽度残差网络在第三、四组的第一个卷积层进行下采样，即设置卷积步长为2

核心逻辑

Wide Residual Network 的模型代码如下所示

import torch
import torch.nn as nn
import torch.nn.functional as F


class WideBasicBlock(nn.Module):
    """Wide Residual Network的基本单元"""
    def __init__(self, in_channels, out_channels, stride, dropout):
        super(WideBasicBlock, self).__init__()
        self.stride = stride
        # 批归一化层、激活层、卷积层、Dropout层
        self.layers = nn.Sequential(
            nn.BatchNorm2d(in_channels),
            nn.ReLU(inplace=True),
            nn.Conv2d(in_channels, out_channels, kernel_size=3, stride=stride, padding=1, bias=False),
            nn.BatchNorm2d(out_channels),
            nn.ReLU(inplace=True),
            nn.Dropout(dropout),
            nn.Conv2d(out_channels, out_channels, kernel_size=3, stride=1, padding=1, bias=False)
        ) 
    
    def forward(self, x):
        out = self.layers(x)
        if self.stride != 1:
            residual = F.adaptive_avg_pool2d(x, (out.size(2), out.size(3)))
        else:
            residual = x
        if out.size(1) != residual.size(1):
            # 对池化和升维的特殊处理
            if out.size(1) % residual.size(1) == 0:
                residual = residual.repeat(1, out.size(1) // residual.size(1), 1, 1)
            else:
                padding = torch.zeros(residual.size(0), out.size(1) - residual.size(1), residual.size(2), residual.size(3)).to(residual.device)
                residual = torch.cat((residual, padding), dim=1)
        out = out + residual
        return out
        
        
    
class WideResidualNetwork(nn.Module):
    """Wide Residual Network"""
    def __init__(self, in_channels, out_channels, depth, width, dropout=0):
        super(WideResidualNetwork, self).__init__()
        self.conv1 = nn.Conv2d(in_channels, 16, kernel_size=3, stride=1, padding=1, bias=False)
        self.conv2 = self.add_block(
            in_channels = 16,
            out_channels = 16 * width,
            depth = depth,
            stride = 1,
            dropout = dropout
        )
        self.conv3 = self.add_block(
            in_channels = 16 * width,
            out_channels = 32 * width,
            depth = depth,
            stride = 2,
            dropout = dropout
        )
        self.conv4 = self.add_block(
            in_channels = 32 * width,
            out_channels = 64 * width,
            depth = depth,
            stride = 2,
            dropout = dropout
        )
        self.linear = nn.Linear(64 * width, out_channels)
        
    def add_block(self, in_channels, out_channels, depth, stride, dropout):
        """添加一个基本单元的组合"""
        layers = nn.Sequential()
        layers.add_module(
            name = '0',
            module = WideBasicBlock(
                in_channels = in_channels, 
                out_channels = out_channels, 
                stride = stride,
                dropout = dropout
            )
        )
        for i in range(1, depth):
            layers.add_module(
                name = str(i),
                module = WideBasicBlock(
                    in_channels = out_channels, 
                    out_channels = out_channels, 
                    stride = 1,
                    dropout = dropout
                )
            )
        return layers
        
    def forward(self, x):
        out = self.conv1(x)
        out = self.conv2(out)
        out = self.conv3(out)
        out = self.conv4(out)
        out = F.adaptive_avg_pool2d(out, (1, 1))
        out = torch.flatten(out, 1)
        out = self.linear(out)
        return out

实验

训练与测试

所有实验基于WRN-37-2进行且使用SGD进行优化。对于CIFAR-10和CIFAR-100，学习率为0.01并在第60、120、160轮衰减到20%，dropout采用0.3，weight_decay和momentum分别为0.0005和0.9。对于SVHN，学习率为0.01并在第80、120轮衰减到10%，dropout为0，weight_decay和momentum分别为0.0005和0.9。三个数据集的batch size均为128。

此外，CIFAR-10和CIFAR-100使用了数据增强操作，具体为随机水平翻转和随机裁剪。

具体的实验结果如下表所示

数据集	准确率
CIFAR-10	94.16%
CIFAR-100	74.12%
SVHN	96.95%

在线部署

我从网络上随机截取了10张大小、颜色、形状、背景各异的数字图像。这些图片的来源包括：车牌（6、8、9）、扑克牌（3）、广告（1、2、4、5、7）、腰带卡扣（0）。测试结果显示正确率为100%

在这里插入图片描述

使用方式

解压附件压缩包并进入工作目录。如果是Linux系统，请使用如下命令

unzip Wide-Residual-Networks.zip
cd Wide-Residual-Networks

代码的运行环境可通过如下命令进行配置

pip install -r requirements.txt

如果希望在本地训练模型，请运行如下命令

python main.py -d ['CIFAR-10' 、'CIFAR-100'、 'SVHN'三者其中之一]

如果希望在线部署，请运行如下命令

python main-flask.py

文章代码资源点击附件获取

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2207632.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

WRN: 宽度残差网络（论文复现）

WRN: 宽度残差网络（论文复现）

文章目录

概述

模型结构

核心逻辑

实验

训练与测试

在线部署

使用方式

相关文章

软件狗加密的高安全性

IEC104规约的秘密之十----令人眼花缭乱的各种限定词，品质描述词

HTML+CSS排行榜实现代码，复制粘贴可使用

Rider + xmake DX12 开发环境

msvcr100.dll丢失的解决方法，如何安全下载 msvcr100.dll 文件：完全指南

Linux等保测评与加固

WPF 手撸插件八操作数据库一

MySQL 创建子账号

技术总结（三）

设计模式---责任链模式快速demo

esp32-c3 Supermini 模块下载

Thread类的用法练习

四、远程登录到Linux服务器

计算机毕业设计基于Python+Django的旅游景点数据分析与推荐系统的设计与实现 Python毕业设计 Python毕业设计选题【附源码+安装调试】

黑马程序员C++提高编程学习笔记

ssm基于SSM框架的餐馆点餐系统的设计+VUE

有什么方法可以保护ppt文件不被随意修改呢？

Prim算法实现最小生成树

全栈开发要掌握的技术

C语言读取data.json文件并存入MySQL数据库小案例