人工智能算法工程师(中级)课程9-PyTorch神经网络之全连接神经网络实战与代码详解

news2025/7/12 22:27:16

大家好，我是微学AI，今天给大家介绍一下人工智能算法工程师(中级)课程9-PyTorch神经网络之全连接神经网络实战与代码详解。本文将给大家展示全连接神经网络与代码详解，包括全连接模型的设计、数学原理介绍，并从手写数字识别到猫狗识别实战演练。

文章目录

一、引言
二、全连接模型的设计
- 1. 神经元模型
- 2. 网络结构
三、全连接模型的参数计算
- 1. 前向传播
- 2. 反向传播
四、全连接模型实现手写数字识别
- 1. 数据准备
- 2. 模型构建
- 3. 代码实现
五、阶段实战：猫狗识别
- 1. 数据准备
- 2. 模型构建
- 3. 代码实现
六、数学原理详解
- 1. 激活函数
- 2. 损失函数
- 3. 优化算法
七、总结

一、引言

全连接神经网络（Fully Connected Neural Network，FCNN）是一种经典的神经网络结构，它在众多领域都有着广泛的应用。本文将详细介绍全连接神经网络的设计、参数计算及其在图像识别任务中的应用。通过本文的学习，读者将掌握全连接神经网络的基本原理，并能够实现手写数字识别和猫狗识别等实战项目。

二、全连接模型的设计

1. 神经元模型

全连接神经网络的基本单元是神经元，其数学表达式为：
$\sigma(\sum_{i=1}^{n}w_ix_i + b)$
其中， $x$ 为输入向量， $w$ 为权重向量， $b$ 为偏置， $\sigma$ 为激活函数。

2. 网络结构

全连接神经网络由输入层、隐藏层和输出层组成。每一层的神经元都与上一层的所有神经元相连，如图1所示。
在这里插入图片描述

三、全连接模型的参数计算

1. 前向传播

假设一个全连接神经网络共有 $l$ 层，第 $k$ 层的输入为 $X^{(k)}$ ，输出为 $Y^{(k)}$ ，则有：
$Y^{(k)} = \sigma(W^{(k)}X^{(k)} + b^{(k)})$
其中， $W^{(k)}$ 和 $b^{(k)}$ 分别为第 $k$ 层的权重和偏置。

2. 反向传播

全连接神经网络的参数更新通过反向传播算法实现。对于输出层，损失函数为：
$\frac{1}{2}(Y_{true} - Y_{pred})^2$
其中， $Y_{true}$ 为真实标签， $Y_{pred}$ 为预测值。
根据链式法则，输出层的权重梯度为：
$\frac{\partial L}{\partial W^{(l)}} = \frac{\partial L}{\partial Y^{(l)}} \cdot \frac{\partial Y^{(l)}}{\partial Z^{(l)}} \cdot \frac{\partial Z^{(l)}}{\partial W^{(l)}}$
其中， $Z^{(l)} = W^{(l)}X^{(l)} + b^{(l)}$ 。
同理，可求得输出层的偏置梯度、隐藏层的权重梯度和偏置梯度。

四、全连接模型实现手写数字识别

1. 数据准备

使用MNIST数据集，包含60000个训练样本和10000个测试样本。

2. 模型构建

构建一个简单的全连接神经网络，包含一个输入层（784个神经元）、两个隐藏层（128个神经元）和一个输出层（10个神经元）。
在这里插入图片描述

3. 代码实现

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader

# 定义模型
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.model = nn.Sequential(
            nn.Flatten(),
            nn.Linear(28*28, 128),
            nn.ReLU(),
            nn.Linear(128, 128),
            nn.ReLU(),
            nn.Linear(128, 10),
            nn.Softmax(dim=1)
        )

    def forward(self, x):
        return self.model(x)

# 加载数据
transform = transforms.Compose([transforms.ToTensor()])
dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
dataloader = DataLoader(dataset, batch_size=32, shuffle=True)

test_dataset = datasets.MNIST(root='./data', train=False, download=True, transform=transform)
test_dataloader = DataLoader(test_dataset, batch_size=32, shuffle=True)

# 初始化模型和优化器
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = Net().to(device)
optimizer = optim.Adam(model.parameters(), lr=0.001)
criterion = nn.CrossEntropyLoss()

# 训练模型
for epoch in range(5):
    for i, (images, labels) in enumerate(dataloader):
        images, labels = images.to(device), labels.to(device)
        optimizer.zero_grad()
        outputs = model(images)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

# 评估模型
correct = 0
total = 0
with torch.no_grad():
    for images, labels in test_dataloader:
        images, labels = images.to(device), labels.to(device)
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print('Accuracy of the network on the 10000 test images: %d %%' % (100 * correct / total))

五、阶段实战：猫狗识别

1. 数据准备

使用猫狗数据集，包含25000张猫和狗的图片。我们将猫和狗的照片放在目录’data/train’下。

2. 模型构建

构建一个全连接神经网络，包含一个输入层（64643个神经元）、三个隐藏层（256、128、64个神经元）和一个输出层（2个神经元）。

3. 代码实现

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader

# 定义数据预处理
data_transforms = transforms.Compose([
    transforms.Resize((64, 64)),
    transforms.RandomRotation(40),
    transforms.RandomHorizontalFlip(),
    transforms.RandomVerticalFlip(),
    transforms.RandomAffine(0, translate=(0.2, 0.2), scale=(0.8, 1.2)),
    transforms.ToTensor(),
])

# 加载数据
train_dataset = datasets.ImageFolder('data/train', transform=data_transforms)
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)

# 定义模型
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.model = nn.Sequential(
            nn.Flatten(),
            nn.Linear(64*64*3, 256),
            nn.ReLU(),
            nn.Linear(256, 128),
            nn.ReLU(),
            nn.Linear(128, 64),
            nn.ReLU(),
            nn.Linear(64, 1),
            nn.Sigmoid()
        )

    def forward(self, x):
        return self.model(x)

# 初始化模型和优化器
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = Net().to(device)
optimizer = optim.Adam(model.parameters(), lr=0.001)
criterion = nn.BCELoss()

# 训练模型
for epoch in range(15):
    for i, (images, labels) in enumerate(train_loader):
        images, labels = images.to(device), labels.float().unsqueeze(1).to(device)
        optimizer.zero_grad()
        outputs = model(images)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

# 评估模型
# 假设有一个测试数据集的加载器叫做 validation_loader
correct = 0
total = 0
with torch.no_grad():
    for images, labels in validation_loader:
        images, labels = images.to(device), labels.to(device)
        outputs = model(images)
        predicted = (outputs > 0.5).float()
        total += labels.size(0)
        correct += (predicted == labels).sum().item()
print('Accuracy of the network on the test images: %d %%' % (100 * correct / total))

六、数学原理详解

1. 激活函数

激活函数用于引入非线性因素，使得神经网络能够学习和模拟复杂函数。常用的激活函数有：

Sigmoid函数： $\sigma(x) = \frac{1}{1 + e^{-x}}$
ReLU函数： $\max(0, x)$
Softmax函数： $softmax(x)_i = \frac{e^{x_i}}{\sum_j e^{x_j}}$

2. 损失函数

损失函数用于衡量模型预测值与真实值之间的差异。常用的损失函数有：

均方误差（MSE）： $\hat{y}) = \frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2$
交叉熵损失：对于二分类问题， $\hat{y}) = -y\log(\hat{y}) - (1-y)\log(1-\hat{y})$

3. 优化算法

优化算法用于更新网络的权重和偏置，以最小化损失函数。常用的优化算法有：

梯度下降（Gradient Descent）： $\alpha \frac{\partial L}{\partial w}$
Adam优化器：结合了动量（Momentum）和自适应学习率（Adagrad）的优点。

七、总结

本篇文章从全连接神经网络的基本原理出发，介绍了全连接模型的设计、参数计算以及如何实现手写数字识别和猫狗识别。通过配套的完整可运行代码，读者可以更好地理解全连接神经网络的实现过程。在实际应用中，全连接神经网络虽然已被卷积神经网络（CNN）等更先进的网络结构所取代，但其基本原理仍然是深度学习领域的重要基石。希望本文能帮助读者深入掌握全连接神经网络，并为后续学习打下坚实的基础。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1925802.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！