1.算法运行效果图预览

2.算法运行软件版本

matlab2022a

3.部分核心程序

.....................................................................
% 定义修改的范围
Pixel_Range = [-30 30];
Scale_Range = [0.9 1.1];

% 现在修改图像
Image_Augmenter = imageDataAugmenter(...
    'RandXReflection', true, ...
    'RandXTranslation', Pixel_Range, ...
    'RandYTranslation', Pixel_Range,... 
     'RandXScale', Scale_Range, ...
     'RandYScale', Scale_Range);

% 调整图像以适应Googlenet的第1层
Augmented_Training_Image = augmentedImageDatastore(Input_Layer_Size(1:2), Training_Dataset, ...
    'DataAugmentation', Image_Augmenter);

Augmented_Validation_Image = augmentedImageDatastore(Input_Layer_Size(1:2),Validation_Dataset);



% 指定训练选项
Size_of_Minibatch = 5;
Validation_Frequency = floor(numel(Augmented_Training_Image.Files)/Size_of_Minibatch);
Training_Options = trainingOptions('sgdm',...
    'MiniBatchSize', Size_of_Minibatch, ...
    'MaxEpochs', 10,...
    'InitialLearnRate', 3e-4,...
    'Shuffle', 'every-epoch', ...
    'ValidationData', Augmented_Validation_Image, ...
    'ValidationFrequency', Validation_Frequency, ...
    'Verbose', false, ...
    'Plots', 'training-progress');

% 开始训练
net = trainNetwork(Augmented_Training_Image, Layer_Graph, Training_Options);
54

4.算法理论概述

VGG在2014年由牛津大学著名研究组vGG (Visual Geometry Group)提出，斩获该年lmageNet竞赛中Localization Task (定位任务)第一名和 Classification Task (分类任务)第二名。Classification Task (分类任务)的第一名则是GoogleNet 。GoogleNet是Google研发的深度网络结构，之所以叫“GoogLeNet”，是为了向“LeNet”致敬.人员行为动作识别是计算机视觉和深度学习领域的重要应用之一。近年来，深度学习网络在人员行为动作识别中取得了显著的成果。

1. 原理
1.1 深度学习与卷积神经网络（CNN）
深度学习是一种机器学习技术，它通过构建多层神经网络来模拟人脑的神经元之间的连接，实现对数据的学习和特征提取。卷积神经网络（CNN）是深度学习中的一种重要结构，特别适用于图像识别任务。它通过卷积层、池化层和全连接层来逐层提取和学习图像的特征。

1.2 GoogLeNet
GoogLeNet 是一个深度卷积神经网络，由 Google 在 2014 年提出。它通过引入 Inception 模块来解决深层网络中参数过多和计算量大的问题。Inception 模块使用不同大小的卷积核和池化操作并行提取特征，然后将它们拼接在一起，从而获得更丰富的特征表示。

GoogLenet网络亮点
1.引入了Inception结构（融合不同尺度的特征信息)
2.使用1x1的卷积核进行降维以及映射处理
3.添加两个辅助分类器帮助训练
4.丢弃全连接层，使用平均池化层(大大减少模型参数)