一文彻底搞懂CNN - 模型架构(Model Architecture)

news2025/1/20 22:42:06

CNN Model Architecture

CNN(卷积神经网络)的模型架构由输入层、卷积层、池化层以及全连接层组成,通过卷积操作提取图像特征,并通过池化减少参数数量,最终通过全连接层进行分类或回归。

  1. 输入层:接收原始图像数据,可能需要进行预处理,如归一化、尺寸调整等。

  2. 卷积层:通过一系列可学习的卷积核(或称为滤波器)对输入图像进行卷积操作,以提取图像中的局部特征。每个卷积核都会生成一个特征图(feature map),这些特征图共同构成了卷积层的输出。

  3. 池化层:通常位于卷积层之后,用于对特征图进行下采样,以减少数据的空间维度和参数数量,同时保留重要特征。常见的池化操作包括最大池化和平均池化。

  4. 全连接层:将卷积层和池化层提取的特征进行全局整合,并映射到样本标记空间。全连接层的每个神经元都与前一层的所有神经元相连,起到分类器的作用。

CNN Model Architecture

**__**一、输入层**_**(Input)**_****__**

输入层(Input):CNN(卷积神经网络)的输入层是原始图像数据进入网络的第一步,它负责将图像数据以适当的格式和状态传递给后续的卷积层、池化层等网络层。

输入层(input)

输入层直接接收来自外部的图像数据,这些数据可能是图像文件(如JPEG、PNG格式)中的像素值,或者是通过图像采集设备(如摄像头)实时捕获的数据。

输入层(input)

输入层数据预处理:将原始图像数据转换为适合网络学习的格式和范围的过程,包括尺寸调整、归一化、去均值等步骤,以及数据增强,以提高模型的性能和训练效率。

一、尺寸调整(Resizing)

  • 目的: 将输入图像调整到网络所需的固定尺寸。这有助于网络处理统一大小的输入,避免尺寸不一致带来的问题。

  • 方法:

  • 裁剪: 从原始图像中截取一块指定大小的区域。

  • 缩放: 改变图像的尺寸而不改变其宽高比,使其符合网络的输入要求。

  • 填充: 在图像周围添加额外的像素(通常是0或边界像素的复制),以达到所需的尺寸。

二、归一化(Normalization)

  • 目的: 将图像的像素值缩放到一个特定的范围内(如[0, 1]或[-1, 1]),以加快网络的收敛速度和提高训练效率。

  • 方法:

  • Min-Max归一化: 将原始数据线性变换到[0,1]范围内。新数据 = (原数据 - 最小值) / (最大值 - 最小值)。

  • Z-Score标准化: 基于原始数据的均值和标准差进行标准化。新数据 = (原数据 - 均值) / 标准差。这种方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。

三、去均值(Mean Subtraction)

  • 目的: 从图像数据中减去全局均值或每个颜色通道的均值,以消除数据中的偏置。

  • 方法:

  • 对于全局均值,从每个像素值中减去整个数据集的均值。

  • 对于每个颜色通道,分别计算并减去该通道的均值。

四、数据增强(Data Augmentation)

  • 目的: 通过随机改变训练图像来增加数据的多样性和数量,减少过拟合风险。

  • 方法:

  • 旋转: 将图像按一定角度旋转。

  • 翻转: 水平或垂直翻转图像。

  • 缩放: 在保持图像宽高比的同时,随机改变图像的尺寸。

  • 裁剪: 随机裁剪图像的一部分。

  • 颜色变换: 调整图像的亮度、对比度、饱和度等。

Convolution

在这里插入图片描述

卷积层(Convolution): 卷积层(Convolution layer)是卷积神经网络(CNN)中的核心组件,它通过滑动窗口(卷积核)在输入数据上滑动并进行点积运算来提取局部特征,实现数据的自动特征提取和降维。

池化层(Pooling): 池化层(Pooling Layer)是卷积神经网络中用于降低特征维度、减少计算量、提取主要特征并增加模型泛化能力的一种下采样操作。

三、全连接层

全连接层(Full Connection): 全连接层(Fully Connected Layer,FC)是一种神经网络层,其中该层的每个神经元都与前一层的所有神经元相连接。全连接层的每个神经元都会接收前一层的所有神经元的输出作为输入,并产生自己的输出,这些输出再传递给下一层或作为最终输出。

Fully Connected

在CNN中,全连接层通常位于卷积层和池化层之后, 用于将前面层提取到的特征进行综合和分类。

  1. 特征整合:全连接层将前面卷积层和池化层提取到的局部特征进行整合,形成全局特征表示。这些全局特征对于后续的分类或回归任务至关重要。

  2. 分类器:在CNN中,全连接层常作为分类器使用。它将学到的特征表示映射到样本的标记空间,即输出每个类别的预测概率或得分。

  3. 加权和:全连接层通过对前面层提取的特征进行加权和,实现特征的进一步抽象和整合。这些权重是通过训练过程学习得到的,能够反映出不同特征对于最终分类或回归任务的重要性。

Fully Connected

全连接层的工作流程: 全连接层将卷积层和池化层提取的特征进行加权求和,并通过激活函数处理,形成最终输出;每个神经元与前一层的所有神经元全连接,实现特征的全面整合和分类决策。

  1. 特征扁平化:在将特征送入全连接层之前,通常需要将这些特征(可能是三维的,即高度、宽度和通道数)扁平化(Flatten)成一维的向量。这是因为全连接层的每个神经元都需要与前一层的所有神经元相连接,而一维向量使得这种连接变得简单直接。

  2. 加权求和:在全连接层中,每个神经元都会接收来自前一层的所有神经元的输入,并对这些输入进行加权求和。这些权重是通过网络训练过程中学习得到的,它们决定了不同特征对于当前神经元输出的重要性。

  3. 偏置项:除了加权求和之外,每个神经元还会加上一个偏置项(Bias),这个偏置项同样是通过学习得到的。偏置项的存在使得神经元的激活函数在输入为零时也能有一个非零的输出。

  4. 激活函数:加权求和的结果会通过一个激活函数,以引入非线性因素。在分类任务中,常用的激活函数包括Sigmoid(用于二分类问题的输出层)、Softmax(用于多分类问题的输出层,将输出转换为概率分布)和ReLU(Rectified Linear Unit,用于隐藏层,能够缓解梯度消失问题)。

  5. 特征整合与分类决策:通过多个全连接层的堆叠,网络能够逐步将前面层提取的局部特征整合为全局特征,并最终根据这些全局特征做出分类、回归或其他任务的决策。

Fully Connected

如何学习AI大模型?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉[CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)]()👈

学习路线

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2069700.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

​14:00面试,14:06就出来了,问的问题有点变态。。。

从小厂出来,没想到在另一家公司又寄了。 到这家公司开始上班,加班是每天必不可少的,看在钱给的比较多的份上,就不太计较了。没想到5月一纸通知,所有人不准加班,加班费不仅没有了,薪资还要降40%…

BoosterX:Windows 游戏玩家都爱的电脑优化工具箱

《黑神话:悟空》、《艾尔登法环:黄金树幽影》、暴雪「全家桶」回归……今年,我们将迎来一场豪华的游戏大餐! 想要畅玩游戏,除了要准备好给力的硬件设备,系统优化当然也不能落下!BoosterX 正是一…

IO进程(8)

目录 1.信号灯集 1.1概念 1.2操作步骤 1.3函数接口 1.3.1创建信号灯集 1.3.2初始化或删除信号灯集 ​​​​​​​​​​​​​​1.3.3pv操作 ​​​​​​​​​​​​​​1.4操作命令 2.消息队列 2.1特点 ​​​​​​​​​​​​​​2.2步骤 ​​​​​​​2.3函数接口 2.3…

如何选择适合自己的开放式耳机?五款实力出众爆款安利!

开放式耳机以其不侵入耳道的设计,为耳朵提供了更轻的负担,同时保护了耳道健康,这与传统的头戴式或入耳式耳机相比,在长时间佩戴时更能减少不适感。市场上的开放式耳机种类繁多,要找到一款真正满意的产品可能有些困难。…

使用kubeadm快速部署一套K8S集群

一、Kubernetes概述 1.1 Kubernetes是什么 Kubernetes是Google在2014年开源的一个容器集群管理系统,Kubernetes简称K8S。 K8S用于容器化应用程序的部署,扩展和管理。 K8S提供了容器编排,资源调度,弹性伸缩,部署管理…

Meta被曝取消了自己的“Vision Pro计划”内部代号La Jolla

据媒体周五报道,美国科技巨头Meta已经取消了原定于2027年推出高端混合现实头显的计划,Meta原本计划利用这款设备与苹果的Vision Pro一较高下。据Meta的两名员工声称,在本周的一次产品审查会议后,公司管理层突然要求Reality Labs部…

【数据结构】动态顺序表的实现

1.什么是数据结构 数据结构就是把数据元素按照一定的关系组织起来的集合,用来组织和存储数据。通过数据结构,能够有效的将数据组织和管理在一起,按照我们的方式任意对数据进行增删查改等操作。 2.数据结构的分类 数据结构大概可分为逻辑结构…

拆分因子+减枝

前言:一开始看到数据量这么大,我怎么拆分出因子,看了题解才发现要大减枝,但是如何拆分因数我还是要好好学一下 1 0 18 10^{18} 1018 的拆分因子有 1 0 5 10^5 105 的复杂度,再乘以 1 0 3 10^3 103 的数量&#xff0c…

光伏电站设备设施巡视卡之转变二维码登记卡

光伏电站作为重要的能源供应设施,其稳定运行和高效维护至关重要,光伏电站巡回检查制度是保障电站设备正常运行和安全性的重要手段,制定好的制度可以提高电站的经济效益和安全性。 传统的纸质光伏电站巡视卡容易出现巡检记录作假、信息统计不及时、汇总困…

分享一个基于python的零食销售数据采集与可视化分析系统django爬虫项目大数据源码(源码、调试、LW、开题、PPT)

💕💕作者:计算机源码社 💕💕个人简介:本人 八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流&…

国产实时操作系统:和RT-Linux,Zephyr的实时性对比

RT-Thread 在工业领域、高安全高可靠性领域,实时操作系统在其中发挥着重要的作用,从毫秒级,微秒级实时响应,决定着装置系统能满足何种严苛的要求。 RT-Thread Smart操作系统是一套基于RT-Thread内核,并具备POSIX用户态…

LeetCode84(柱状图中最大的矩形)理解单调栈

1. LeetCode84(柱状图中最大的矩形) 给定 n 个非负整数,用来表示柱状图中各个柱子的高度。每个柱子彼此相邻,且宽度为 1 。 求在该柱状图中,能够勾勒出来的矩形的最大面积。 示例 1: 输入:heights [2,1,5,6,2,3] 输出&#xff…

大模型时代,什么样的算法工程师更吃香?

毫无疑问,全栈型的算法工程师将更为抢手,如果你精通大模型从训练到应用的整个流程,你走到哪里都不怕。 但往往人的精力有限,如果从数据、预训练、微调、对齐、推理、应用几个方面来看的话,个人觉得现在重要性排序是“…

python测试框架之Pytest

初识Pytest Pytest1.Pytest的特点:2.Pytest的基本使用规则3.pytest安装1)使用编译器安装2)使用命令安装 4.pytest规则 Pytest Pytest是python的一个第三方单元测试库,它的目的是让单元测试变得容易,并且也能扩展到支持…

同一个wifi不同电脑ip一样吗?网络ip地址怎么修改

‌在数字化时代,Wi-Fi已成为我们日常生活与工作中不可或缺的一部分,它让多台设备能够轻松接入互联网,实现信息共享与数据传输。然而,你是否曾好奇过,在同一个Wi-Fi网络下,不同电脑的IP地址是否会不一样&…

10个Python自动化日常任务实战脚本示例

小编准备入门了Python入门学习籽料80个Python入门实例 点击 领取(无偿获得) 1. 自动备份文件夹 目标 : 每天自动将指定文件夹的内容备份到另一个位置。 import shutil import datetime def backup_files(source, destination): """…

DevEcoStudio创建的默认工程HelloWorld build失败请问如何解决?

解决方法: 方法一: 方法二: 确认当前登录的windows用户是否是Administrator,出现这种情况,大概率都是普通用户,所以造成权限不足的问题。一种解决办法是切换到Administrator用户再打开项目进行build。 如…

已拿证 | 2024深圳驾考科目四全攻略:技巧、知识点一网打尽

目录 _head 精简500题 区分变道和左转,变道手下垂,左转手伸直 紧急包扎需要柔软介质 网状线内禁止停车 会车千万不能开远光灯 只准直行 城3公4 城5公7 一急二反三连续 落水救援 驾驶陋习 车到路肩人在外 交警先看脸!&#xff01…

Redis保姆级安装教程

下载:https://github.com/redis-windows/redis-windows/releases 然后就慢慢等待 下载完解压,打开 以管理员身份运行,这里一直按回车就可以了 复制路径 这里勾错了,是编辑 修改配置文件redis.conf 加这一行 以管理员身份运行cmd,输入redis-cli 在输入ping 再输入info 这样就完…

IP-RDS-222、IP-PRZ-59-AM12、EG-TRZ-42-L、EG-TRZ-42-H比例减压阀放大器

IP-DAR-250、IP-DAR-43C-L、IP-DAR-43C-H、IP-RDS-222、IP-PRZ-59-AM12、EG-TRZ-42-L、EG-TRZ-42-H比例减压阀 EE-PRB、EE-PRD比例压力阀 EE-P2G、ET-P2S、EB-P2A、EE-P2A、ET-P2A、EE-P2H、EG-F2A、EU-F2A比例流量阀 EF-F3G、EU-F3G比例压力补偿流量阀 EQ-S4M、EG-S4M、EQ…