粗俗理解多层感知器

news2024/11/24 0:41:34

一、前言

参考资料和图片均来自以下链接:
https://www.youtube.com/watch?v=aircAruvnKk&list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi
https://www.youtube.com/watch?v=bfmFfD2RIcg
https://www.youtube.com/watch?v=KuXjwB4LzSA
https://www.youtube.com/watch?v=Ilg3gGewQ5U
3Blue1Brown的个人空间-3Blue1Brown个人主页-哔哩哔哩视频
神经网络——最易懂最清晰的一篇文章-CSDN博客

二、几个问题

首先我想引入几个问题:
1.对于神经网络中的 "神经元" 是什么,如何工作的?
2.多层感知器是什么?他和常出现的CNN、RNN、GNN等有什么关系?
3.输入神经网络的信息只能是数字形式的吗?为什么是或者否?
 

三、多层感知器的组成部分和工作原理

    很多人(包括我自己)可能在起初接触神经网络时获取的大部分信息也许都是关于CNN、RNN等的,入门的门槛一下子就拉高了,也许从经典的多层感知器(MLP)入门神经网络会更加轻松,一级打boss比较难哈。

1.神经元:
    神经元是神经网络的基本单元,它接收输入,对其进行处理,并生成输出。
    神经元通常执行加权求和的操作,将输入乘以权重,加上一个偏置项,然后通过一个激活函数来产生输出。

 数学表达如下图:(注意每一个神经元都要进行这样的操作)

    每一层神经元接收上一层或下一层的输入,对应前向传播和反向传播,每一个神经元代表一个激活函数。不是只要激活值为正数就激活,所以要设置偏执项。对应以下视频10:59处,原话为:"但有时 即使加权和大于0时 你也不想把神经元点亮,可能只有当和大于例如10的时候才让它激发,此时你就需要加上一个偏置值 保证不能随便激发"。【官方双语】深度学习之神经网络的结构 Part 1 ver 2.0_哔哩哔哩_bilibili

2.层次结构:
    输入层:接收原始数据作为网络的输入。
    隐藏层:在输入和输出层之间,可以有一个或多个隐藏层构成了MLP的核心,它们负责处理输入数据,提取特征,并通过非线性变换学习输入数据的复杂模式和特征。
    输出层:产生网络的最终输出,例如分类或回归任务的预测值。

    神经网络的输入信息必须是数字形式的,因为神经网络的运算基于数学运算,如加法、乘法和激活函数等,这些都需要数值型数据才能进行。因此,任何非数字形式的数据,在输入到神经网络之前,都需要被转换成数字形式。这个转换过程通常称为特征工程或数据预处理。

3.连接和权重:
    节点之间全连接:每个节点与前一层的所有节点相连。
    每个连接都有一个权重,表示输入信号在该连接上传递时的强度或重要性。
    每个神经元还有一个偏置项,用于调整激活函数的输出。

4.激活函数:
    激活函数的作用是在神经元中引入非线性,这是MLP能够解决非线性问题的关键。
    常见的激活函数包括Sigmoid、tanh、ReLU(Rectified Linear Unit)等。

此外必须的还有(下面的不必一下子就理解):

5.前向传播:
    在前向传播过程中,信息从输入层开始,逐层向前传递,直到输出层。
    每一层的输出都是下一层的输入。

6.损失函数:
    损失函数衡量了神经网络的预测与实际值之间的差异。
    训练神经网络的目标是最小化这个损失函数。

7.反向传播和优化:
    通过反向传播算法,神经网络可以根据损失函数的梯度来更新权重和偏置。
    优化器,如SGD(随机梯度下降)、Adam等,用于指导如何调整权重和偏置来最小化损失函数。

四、其余神经网络

    其余的神经网络如CNN、RNN、GNN等都是在处理某一种任务是表现良好的,例如CNN专门针对图像数据设计、RNN能够处理时间序列和文本等有时间顺序的数据、GNN专为图数据设计等等,但他们都包含以上七部分。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1640850.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C#知识|事件集中响应,多个按钮关联同一事件(实例练习)

哈喽,你好,我是雷工! 本节学习窗体Controls集合、控件事件的统一关联及如何优化重复代码。 01 事件集中响应 原理:就是相同的控件,可以关联同一个事件响应方法。 02 示例演示 2.1、示例功能 该示例实现窗体中选择…

433M无线射频信号控制继电器--第三天

1.先sbit(位地址访问p1^1,p1^2,p1^3口) 当按下A键时D0输入高电平,继电器IO口导通,则接通电源或者灯亮 当按下C键时D1口输入高电平,继电器IO口为高电平,不导通 2.433m无线模块知识 433m无线模块基础知识 -…

容斥原理以及Nim基础(异或,SG函数)

容斥原理&#xff1a; 容斥的复杂度为O&#xff08;2^m)&#xff0c;所以可以通过&#xff0c;对于实现&#xff0c;一共2^n-1种&#xff0c;我们可以用二进制来实现 下面是AC代码&#xff1a; #include<bits/stdc.h> using namespace std; typedef long long LL; cons…

奈氏准则和香农定理

一、奈奎斯特和香农 哈里奈奎斯特&#xff08;Harry Nyquist&#xff09;(左) 克劳德艾尔伍德香农&#xff08;Claude Elwood Shannon&#xff09;(右) 我们应该在心里记住他们&#xff0c;记住所有为人类伟大事业做出贡献的人&#xff0c;因为他们我们的生活变得越来越精彩&…

数字旅游以科技创新为核心竞争力:推动旅游服务的智能化、高效化,满足游客日益增长的旅游需求

一、引言 随着科技的飞速发展&#xff0c;数字旅游作为旅游业与信息技术结合的产物&#xff0c;正以其独特的魅力改变着传统旅游业的格局。科技创新作为数字旅游的核心竞争力&#xff0c;不仅推动了旅游服务的智能化、高效化&#xff0c;更满足了游客日益增长的旅游需求。本文…

挑战一周完成Vue3项目Day5:数据大屏+菜单权限+按钮权限

一、数据大屏 国内echarts镜像站&#xff1a;ISQQW.COM x ECharts 文档&#xff08;国内同步镜像&#xff09; - 配置项 echarts图表集&#xff1a;echarts图表集 1.数据大屏适配问题解决 &#xff08;1&#xff09;vw与vh单位解决适配问题 vw/vh&#xff1a;新增单位&…

顺序循环队列--c语言实现

#include <stdio.h> #include <stdlib.h> #include <stdbool.h>#define MAX_SIZE 100 // 假设队列的最大长度为100// 队列结构体 typedef struct {int data[MAX_SIZE]; // 存储队列元素的数组int front; // 队头指针int rear; // 队尾指针 } SeqQueue;// 初…

AI学习指南-专栏前言

前言 人工智能AI作为当下最火热的技术之一&#xff0c;我们每个人似乎都被动的置身于这场科技变革中&#xff0c;AI越来越多的出现在我们的身边&#xff0c;也总能听到这样的言论&#xff0c;例如“N年后AI会取代某某行业”&#xff0c;AI出现之后&#xff0c;好像大多数人都陷…

【研发日记】Matlab/Simulink避坑指南(十一)——Delay周期Bug

文章目录 前言 背景介绍 问题描述 分析排查 解决方案 总结归纳 前言 见《研发日记&#xff0c;Matlab/Simulink避坑指南(六)——字节分割Bug》 见《研发日记&#xff0c;Matlab/Simulink避坑指南(七)——数据溢出钳位Bug》 见《研发日记&#xff0c;Matlab/Simulink避坑指…

图像分割模型实际分隔效果测试(Clipseg + GroundingDINO + Yoloworld)

✨背景 对于设计的工作流来说&#xff0c;智能图像分割也是一个很重要的课题&#xff0c;尤其是像照片换脸、照片高清写真等等的工作流&#xff0c;可能要多次把人物的脸部或者手部抠图出来进行合成&#xff0c;工作流如果可以直接智能分割图像并合成&#xff0c;就可以避免自…

20240503安装HEVC解码器播放H265格式的8K视频

20240503安装HEVC解码器播放H265格式的8K视频 2024/5/3 9:55 缘起&#xff1a;由于youtube支持8K视频了&#xff0c;想尝尝鲜&#xff01; 主摄像头当然是选择SONY的【夜摄/弱光场景】&#xff0c;根据优选&#xff0c;小米&#xff08;MI&#xff09;13Ultra 最佳了。 在开始播…

设计模式动态代理

什么是设计模式? 一个问题通常有n种解法&#xff0c;其中肯定有一种解法是最优的&#xff0c;这个最优的解法被人总结出来了&#xff0c;称之为设计模式。 设计模式有20多种&#xff0c;对应20多种软件开发中会遇到的问题。 关于设计模式的学习&#xff0c;主要学什么&#…

项目管理-项目范围管理2/2

项目管理&#xff1a;每天进步一点点~ 活到老&#xff0c;学到老 ヾ(◍∇◍)&#xff89;&#xff9e; 何时学习都不晚&#xff0c;加油 项目范围管理&#xff0c;过程 6个&#xff0c;包括“规收定 创确控”&#xff1a; 规划范围管理收集需求定义范围创建WBS确认范围控制…

JS 笔记9 认识JavaScript

相关内容&#xff1a;JS对象、属性、常用事件处理过程、运算符、if...else、for、…… <script type"text/javascript"></script> type属性用来指定MIME(Multipurpose Internet Mail Extension)类型&#xff0c;主要是告诉浏览器目前使用的是哪一种Scri…

先电2.4的openstack搭建

先电2.4版本的openstack&#xff0c;前期虚拟机部署参考上一篇2.2版本&#xff0c;基本步骤是一样的&#xff0c;准备两个镜像文件CentOS-7.5-x86_64-DVD-1804.iso&#xff0c;XianDian-IaaS-V2.4.iso [rootcontroller ~]# cat /etc/sysconfig/network-scripts/ifcfg-eno16777…

【软件测试】软件测试基础

1. 需求1.1. 需求的概念1.2. 为什么要有需求1.3. 测试人员眼中的需求 2. 测试用例2.1. 为什么需要测试用例2.2. 什么是测试用例2.3. 一个简单的测试用例 3. 软件测试的整体流程4. bug4.1. 如何描述一个bug4.2. bug的级别4.3. bug生命周期 1. 需求 1.1. 需求的概念 简单的来说…

如何在iOS设备(iPhone,iPad等)上恢复丢失的照片

如果你像现代90%的人一样拥有智能手机&#xff0c;那么你很可能使用口袋里的微型电脑拍摄大部分&#xff08;如果不是全部&#xff09;照片&#xff0c;而不是标准的傻瓜相机或数码单反相机。 像任何数字设备一样&#xff0c;存储和保存这些照片可能是一个变化无常的过程&…

nvm 切换 Node 版本失败

创建vue3项目时&#xff0c;需要切换到更高版本的 node&#xff0c;于是使用 nvm (node 包版本管理工具)进行版本切换 切换版本时&#xff0c;显示成功&#xff0c;但再次查看当前 node 版本时&#xff0c;发现没切换过来。 解决方法&#xff1a; where node 查看node的安装…

spring高级篇(七)

1、异常处理 在DispatcherServlet中&#xff0c;doDispatch(HttpServletRequest request, HttpServletResponse response) 方法用于进行任务处理&#xff1a; 在捕获到异常后没有立刻进行处理&#xff0c;而是先用一个局部变量dispatchException进行记录&#xff0c;然后统一由…

找不到msvcr110.dll的多种解决方法,轻松解决dll问题

在日常使用计算机的时候&#xff0c;突然提示&#xff1a;“由于找不到msvcr110.dll&#xff0c;无法继续执行代码”。这个错误通常发生在运行某些程序时&#xff0c;系统无法找到所需的动态链接库文件。这个问题可能会给用户带来困扰&#xff0c;但是不用担心&#xff0c;下面…