机器学习入门(六)神经网络初识

news2024/11/27 8:27:30

目录

一、模型解释

1.1 用人脑解释

1.2 用模型解释 

二、通过异或门的神经网络理解偏置量、神经网络的传播

2.1 与门的神经网络表示

2.2 或门的神经网络表示 

2.3 异或门的神经网络表示 

三、多物体分类 


一、模型解释

1.1 用人脑解释

        神经网络是模拟人的神经元,通过输入电化学信号(Input:Dendrite)经过细胞核(Dealing:Nucleus)处理得到结果(Output:Axon)传给下一个神经元(下一个输入)。

1.2 用模型解释 

        这个相比于人脑神经元系统:我们拿肿瘤分类举例

        偏置单元(bias unit):x_{0}=1

        待训练参数:\theta_{1},\theta_{2},\theta_{3},\theta_{4}

        输入(Input):x_{1},x_{2},x_{3}

        处理函数(Dealing):激活函数,逻辑回归的激活函数为Sigmoid函数

g(z) = \frac{1}{1+e^{-z}} \ \ \ z=\theta^{T}x

        输出(Output):根据处理函数处理出的值和判断阈值确定分类或者输出逻辑是或者逻辑否。

        神经网络一般有三层:分别是输入层、隐藏层和输出层。

        我们定义几个符号:

        a_{i}^{(j)}:是第j层的第i个激活单元 

        \Theta ^{(j)}:控制从层j到层j+1的函数映射的权重矩阵
        且一般每新的一个隐藏层会多一个隐藏层,如果用s_{j}表示在j层的单元数量,s_{j+1}表示在j+1层的单元数量,那么\Theta ^{(j)}的维度为s_{j+1} \times (s_{j}+1)

二、通过异或门的神经网络理解偏置量、神经网络的传播

2.1 与门的神经网络表示

        这里我们选择单层隐藏层的神经网络,假设我们训练出的参数\theta_{1},\theta_{2}为20,20。(怎么训练的不用管,后文会介绍)。偏置量\theta_{0}设置为30。

        我们输入为(x_{1},x_{2})\subset binary(0\ or\ 1),输出为y = x_{1} \ AND \ x_{2}

        神经网络如下:

        ①我们输入一组参数判断是否是与逻辑,比如(x_{1},x_{2}) = (1,0)

        则激活函数h_{\Theta }(x) = g(-30 + 20*1 + 20*0)=g(-10),通过观察Sigmoid函数:

         g(-10)的值低于0.01,远低于0.5,我们认为是约等于0的。也就是不存在与关系。

         ②我们输入一组参数判断是否是与逻辑,比如(x_{1},x_{2}) = (1,1)

        则激活函数h_{\Theta }(x) = g(-30 + 20*1 + 20*1)=g(10),通过观察Sigmoid函数:

         g(10)的值接近于1,我们认为存在与关系。

2.2 或门的神经网络表示 

        这里我们选择单层隐藏层的神经网络,假设我们训练出的参数\theta_{1},\theta_{2}为20,20。(怎么训练的不用管,后文会介绍)。偏置量\theta_{0}设置为-10。

        我们输入为(x_{1},x_{2})\subset binary(0\ or\ 1),输出为y = x_{1} \ OR \ x_{2}

        神经网络如下:

        ①我们输入一组参数判断是否是与逻辑,比如(x_{1},x_{2}) = (1,0)

        则激活函数h_{\Theta }(x) = g(-10 + 20*1 + 20*0)=g(10),通过观察Sigmoid函数:

         g(10)的值接近于1,我们认为存在或关系。

         ②我们输入一组参数判断是否是与逻辑,比如(x_{1},x_{2}) = (1,1)

        则激活函数h_{\Theta }(x) = g(-10 + 20*1 + 20*1)=g(30),通过观察Sigmoid函数:

         g(30)的值接近于1,我们认为存在与关系。

2.3 异或门的神经网络表示 

        我们结合与门和非门,推导出异或门。

        异或门对应两种情况:(1,0),(0,1)

        x_{1} \ AND \ x_{2}对应的情况是(1,1)

        (NOT \ x_{1}) \ AND \ (NOT \ x_{2})对应的情况是(0,0)

        则去掉这两种情况便得到了异或门。我们画出神经网络的结构:

         推导前面已经给出,现不重复推导。

三、多物体分类 

        神经网络也能进行多物体分类,它的输出层为向量,如果确定是该物体则该向量的该分量输出为1,而不是像1,2,3,4之类的。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/4028.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Windows上的实用CMD命令

Windows上的实用CMD命令查看系统信息是x64位查看电脑基本诊断信息检查电脑支持的最大运行内存查看内存信息查看Windows电脑上次的启动时间查看显卡信息查看电脑当前的用户名查看当前的用户是不是电脑的管理员用户查看路由信息 route print查看Windows 的version申明&#xff1a…

从心灰意冷到自学Java3个月顺利拿到offer,多亏这份文档

跳槽时时刻刻都在发生,但是我建议大家跳槽之前,先想清楚为什么要跳槽。切不可跟风,看到同事一个个都走了,自己也盲目的开始面试起来(期间也没有准备充分),到底是因为技术原因(影响自…

Allegro172版本Shape避让方形盘不出现弧形操作指导

Allegro172版本Shape避让方形盘不出现弧形操作指导 Allegro172版本避让方形焊盘的时候,不会像166版本一样避让成方形,如下图 只需要按照下面的操作就可以实现和166版本方形避让一样的效果 打开shape Global dynamic parameter 选择Void Controls Rectangle pad viod cor…

java常见题

1.数组和链表结构简单对比?(ArrayList和linkedList) 数组是一段连续的空间。 大小固定 可能大小不够用或者有浪费 数组查询比较方便,根据下标就可以直接找到元素,时间复杂度O(1);增加和删除比较复杂&…

“双11”来了!企企通B2B商城助力打造供销一体数字化解决方案

今年的“双11”,比往年来得更早。10月20日晚上8点,双11第一波预售开启。电商平台的竞争愈发激烈,直播卖货的崛起更是加重了行业的竞争压力。但淘宝、天猫、京东这类传统的电商平台因其完善且成熟的供应链,使得双11淘宝系主场格局不…

Redis进行RCE利用总结

https://www.cnblogs.com/loongten/p/15838580.html 0x00 简要说明 百度百科:Redis(Remote Dictionary Server ),即远程字典服务,是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库&am…

什么才是好代码?

定义代码质量高低,本来就是主观的,更多的是出于判断。为了做出更客观的评判,我个人 认为有益的做法是后退一步,考虑一下编写代码时真正试图实现的目标。在我看来,帮助我实现这些目标的代码就是高质量的,而产…

ECMAScript 6 语法 1 —— 块作用域构造let 和 const

Javascript 的作用域存在的两种情况 情况一:函数内部 function enterYourChoice(flag){// var有变量提升的作用,相当于在此处写了一个 let choice;if(flag){var choice "yes";}else {console.log(choice); // undefined 并没有报错哦&#…

基于arx模型的MPC预测控制器simulink建模与仿真实现

目录 一、理论基础 二、核心程序 三、测试结果 一、理论基础 MPC的优点 模型预测控制善于处理多输入多输出系统 对于MIMO系统,PID需要为每个子系统单独设计PID控制器,由于存在耦合对于较大的系统难以实现 1.MPC控制器可以较好控制MIMO系统 2…

查题校园公众号题库系统

查题校园公众号题库系统 本平台优点: 多题库查题、独立后台、响应速度快、全网平台可查、功能最全! 1.想要给自己的公众号获得查题接口,只需要两步! 2.题库: 查题校园题库:查题校园题库后台(…

深度学习入门(二十五)卷积神经网络——多输入多输出通道

深度学习入门(二十五)卷积神经网络——多输入多输出通道前言卷积神经网络——填充和步幅课件多个输入通道多个输出通道多个输入和输出通道11卷积层二维卷积层总结教材1 多输入通道2 多输出通道3 11卷积层4 小结前言 核心内容来自博客链接1博客连接2希望…

【Linux】腾讯云服务器Linux环境搭载

作者:一个喜欢猫咪的的程序员 专栏:《Linux》 喜欢的话:世间因为少年的挺身而出,而更加瑰丽。 ——《人民日报》 目录 Linux介绍: 我们本篇博客以腾讯云的Linux系统搭载为例&#xf…

SSM详解6:请求转发和请求重定向的区别

1、定义不同 请求转发(forward): 是发生在服务器内部程序,当服务端程序收到一个请求,会将该请求转发给另一个服务端(目的地址),再将目的地址的响应返回给客户端。而客户端对该过程…

前端如何锁定项目的node和pnpm版本

前端如何锁定项目的node和pnpm版本背景如何锁定Node版本的管理背景 项目组成员Node.js、npm、yarn、pnpm等版本不统一。造成编译出错,开发不方便,工作效率低下等问题。 如何锁定 通过修改package.json,指定engines字段,锁定前端所…

初始C++(一)---命名空间、输入输出、缺省参数

目录 1.命名空间 定义命名空间 using 指令 命名空间的嵌套 2、C输入输出 标准输出流(cout) 标准输入流(cin) 3.缺省参数 1.命名空间 定义命名空间 假设这样一种情况,当一个班上有两个名叫张三 的学生时&…

零基础入门网络安全,收藏这篇不迷茫【2022最新】

前言 最近收到不少关注朋友的私信和留言,大多数都是零基础小友入门网络安全。其实看过的铁粉都知道,之前的文里是有过推荐过的。新来的小友可能不太清楚,这里就系统地叙述一遍。 01.简单了解一下网络安全 说白了,网络安全就是指…

网络面试-ox07http中的keep-alive以及长/短连接

非Keep-Alive: 早起HTTP1.0, 浏览器发起http请求需要与服务器建立新的TCP连接,请求处理后连接立即关闭。 缺点:每个这样的连接,客户端与服务器都要分配TCP的缓冲区和变量,这给服务器带来严重的负担。 Keep-Alive: 默认持久连接&am…

成为Linux大神——必须要具备的基本技能!

要努力,但不要着急,繁花锦簇,硕果累累,都需要过程! 目录 1.Linux软件包管理器yum 2.Linux编辑器—vim的使用 2.1vim的基本概念: 2.2vim的基本操作: 2.3vim正常模式命令集: 2.4vim底行…

vue3 + ts: layout布局

一、理解:layout layout,语义:布局,设计,结合前端vue项目,我理解为这样的定义:页面级别的组件,框架级别的组件,基础布局组件,基础设计 关键词:组…

SEO外链专员,SEO专员,SEO编辑,每天工作量给他们怎么安排?

企业想要做好网站排名,想要让网站在搜索引擎中获得更高的曝光度,就需要对网站进行整体优化,而整体优化就包括站内优化,以及站外优化,只有这样才能让网站关键词获得的更多的排名,从而也就能够获得更多的流量…