神经网络入门①多层感知器如何解决异或问题？

news2024/11/28 7:44:55

文章目录

1. 多层感知器
2. BP算法
参考文献

1. 多层感知器

感知机（perceptron）早在20世纪50年代就提出来了¹，但直到近几年深度学习的崛起，神经网络才再次走入大众的视野，并且成为了当下最热门的研究方向之一。

一个单层的感知器只能解决线性问题，而要解决如“异或”等非线性问题，则需要引入多层感知器

其原理是通过叠加多个线性的单元，构成非线性的网络

首先考虑一个简单的“与”运算

$Y=A\&B$

其真值表如下

A	B	Y	C
0	0	0	0
0	1	0	1
1	0	0	1
1	1	1	2

只有当 $A$ 与 $B$ 都为1的时候 $Y$ 才为1，表中 $C$ 为 $A$ 与 $B$ 的数学运算值，即

$C = A + B$

将真值表转化为图的形式，其中横坐标 $A B$ 表示 $A$ 和 $B$ 组成的2比特的数。例如：当 $A = 1$ 且 $B = 0$ 时， $A B = 10 (二进制) = 2 (十进制)$
在这里插入图片描述

观察 $C$ 的取值与 $Y$ 的关系，可以得到，当 $A$ 与 $B$ 的线性加和大于1.5时，可以认为 $A\&B$ 为1，小于等于1.5时则为0

因此通过引入一个非线性激活函数，可以将数学运算值转化为“与”运算，该运算可以描述为：

$s g n (A + B - 1.5)$

其中 $s g n$ 表示符号函数

因此一个具有“与”运算功能的神经网络可以表示为

在这里插入图片描述

一个“或”运算问题如下

$Y = A ∣ B$

通过上述方式可以得到一个具有“或”运算功能的神经网络可以表示为

在这里插入图片描述

同理可得到具有“非”运算功能的神经元

$Y=\~A$
在这里插入图片描述

考虑一个“异或”问题：

$Y = A \oplus B$

这是一个非线性对应关系，无法用一个简单的神经元表示

但是从逻辑上分析，一个“异或”问题可以转化为“与”和“或”问题的组合，即

$Y=A⊕B=(A|B)\&(\~A|\~B)$

则其对应的神经网络可以表示为

在这里插入图片描述
检验一下真值表

A	B	Y	C1	C2	C	Y
0	0	0	-0.5	1.5	-0.5	0
0	1	1	0.5	0.5	0.5	1
1	0	1	0.5	0.5	0.5	1
1	1	0	1.5	-0.5	-0.5	0

可以看到多层感知器可以解决“异或”问题

2. BP算法

待续

参考文献

Rosenblatt, F., 1958. The perceptron: a probabilistic model for information storage and organization in the brain. Psychological review, 65(6), p.386. ↩︎

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/664687.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

神经网络入门①多层感知器如何解决异或问题？

文章目录

1. 多层感知器

2. BP算法

参考文献

相关文章

MybatisPlus的save方法

MySQL优化--覆盖索引，超大分页查询

一步一步教你如何使用MMSelfSup框架【1】

C#探索之路(8)：初探.Net中官方文档OpCode的格式

使用ChatGPT最新版实现批量写作，打造丰富多彩的聚合文章

使用mpi并行技术实现快排Qsort（）

基于 JavaScript 中的 Date 类型实现指定日期和天数的加减运算

CAS、AtomicInteger和LongAdder原理

Java性能权威指南-总结15

【C语言进阶】文件操作

基于matlab使用先导校准来补偿阵列不确定性（附源码）

io.netty学习（二）Netty 架构设计

1.react路由的基本使用

P31[10-1]软件模拟IIC通信协议(使用stm32库函数)(内含：实物连接+IIC时序解释+硬件电路+IIC基本时序单元(起始终止发送接收 ))

基于Springboot+mybatis+mysql+html图书管理系统2

8.compute部署neutron服务

C语言：将一句话的单词进行倒置，标点不倒置。

chatgpt赋能python：Python中寻找不重复字符的方法

Python小白如何利用GPT4快速开发一个网站！

chatgpt赋能python：Python扩展库需要导入吗？重要性与结论解析