【机器学习】BP神经网络基本结构

news2024/11/22 22:37:29

鑫宝Code

🌈个人主页: 鑫宝Code
🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础
💫个人格言: "如无必要,勿增实体"


文章目录

  • BP神经网络基本结构
    • 1. 引言
    • 2. BP神经网络的基本概念
      • 2.1 什么是BP神经网络
      • 2.2 BP神经网络的特点
    • 3. BP神经网络的基本结构
      • 3.1 输入层
      • 3.2 隐藏层
      • 3.3 输出层
      • 3.4 神经元结构
    • 4. BP神经网络的工作原理
      • 4.1 前向传播
      • 4.2 反向传播
    • 5. BP神经网络的数学推导
      • 5.1 前向传播
      • 5.2 反向传播
    • 6. BP神经网络的实现
    • 7. BP神经网络的应用
    • 8. BP神经网络的优缺点
      • 8.1 优点
      • 8.2 缺点
    • 9. BP神经网络的改进方向
    • 10. 结论

BP神经网络基本结构

1. 引言

反向传播(Backpropagation,简称BP)神经网络是人工神经网络中最常用和最基础的模型之一。它通过反向传播算法来训练多层前馈神经网络,能够有效地学习复杂的非线性映射关系。本文将详细介绍BP神经网络的基本结构、工作原理以及应用。
在这里插入图片描述

2. BP神经网络的基本概念

2.1 什么是BP神经网络

BP神经网络是一种监督学习算法,它通过最小化预测输出与实际目标之间的误差来调整网络参数。BP算法的核心思想是将输出误差沿网络反向传播,从而指导各层权重的调整。

2.2 BP神经网络的特点

  1. 非线性映射能力强
  2. 自学习和自适应能力
  3. 泛化能力好
  4. 容错性高

3. BP神经网络的基本结构

BP神经网络通常由三部分组成:输入层、隐藏层和输出层。

3.1 输入层

输入层负责接收外部输入信号,并将其传递给隐藏层。输入层神经元的数量等于输入特征的维度。

3.2 隐藏层

隐藏层位于输入层和输出层之间,负责对输入信息进行非线性变换。BP神经网络可以有一个或多个隐藏层,每个隐藏层可以包含不同数量的神经元。

3.3 输出层

输出层产生网络的最终输出。输出层神经元的数量取决于具体问题,例如回归问题通常有一个输出神经元,而分类问题可能有多个输出神经元。

3.4 神经元结构

每个神经元都包含以下组件:

  1. 权重(w):连接不同神经元的强度
  2. 偏置(b):调整神经元激活阈值
  3. 激活函数:引入非线性,常用的有Sigmoid、ReLU、tanh等

神经元的输出可以表示为:

y = f ( ∑ i = 1 n w i ⋅ x i + b ) y = f\left(\sum_{i=1}^{n} w_i \cdot x_i + b\right) y=f(i=1nwixi+b)

其中,f是激活函数,x_i是输入,w_i是对应的权重。

4. BP神经网络的工作原理

BP神经网络的工作原理可以分为两个阶段:前向传播和反向传播。

4.1 前向传播

前向传播是指输入信号从输入层经过隐藏层,最后到达输出层的过程。

  1. 输入层接收外部信号
  2. 隐藏层对输入进行加权求和,并通过激活函数处理
  3. 输出层产生最终结果
    在这里插入图片描述

4.2 反向传播

反向传播是BP算法的核心,它通过计算损失函数对各层权重的梯度,从输出层向输入层逐层调整权重。

  1. 计算输出误差
  2. 计算输出层梯度
  3. 反向传播误差到隐藏层
  4. 更新权重和偏置
    在这里插入图片描述

5. BP神经网络的数学推导

为了更好地理解BP神经网络的工作原理,我们来看一下简化的数学推导过程。

5.1 前向传播

假设我们有一个三层神经网络(输入层、一个隐藏层、输出层)。

隐藏层输出:
h = f ( W 1 ⋅ x + b 1 ) h = f(W_1 \cdot x + b_1) h=f(W1x+b1)

输出层输出:
h = f ( W 2 ⋅ x + b 2 ) h = f(W_2 \cdot x + b_2) h=f(W2x+b2)

其中,W1和W2是权重矩阵,b1和b2是偏置向量,f是激活函数。

5.2 反向传播

定义损失函数(以均方误差为例):
L = 1 2 ( y − t ) 2 L = \frac{1}{2} \left( y - t \right)^2 L=21(yt)2
其中,t是目标值。

计算输出层梯度:
∂ L ∂ W 2 = ( y − t ) ⋅ f ′ ( W 2 ⋅ h + b 2 ) ⋅ h \frac{\partial L}{\partial W_2} = (y - t) \cdot f'(W_2 \cdot h + b_2) \cdot h W2L=(yt)f(W2h+b2)h
∂ L ∂ b 2 = ( y − t ) ⋅ f ′ ( W 2 ⋅ h + b 2 ) \frac{\partial L}{\partial b_2} = (y - t) \cdot f'(W_2 \cdot h + b_2) b2L=(yt)f(W2h+b2)

计算隐藏层梯度:
∂ L ∂ W 1 = ( ( y − t ) ⋅ f ′ ( W 2 ⋅ h + b 2 ) ⋅ W 2 ) ⋅ f ′ ( W 1 ⋅ x + b 1 ) ⋅ x \frac{\partial L}{\partial W_1} = \left( (y - t) \cdot f'(W_2 \cdot h + b_2) \cdot W_2 \right) \cdot f'(W_1 \cdot x + b_1) \cdot x W1L=((yt)f(W2h+b2)W2)f(W1x+b1)x
∂ L ∂ b 1 = ( ( y − t ) ⋅ f ′ ( W 2 ⋅ h + b 2 ) ⋅ W 2 ) ⋅ f ′ ( W 1 ⋅ x + b 1 ) \frac{\partial L}{\partial b_1} = \left( (y - t) \cdot f'(W_2 \cdot h + b_2) \cdot W_2 \right) \cdot f'(W_1 \cdot x + b_1) b1L=((yt)f(W2h+b2)W2)f(W1x+b1)

更新权重和偏置:
W 2 = W 2 − l e a r n i n g R a t e ⋅ ∂ L ∂ W 2 W_2 = W_2 - learningRate \cdot \frac{\partial L}{\partial W_2} W2=W2learningRateW2L
W 1 = W 1 − l e a r n i n g R a t e ⋅ ∂ L ∂ W 1 W_1 = W_1 - learningRate \cdot \frac{\partial L}{\partial W_1} W1=W1learningRateW1L
b 2 = b 2 − l e a r n i n g R a t e ⋅ ∂ L ∂ b 2 b_2 = b_2 - learningRate \cdot \frac{\partial L}{\partial b_2} b2=b2learningRateb2L
b 1 = b 1 − l e a r n i n g R a t e ⋅ ∂ L ∂ b 1 b_1 = b_1 - learningRate \cdot \frac{\partial L}{\partial b_1} b1=b1learningRateb1L

6. BP神经网络的实现

以下是一个简单的BP神经网络实现示例(使用Python和NumPy):

import numpy as np

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def sigmoid_derivative(x):
    return x * (1 - x)

class BPNeuralNetwork:
    def __init__(self, input_size, hidden_size, output_size):
        self.input_size = input_size
        self.hidden_size = hidden_size
        self.output_size = output_size
        
        self.W1 = np.random.randn(self.input_size, self.hidden_size)
        self.b1 = np.zeros((1, self.hidden_size))
        self.W2 = np.random.randn(self.hidden_size, self.output_size)
        self.b2 = np.zeros((1, self.output_size))
    
    def forward(self, X):
        self.z1 = np.dot(X, self.W1) + self.b1
        self.a1 = sigmoid(self.z1)
        self.z2 = np.dot(self.a1, self.W2) + self.b2
        self.a2 = sigmoid(self.z2)
        return self.a2
    
    def backward(self, X, y, output):
        self.output_error = y - output
        self.output_delta = self.output_error * sigmoid_derivative(output)
        
        self.z1_error = np.dot(self.output_delta, self.W2.T)
        self.z1_delta = self.z1_error * sigmoid_derivative(self.a1)
        
        self.W1 += np.dot(X.T, self.z1_delta)
        self.b1 += np.sum(self.z1_delta, axis=0, keepdims=True)
        self.W2 += np.dot(self.a1.T, self.output_delta)
        self.b2 += np.sum(self.output_delta, axis=0, keepdims=True)
    
    def train(self, X, y, epochs, learning_rate):
        for _ in range(epochs):
            output = self.forward(X)
            self.backward(X, y, output)

# 使用示例
nn = BPNeuralNetwork(2, 4, 1)
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([[0], [1], [1], [0]])

nn.train(X, y, epochs=10000, learning_rate=0.1)

# 测试
test_input = np.array([[1, 1]])
prediction = nn.forward(test_input)
print(f"Input: {test_input}, Prediction: {prediction}")

7. BP神经网络的应用

BP神经网络因其强大的非线性映射能力和自学习能力,在许多领域都有广泛应用:

  1. 模式识别:如图像识别、语音识别等
  2. 预测和回归分析:如股票价格预测、天气预报等
  3. 控制系统:如机器人控制、工业过程控制等
  4. 数据压缩:如图像和语音数据的压缩
  5. 自然语言处理:如机器翻译、文本分类等

8. BP神经网络的优缺点

8.1 优点

  1. 非线性映射能力强
  2. 自学习和自适应能力好
  3. 泛化能力强
  4. 容错性高
  5. 并行处理能力强

8.2 缺点

  1. 网络结构需要人为确定,缺乏理论指导
  2. 容易陷入局部最小值
  3. 收敛速度可能较慢
  4. 对于大规模问题,计算复杂度高
  5. 可解释性较差

9. BP神经网络的改进方向

为了克服BP神经网络的一些缺点,研究人员提出了多种改进方法:

  1. 使用更先进的优化算法,如Adam、RMSprop等
  2. 引入正则化技术,如L1/L2正则化、Dropout等
  3. 使用更好的初始化方法,如Xavier初始化、He初始化等
  4. 采用批量归一化(Batch Normalization)技术
  5. 使用残差连接(Residual Connections)
  6. 结合其他神经网络结构,如CNN、RNN等

10. 结论

BP神经网络作为人工神经网络的基础,在机器学习和深度学习领域扮演着重要角色。尽管它有一些局限性,但通过不断的改进和创新,BP神经网络及其衍生模型仍然是解决复杂问题的有力工具。理解BP神经网络的基本结构和工作原理,对于深入学习更复杂的神经网络模型和算法具有重要意义。

随着深度学习的快速发展,BP神经网络的思想被广泛应用于各种先进的神经网络结构中。因此,掌握BP神经网络的基础知识,将为进一步探索人工智能和机器学习领域打下坚实的基础。

End

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1985053.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

性价比高的蓝牙耳机推荐?分享我的2024年开放式耳机选购指南

2024年快到下旬了,市场上的蓝牙耳机价格也是差不多都沉淀起来了。所以就性价比高的蓝牙耳机的入手时间来说,那确实是年底左右的时间挑选入手会比较好一点。 而挑选性价比高的蓝牙耳机类型呢,我会首选开放式耳机。因为就开放式耳机而言&#…

yarn insntall 报错,显示 @achrinza/node-ipc@9.2.2 不支持现在的node版本

最近执行yarn install 时,突然遇到这样一个段报错 error achrinza/node-ipc9.2.2: The engine "node" is incompatible with this module. Expected version "8 || 10 || 12 || 14 || 16 || 17". Got "18.10.0" error Found incompa…

中创算力:以知识产权转化运用促进高质量发展

创新是引领发展的第一动力,保护知识产权就是保护创新。为深入实施知识产权公共服务普惠工程,促进知识产权公共服务更好服务高水平科技,国家知识产权局发布关于全面提升知识产权公共服务效能的指导意见。 在政策落地过程中,如何精…

《Milvus Cloud向量数据库指南》—Milvus Cloud赋能Ivy.ai:解锁大数据潜力,加速AI创新

引入Milvus Cloud:Ivy.ai的大规模全托管向量数据库解决方案新篇章 在人工智能驱动的数字化时代,数据成为了企业最宝贵的资产之一,而如何高效地管理和利用这些数据,则是决定企业能否在竞争中脱颖而出的关键因素。对于Ivy.ai这样致力于提升高等教育、医疗保健和公共部门沟通…

BM1反转链表[栈+头插法]

题目要求如下: 问题比较简单,就是将链表中的值进行反转即可。 一种比较简单的方式是使用栈链表的方式来实现,下面是相应的代码: #include <stdio.h> #include <stdlib.h> int arr[10001] {0}; struct ListNode* ReverseList(struct ListNode* head ) {if (head …

【数据结构】——介绍树

树 树的概念和结构 树是⼀种⾮线性的数据结构&#xff0c;它是由 n&#xff08;n>0&#xff09;个有限结点组成⼀个具有层次关系的集合。把它叫做树是因为它看起来像⼀棵倒挂的树&#xff0c;也就是说它是根朝上&#xff0c;⽽叶朝下的。 • 有⼀个特殊的结点&#xff0c;…

韩国裸机云站群服务器是什么?有什么优势

韩国裸机云站群服务器是什么&#xff1f;韩国裸机云站群服务器是一种提供多IP地址分配和高性能网络服务的云计算解决方案。这种服务器结合了裸机服务器与云端技术&#xff0c;具有高性能、高可靠性和灵活可扩展性的特点。它广泛应用于需要多IP管理和高稳定性的网络应用&#xf…

unity项目语言设置成中文

步骤一&#xff1a;安装简体中文包 操作&#xff1a;在unity hub界面点击安装&#xff0c;然后在安装的unity版本中点击添加模块 操作&#xff1a;选择简体中文安装包进行安装 步骤二&#xff1a;切换简体中文包 操作&#xff1a;创建一个项目&#xff08;或者打开已经创建过…

从0开始的算法(数据结构和算法)基础(五)

哈希表 哈希表是什么&#xff1f; 哈希表&#xff08;Hash Table&#xff09;是一种数据结构&#xff0c;用于快速存储和查找数据。它通过将键&#xff08;key&#xff09;映射到数组中的索引位置来实现高效的查找、插入和删除操作。 乍一看不明白很正常&#xff0c;如果你学过…

国外一个免费的PDF转图片的网站,WPS VIP才能享受的大量功能,这里都有了。

国外一个免费的PDF转图片的网站&#xff0c;WPS VIP才能享受的大量功能&#xff0c;这里都有了。https://imagestool.com/ 免费PDF转图片 等WPS收费功能 【慧哥开源充电桩平台】下载源码地址 https://liwenhui.blog.csdn.net/article/details/134773779?spm1001.2014.3001.55…

入侵检测技术

课程目标 了解需要入侵检测技术的原因 熟知入侵检测系统&#xff08;IDS&#xff09;的概念、结构、分类及作用 掌握入侵检测技术及其应用 目录 Why 为什么要学习IDS 1.防火墙不能保证绝对的安全 网络边界的设备 自身可以被攻破 对某些攻击保护很弱 不是所有的威胁来自…

分而治之?如何高效提炼大型语言模型的推理能力

人工智能咨询培训老师叶梓 转载标明出处 虽然大模型&#xff08;如GPT-4&#xff09;在开放域问答&#xff08;ODQA&#xff09;、数学、科学以及自主智能体等领域展现出了非凡的推理能力&#xff0c;但是这些模型在进行复杂推理时&#xff0c;往往需要处理大量的参数&#xff…

项目管理中,项目经理有哪些优势?

项目经理在项目管理中扮演着至关重要的角色&#xff0c;他们的优势主要体现在以下几个方面&#xff1a; 一、计划与组织能力 超强的计划能力&#xff1a;项目经理需要制定各种计划&#xff0c;因此更擅长制定精确、合理的项目计划。他们能够有效地分解项目任务&#xff0c;排…

Elastic 基于 RAG 的 AI 助手:使用 LLM 和私有 GitHub 问题分析应用程序问题

作者&#xff1a;来自 Bahubali Shetti 作为 SRE&#xff0c;分析应用程序比以往任何时候都更加复杂。你不仅必须确保应用程序以最佳方式运行以确保出色的客户体验&#xff0c;而且在某些情况下还必须了解内部工作原理以帮助排除故障。分析基于生产的服务中的问题是一项团队运动…

麒麟V10系统 arm架构 安装docker

查看服务器环境 ## 查看系统版本&#xff0c;确认版本 cat /etc/kylin-release## 操作系统 uname -p## 内核版本&#xff08;≥ 3.10&#xff09; uname -r## iptables 版本&#xff08;≥ 1.4&#xff09; iptables --version iptables v1.8.1 (legacy)# 我这边是arm64/v8 架…

首届中文NL2SQL挑战赛亚军比赛攻略_BugCreater

关联比赛: 首届中文NL2SQL挑战赛 1. 任务描述 本次比赛的任务&#xff1a;根据Question、表格信息&#xff08;包含列名、列类型、内容&#xff09;&#xff0c;预测对应的SQL语句&#xff08;下图黄色部分&#xff09;。比赛只涉及单表查询&#xff0c;需要预测的有4部分&a…

pointofix下载与调整中文

想要在屏幕上批注&#xff0c;用pointofix最好&#xff0c;本篇文章告诉你如何下载pointofix和把pointofix语言弄成中文。 首先打开pointofix官网下载pointofix的安装包。 Pointofix - Herunterladen - Downloadhttps://www.pointofix.de/download.php点击这个pointofix180de…

基于CentOS Stream 9平台搭建Nacos2.4.0.1集群,并使用OpenResty反向代理集群,GRPC协议配置

目录展示 Nacos2.4.0.1集群搭建1. 下载2. 解压3.修改配置3.1分别修改下启动类中JDK路径以及启动大小3.2 分别配置数据源 修改端口去掉前面的#注释&#xff08;修改数据库地址、数据库用户名、密码&#xff09;If use MySQL as datasource:Count of DB:Connect URL of DB:密钥鉴…

SQL注入实例(sqli-labs/less-9)

0、初始页面 1、爆库名 使用python脚本 def inject_database1(url):name for i in range(1, 20):low 32high 128mid (low high) // 2while low < high:payload "1 and if(ascii(substr(database(),%d,1)) > %d ,sleep(2),0)-- " % (i, mid)res {"…

项目管理证书 PMP 的含金量高吗?详解分析

有用就是好的&#xff0c;我觉得PMP在项目管理领域非常实用。特别是对我这样刚入门的新手来说&#xff0c;PMP证书和项目管理思维方式对我有很大帮助。因为我刚开始接触这个领域&#xff0c;所以能够接受正确的思维指引&#xff0c;比起那些有经验但可能存在错误思维的经理来说…