【深度学习实验】前馈神经网络(二):使用PyTorch实现不同激活函数(logistic、tanh、relu、leaky_relu)

news2025/1/13 7:49:44

目录

一、实验介绍

 二、实验环境

1. 配置虚拟环境

2. 库版本介绍

三、实验内容

0. 导入必要的工具包

1. 定义激活函数

logistic(z)

tanh(z)

relu(z)

leaky_relu(z, gamma=0.1)

2. 定义输入、权重、偏置

3.  计算净活性值

4. 绘制激活函数的图像

5. 应用激活函数并打印输出结果

6. 代码整合


一、实验介绍

        本实验展示了使用PyTorch实现不同激活函数。

  • 计算净活性值,并将其应用于Sigmoid、双曲正切、ReLU和带泄漏的修正线性单元函数。
  • 绘制这些激活函数的图像、打印输出结果,展示了它们在不同输入范围内的行为和输出结果。

 二、实验环境

        本系列实验使用了PyTorch深度学习框架,相关操作如下:

1. 配置虚拟环境

conda create -n DL python=3.7 
conda activate DL
pip install torch==1.8.1+cu102 torchvision==0.9.1+cu102 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html
conda install matplotlib
 conda install scikit-learn

2. 库版本介绍

软件包本实验版本目前最新版
matplotlib3.5.33.8.0
numpy1.21.61.26.0
python3.7.16
scikit-learn0.22.11.3.0
torch1.8.1+cu1022.0.1
torchaudio0.8.12.0.2
torchvision0.9.1+cu1020.15.2

三、实验内容

ChatGPT:

        前馈神经网络(Feedforward Neural Network)是一种常见的人工神经网络模型,也被称为多层感知器(Multilayer Perceptron,MLP)。它是一种基于前向传播的模型,主要用于解决分类和回归问题。

        前馈神经网络由多个层组成,包括输入层、隐藏层和输出层。它的名称"前馈"源于信号在网络中只能向前流动,即从输入层经过隐藏层最终到达输出层,没有反馈连接。

以下是前馈神经网络的一般工作原理:

  1. 输入层:接收原始数据或特征向量作为网络的输入,每个输入被表示为网络的一个神经元。每个神经元将输入加权并通过激活函数进行转换,产生一个输出信号。

  2. 隐藏层:前馈神经网络可以包含一个或多个隐藏层,每个隐藏层由多个神经元组成。隐藏层的神经元接收来自上一层的输入,并将加权和经过激活函数转换后的信号传递给下一层。

  3. 输出层:最后一个隐藏层的输出被传递到输出层,输出层通常由一个或多个神经元组成。输出层的神经元根据要解决的问题类型(分类或回归)使用适当的激活函数(如Sigmoid、Softmax等)将最终结果输出。

  4. 前向传播:信号从输入层通过隐藏层传递到输出层的过程称为前向传播。在前向传播过程中,每个神经元将前一层的输出乘以相应的权重,并将结果传递给下一层。这样的计算通过网络中的每一层逐层进行,直到产生最终的输出。

  5. 损失函数和训练:前馈神经网络的训练过程通常涉及定义一个损失函数,用于衡量模型预测输出与真实标签之间的差异。常见的损失函数包括均方误差(Mean Squared Error)和交叉熵(Cross-Entropy)。通过使用反向传播算法(Backpropagation)和优化算法(如梯度下降),网络根据损失函数的梯度进行参数调整,以最小化损失函数的值。

        前馈神经网络的优点包括能够处理复杂的非线性关系,适用于各种问题类型,并且能够通过训练来自动学习特征表示。然而,它也存在一些挑战,如容易过拟合、对大规模数据和高维数据的处理较困难等。为了应对这些挑战,一些改进的网络结构和训练技术被提出,如卷积神经网络(Convolutional Neural Networks)和循环神经网络(Recurrent Neural Networks)等。

本系列为实验内容,对理论知识不进行详细阐释

(咳咳,其实是没时间整理,待有缘之时,回来填坑)

这段代码是一个用于演示不同激活函数的神经网络的示例。下面是对代码的详细分析:

0. 导入必要的工具包

  • torch:PyTorch深度学习框架的主要包。
  • matplotlib.pyplot:用于绘制图形的Python库。
# 导入必要的工具包
import torch
# 绘画时使用的工具包
import matplotlib.pyplot as plt

1. 定义激活函数

  • logistic(z)

    • 实现逻辑斯蒂(Logistic)函数,将输入张量z应用于逻辑斯蒂函数的公式,并返回结果。
def logistic(z):
    return 1.0 / (1.0 + torch.exp(-z))
  • tanh(z)

    • 实现双曲正切(Tanh)函数,将输入张量z应用于双曲正切函数的公式,并返回结果。
def tanh(z):
    return (torch.exp(z) - torch.exp(-z)) / (torch.exp(z) + torch.exp(-z))
  • relu(z)

    • 实现修正线性单元(ReLU)函数,将输入张量z应用于ReLU函数的公式,并返回结果。
def relu(z):
    return torch.max(z, torch.zeros_like(z))
  • leaky_relu(z, gamma=0.1)

    • 实现带泄漏的修正线性单元(Leaky ReLU)函数,将输入张量z应用于Leaky ReLU函数的公式,并返回结果。
def leaky_relu(z, gamma=0.1):
    positive = torch.max(z, torch.zeros_like(z))
    negative = torch.min(z, torch.zeros_like(z))
    return positive + gamma * negative

2. 定义输入、权重、偏置

  • x:一个形状为(2, 5)的张量,代表两个样本,每个样本有5个特征。
  • w:一个形状为(5, 1)的张量,代表权重向量,其中每个权重与一个特征相对应。
  • b:一个形状为(1, 1)的张量,代表偏置项。
# x 表示两个含有5个特征的样本,x是一个二维的tensor
x = torch.randn((2, 5))
# w 表示含有5个参数的权重向量,w是一个二维的tensor
w = torch.randn((5, 1))
# 偏置项,b是一个二维的tensor,但b只有一个数值
b = torch.randn((1, 1))

3.  计算净活性值

  • z:通过将输入张量x与权重张量w相乘,并加上偏置项b得到的张量。
# 矩阵乘法,请注意 x 和 w 的顺序,与 b 相加时使用了广播机制
z = torch.matmul(x, w) + b

4. 绘制激活函数的图像

  • 创建一个图像窗口,并绘制四个子图。
  • 在第一个子图中绘制Sigmoid型激活函数和双曲正切函数的图像。
  • 在第二个子图中绘制ReLU型激活函数和带泄漏的修正线性单元函数的图像。
  • 添加图例,并显示图像。
# 从-10 到 10 每间隔0.01 取一个数
a = torch.arange(-10, 10, 0.01)
plt.figure()
# 在第一个子图中绘制Sigmoid型激活函数
plt.subplot(2, 2, 1)
plt.plot(a.tolist(), logistic(a).tolist(), color='red', label='logistic')
plt.plot(a.tolist(), tanh(a).tolist(), color='blue', linestyle='--', label='tanh')
# 在第二个子图中绘制ReLU型激活函数
plt.subplot(222)
plt.plot(a.tolist(), relu(a).tolist(), color='g', label='relu')
plt.plot(a.tolist(), leaky_relu(a).tolist(), color='black', linestyle='--', label='leaky relu')

plt.legend()
plt.show()

5. 应用激活函数并打印输出结果

  • sig_output:将净活性值z应用于Sigmoid函数,得到激活后的输出。
  • tan_output:将净活性值z应用于双曲正切函数,得到激活后的输出。
  • relu_output:将净活性值z应用于ReLU函数,得到激活后的输出。
  • 打印输出结果。
# z为前面计算的净活性值
sig_output = torch.sigmoid(z)
tan_output = torch.tanh(z)
relu_output = torch.relu(z)
# 打印输出结果
print('sigmoid:', sig_output)
print('tanh:', tan_output)
print('ReLU:', relu_output)

6. 代码整合

# 导入必要的工具包
import torch
# 绘画时使用的工具包
import matplotlib.pyplot as plt


# Logistic 函数
def logistic(z):
    return 1.0 / (1.0 + torch.exp(-z))


# Tanh函数
def tanh(z):
    return (torch.exp(z) - torch.exp(-z)) / (torch.exp(z) + torch.exp(-z))


# ReLU函数
def relu(z):
    return torch.max(z, torch.zeros_like(z))


# leakyReLU函数
def leaky_relu(z, gamma=0.1):
    positive = torch.max(z, torch.zeros_like(z))
    negative = torch.min(z, torch.zeros_like(z))
    return positive + gamma * negative

# x 表示两个含有5个特征的样本,x是一个二维的tensor
x = torch.randn((2, 5))
# w 表示含有5个参数的权重向量,w是一个二维的tensor
w = torch.randn((5, 1))
# 偏置项,b是一个二维的tensor,但b只有一个数值
b = torch.randn((1, 1))
# 矩阵乘法,请注意 x 和 w 的顺序,与 b 相加时使用了广播机制
z = torch.matmul(x, w) + b
# 画出激活函数的图像
# 从-10 到 10 每间隔0.01 取一个数
a = torch.arange(-10, 10, 0.01)
plt.figure()
# 在第一个子图中绘制Sigmoid型激活函数
plt.subplot(2, 2, 1)
plt.plot(a.tolist(), logistic(a).tolist(), color='red', label='logistic')
plt.plot(a.tolist(), tanh(a).tolist(), color='blue', linestyle='--', label='tanh')
# 在第二个子图中绘制ReLU型激活函数
plt.subplot(222)
plt.plot(a.tolist(), relu(a).tolist(), color='g', label='relu')
plt.plot(a.tolist(), leaky_relu(a).tolist(), color='black', linestyle='--', label='leaky relu')

plt.legend()
plt.show()

# z为前面计算的净活性值
sig_output = torch.sigmoid(z)
tan_output = torch.tanh(z)
relu_output = torch.relu(z)
# 打印输出结果
print('sigmoid:', sig_output)
print('tanh:', tan_output)
print('ReLU:', relu_output)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1023362.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL基础—从零开始学习MySQL

01.MySQL课程介绍_哔哩哔哩_bilibili 1、MySQL安装 以管理员身份运行cmd net start mysql80net stop mysql80 客户端连接 1). 方式一:使用MySQL提供的客户端命令行工具 2). 方式二:使用系统自带的命令行工具执行指令 mysql [-h 127.0.0.1] [-P 3…

mysql知识大全

MySQL知识大全(2) MySqL 基础为1—7(增删改查基础语法),MySQL进阶知识为8—11(约束、数据库设计、多表查询、事务) 1、数据库相关概念 以前我们做系统,数据持久化的存储采用的是文件…

【二叉树】二叉树展开为链表-力扣 114 题

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kuan 的首页,持续学…

【云原生】k8s-----集群调度

目录 1.k8s的list-watch机制 1.1 list-watc机制简介 1.2 根据list-watch机制,pod的创建流程 2.scheduler的调度策略 2.1 scheduler的调度策略简介 2.2 Scheduler预选策略的算法 2.3 Scheduler优选策略的算法 3. k8s中的标签管理及nodeSelector和nodeName的 调…

win10 安装 Langchain-Chatchat 避坑指南(2023年9月18日v0.2.4版本,包含全部下载内容!)

网上教程都是基于外网或者翻墙的,而且细节极其不清晰,尤其是最关键的模型下载。 另外提一句,我的显卡是:3080Ti 16GB版本,运行之后,显存占用13-14GB 1、安装Anaconda(这个就不啰嗦了&#xff0c…

【SpringMVC】JSON注解全局异常处理机制

🎉🎉欢迎来到我的CSDN主页!🎉🎉 🏅我是Java方文山,一个在CSDN分享笔记的博主。📚📚 🌟在这里,我要推荐给大家我的专栏《Spring MVC》。&#x1f3…

Nue JS 造全新的 Web 生态

Nue JS 是最近开源的 Web 前端项目,用于构建用户界面,体积非常小(压缩后 2.3kb)。Nue JS 支持服务器端渲染 (SSR)、反应式组件和 “同构” 组合 ("isomorphic" combinations)。 Vue.js、React.js 或 Svelte,…

Day 01 python学习笔记

1、引入 让我们先写第一个python程序(如果是纯小白的话) 因为我们之前安装了python解释器 所以我们直接win r ---->输入cmd(打开运行终端) >python #(在终端中打开python解释器)>>>pri…

CSDN博客可以添加联系方式了

csdn博客一直不允许留一些联系方式,结果是官方有联系方式路径 在首页,往下拉,左侧就有 点击这个即可添加好友了~ 美滋滋,一起交流, 学习技术 ~

详细介绍如何微调 YOLOv8 姿势模型以进行动物姿势估计--附完整源码

动物姿势估计是计算机视觉的一个研究领域,是人工智能的一个子领域,专注于自动检测和分析图像或视频片段中动物的姿势和位置。目标是确定一只或多只动物身体部位的空间排列,例如头部、四肢和尾巴。这项技术具有广泛的应用,从研究动物行为和生物力学到野生动物保护和监测。 …

CS 创世SD NAND FLASH 存储芯片,比TF卡更小巧轻便易用的大容量存储,TF卡替代方案

文章目录 介绍创世SD卡引脚与NOR Flash存储比较 介绍 SD NAND FLASH(Secure Digital NAND Flash)是一种安全数字 NAND 闪存技术,通常用于存储数据,并且具有一些额外的安全特性。这种技术结合了 NAND 闪存的高密度存储能力和安全性…

JavaScript 期约与异步函数的学习笔记

同步与异步的概念 JavaScript 是一门单线程的语言,这意味着它在任何给定的时间只能执行一个任务。 然而,JavaScript 通过异步编程技术来处理并发操作,以避免阻塞主线程的情况。 在上图中,同步行为的进程 A 因为等待进程 B 执行完…

敏捷开发的优势

在现今这个快速变化的时代,企业对于软件开发的需求也在不断变化。为了满足市场需求,开发出高质量、具有竞争力的软件产品,越来越多的企业开始采用敏捷开发方法。 敏捷开发的优势在于其能够灵活响应变化,提升软件项目的成功率。 敏…

中国艺术溟㠭篆刻作品《止语》

孙溟㠭先生篆刻作品《止语》:“一出生先学说话,却用一生来学闭口,知者不言,言者不知,智者语迟,愚着话多,人不贵牙尖嘴硬,而贵在耳聪目明,癸卯秋月寒舍小窗下溟㠭刊。” 孙…

JDK21发布了!面试官:来,谈下jdk21的新特性!

1.前言 JDK21 计划23年9月19日正式发布,尽管一直以来都是“版随意出,换 8 算我输”,但这么多年这么多版本的折腾,若是之前的 LTS 版本JDK17你还觉得不错,那 JDK21还是有必要关注一下,因为会有一批重要更新…

安全帽检测数据集-VOC-5000张

安全帽的作用是防止物体从天而降。安全帽可以缓冲和减震,分散一定的压力,对于保护人的头部来说功效很大。此外,安全帽还可以预防意外事故,保护工人的身体健康。在户外作业时,安全帽还可以防止阳光和雨水对头部的伤害。…

【每日一题】154. 寻找旋转排序数组中的最小值 II

154. 寻找旋转排序数组中的最小值 II - 力扣(LeetCode) 已知一个长度为 n 的数组,预先按照升序排列,经由 1 到 n 次 旋转 后,得到输入数组。例如,原数组 nums [0,1,4,4,5,6,7] 在变化后可能得到&#xff1…

指数渐变线

指数渐变线是非均匀传输线的一种。为何叫指数渐变线呢?其分布参数变化规律为指数规律,比如:单位长度的电感、电容、特性阻抗。 1、分析过程 从非均匀线的微分方程出发: 对方程两侧同时取微分: 化简得: …

Linux内核源码分析 (B.1)深入理解 Linux 虚拟内存管理

Linux内核源码分析 (B.1)深入理解 Linux 虚拟内存管理 文章目录 Linux内核源码分析 (B.1)深入理解 Linux 虚拟内存管理写在本文开始之前....1. 到底什么是虚拟内存地址2. 为什么要使用虚拟地址访问内存3. 进程虚拟内存空间4\. Linux 进程虚拟内存空间4.1 32 位机器上进程虚拟内…

【Java 基础篇】Properties 结合集合类的使用详解

Java 中的 Properties 类是一个常见的用于管理配置信息的工具,它可以被看作是一种键值对的集合。虽然 Properties 通常用于处理配置文件,但它实际上也可以作为通用的 Map 集合来使用。在本文中,我们将详细探讨如何使用 Properties 作为 Map 集…