【机器学习】激活函数:神经网络的灵魂

news2024/9/21 14:30:08

鑫宝Code

🌈个人主页: 鑫宝Code
🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础
💫个人格言: "如无必要,勿增实体"


文章目录

    • 激活函数:神经网络的灵魂
      • 什么是激活函数?
      • 常见激活函数类型
        • 1. Sigmoid函数
        • 2. Tanh函数
        • 3. ReLU函数
        • 4. Leaky ReLU函数
        • 5. ELU函数
        • 6. Swish函数
        • 7. GELU函数
      • 激活函数的选择策略
      • 总结

激活函数:神经网络的灵魂

在神经网络中,激活函数(Activation Function)扮演着至关重要的角色。它赋予了神经网络非线性特性,使其能够拟合复杂的数据模式。选择合适的激活函数对于神经网络的性能和收敛性有着深远的影响。本文将深入探讨激活函数的基本概念、常见类型及其特性,以及激活函数的选择策略,帮助读者更好地理解和应用激活函数。
在这里插入图片描述

什么是激活函数?

在神经网络中,每个神经元会对输入信号进行加权求和,得到一个线性组合。然而,仅仅使用线性组合是无法拟合复杂的非线性函数的。为了赋予神经网络非线性特性,我们需要在线性组合之后引入一个非线性激活函数。

激活函数是一种数学函数,它将神经元的输入信号映射到输出信号。通过引入非线性激活函数,神经网络就能够学习复杂的非线性映射关系,从而拟合各种类型的数据。

数学上,我们可以将激活函数表示为:

y = f ( x ) y = f(x) y=f(x)

其中,x是神经元的输入信号,f是激活函数,y是神经元的输出信号。

不同的激活函数具有不同的数学特性,因此在不同的场景下会有不同的表现。选择合适的激活函数对于神经网络的性能至关重要。

常见激活函数类型

在深度学习的发展历程中,研究人员提出了各种不同的激活函数。以下是一些常见的激活函数类型:
在这里插入图片描述

1. Sigmoid函数

Sigmoid函数是最早被引入神经网络的激活函数之一,它的数学表达式如下:

f ( x ) = 1 1 + e − x f(x) = \frac{1}{1 + e^{-x}} f(x)=1+ex1

Sigmoid函数将输入值映射到(0,1)范围内,具有平滑和可导的特性。然而,它也存在一些缺点,如梯度消失问题和输出不是以0为中心。

2. Tanh函数

Tanh函数是Sigmoid函数的变体,它的数学表达式如下:

f ( x ) = e x − e − x e x + e − x f(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}} f(x)=ex+exexex

Tanh函数将输入值映射到(-1,1)范围内,解决了Sigmoid函数输出不是以0为中心的问题。但它仍然存在梯度消失的风险。

3. ReLU函数

ReLU(Rectified Linear Unit)函数是近年来最流行的激活函数之一,它的数学表达式如下:

f ( x ) = max ⁡ ( 0 , x ) f(x) = \max(0, x) f(x)=max(0,x)

ReLU函数的优点是计算简单高效,并且在正区间具有恒等映射特性,避免了梯度消失问题。然而,它也存在"死亡神经元"的问题,即当输入为负值时,神经元的梯度将永远为0,无法被更新。

4. Leaky ReLU函数

Leaky ReLU函数是ReLU函数的改进版本,它的数学表达式如下:

f ( x ) = { x , if  x ≥ 0 α x , if  x < 0 f(x) = \begin{cases} x, & \text{if } x \geq 0 \\ \alpha x, & \text{if } x < 0 \end{cases} f(x)={x,αx,if x0if x<0

其中, α \alpha α是一个小于1的常数,通常取值为0.01。Leaky ReLU函数在负区间也具有非零梯度,从而缓解了"死亡神经元"的问题。

5. ELU函数

ELU(Exponential Linear Unit)函数是另一种改进的ReLU函数,它的数学表达式如下:

f ( x ) = { x , if  x ≥ 0 α ( e x − 1 ) , if  x < 0 f(x) = \begin{cases} x, & \text{if } x \geq 0 \\ \alpha (e^x - 1), & \text{if } x < 0 \end{cases} f(x)={x,α(ex1),if x0if x<0

其中, α \alpha α是一个常数,通常取值为1。ELU函数在负区间具有更平滑的梯度,有助于加快收敛速度和提高模型性能。

6. Swish函数

Swish函数是谷歌大脑提出的一种新型激活函数,它的数学表达式如下:

f ( x ) = x ⋅ σ ( β x ) f(x) = x \cdot \sigma(\beta x) f(x)=xσ(βx)

其中, σ \sigma σ是Sigmoid函数, β \beta β是一个可学习的参数。Swish函数结合了ReLU函数和Sigmoid函数的优点,在某些任务上表现出色。

7. GELU函数

GELU(Gaussian Error Linear Unit)函数是另一种新型激活函数,它的数学表达式如下:

f ( x ) = x ⋅ Φ ( x ) f(x) = x \cdot \Phi(x) f(x)=xΦ(x)

其中, Φ ( x ) \Phi(x) Φ(x)是标准高斯累积分布函数。GELU函数具有更平滑的梯度,在自然语言处理和计算机视觉等任务中表现不错。

除了上述常见的激活函数,还有一些其他的激活函数,如Softplus函数、Mish函数等。每种激活函数都有其独特的特性和适用场景,选择合适的激活函数对于神经网络的性能至关重要。

激活函数的选择策略

在这里插入图片描述

在实际应用中,如何选择合适的激活函数呢?以下是一些常见的选择策略:

  1. 任务类型:不同的任务类型可能需要不同的激活函数。例如,对于分类任务,通常使用Sigmoid或Softmax函数作为输出层的激活函数;对于回归任务,可以使用线性激活函数或ReLU函数。

  2. 网络结构:激活函数的选择也与网络结构有关。例如,在卷积神经网络中,通常使用ReLU或Leaky ReLU作为隐藏层的激活函数;在循环神经网络中,常用的激活函数是Tanh或GELU。

  3. 数据分布:如果输入数据的分布范围较大或存在异常值,可以考虑使用ReLU或Leaky ReLU等具有稳定性的激活函数。

  4. 实验对比:在实际应用中,可以尝试不同的激活函数,并通过实验对比选择性能最佳的激活函数。

  5. 组合使用:在某些情况下,可以考虑在不同层或不同路径中使用不同的激活函数,以获得更好的性能。

总的来说,选择合适的激活函数需要结合任务特点、网络结构、数据分布等多方面因素进行综合考虑。同时,也可以通过实验对比和组合使用的方式,探索更优秀的激活函数组合。

总结

激活函数是神经网络中不可或缺的组成部分,它们赋予了神经网络非线性特性,并控制了神经元的输出范围。本文介绍了激活函数的基本概念、常见类型及其特性,以及激活函数的选择策略。希望通过这篇文章,读者能够更好地理解和应用激活函数,进一步提高神经网络模型的性能。

如果您有任何疑问或建议,欢迎随时提出。激活函数的探索之路永无止境,让我们一起继续前行,揭开更多激活函数的奥秘!

End

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1948218.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux环境安装KubeSphere容器云平台并实现远程访问Web UI 界面

文章目录 前言1. 部署KubeSphere2. 本地测试访问3. Linux 安装Cpolar4. 配置KubeSphere公网访问地址5. 公网远程访问KubeSphere6. 固定KubeSphere公网地址 前言 本文主要介绍如何在Linux CentOS搭建KubeSphere并结合Cpolar内网穿透工具&#xff0c;实现远程访问&#xff0c;根…

UE4调试UE4Editor-Cmd.exe

在工作中&#xff0c;我们看到这样的构建命令&#xff1a; %EnginePath%\Binaries\Win64\UE4Editor-Cmd.exe %ClientPath%\%ProjectName%.uproject -runHotPatcher {其它参数} 我们应该如何调试UE4Editor-Cmd.exe呢&#xff1f;其实调试 UE4Editor.exe 就可以了&#xff08;参考…

Mac安装Hoomebrew与升级Python版本

参考 mac 安装HomeBrew(100%成功)_mac安装homebrew-CSDN博客 /bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)" 安装了Python 3.x版本&#xff0c;你可以使用以下命令来设置默认的Python版本&#xff1a; # 首先找到新安…

IDEA安装并使用通义灵码

IDEA安装并使用通义灵码 通义灵码介绍安装通义灵码 通义灵码介绍 在数字革命的前沿&#xff0c;阿里云技术团队匠心独运&#xff0c;倾力打造“通义灵码”——一个融合尖端科技的智能编码助手&#xff0c;旨在革新软件工程的未来。 实时代码扩展 通义灵码具备深度理解代码脉络的…

opencascade AIS_Line源码学习

前言 AIS_Line 是 OpenCASCADE 库中的一个类&#xff0c;用于表示和操作三维直线。它可以通过几何线&#xff08;Geom_Line&#xff09;或者两个几何点&#xff08;Geom_Point&#xff09;来初始化。 方法 1 //! 初始化直线 aLine。 Standard_EXPORT AIS_Line(const Handl…

8.0.32 mysql 配置主从数据库

配置前提&#xff1a; 两台服务器都需要安装同一版本的mysql数据库 我的版本是8.0.32 数据库参数修改 主数据库my.cnf(linux)或my.ini(win)配置&#xff1a; 这里需要注意&#xff1a;server-id必须唯一主从两个库必须要不一样 log_binmysql-bin server-id24 gtid-modeON …

yolov8训练自己的实例分割数据集

参考&#xff1a; 1、官方教程&#xff1a;https://docs.ultralytics.com/zh/tasks/segment/ 2、YOLOv8制作自己的实例分割数据集保姆级教程&#xff08;包含json转txt&#xff09; 下载最新yolov8代码 git clone https://github.com/ultralytics/ultralytics.git一、制作自…

vue学习day12-声明式导航续、路由重定向、Vue路由-404、Vue路由-模式设置、编程式导航

34、声明式导航续 &#xff08;4&#xff09;跳转传参 1&#xff09;跳转传参 ①语法&#xff1a; 传递&#xff1a;to“/path?参数名值” 接收&#xff1a;如果在模版里&#xff0c;通过$route.query.参数名获取&#xff0c;如果在js代码里&#xff0c;通过this. $route…

代码随想录算法训练营第六十四天|Floyd 算法、A * 算法、最短路算法总结

97. 小明逛公园 Floyd 算法 Floyd-Warshall算法是一种用于求解图中所有节点对之间最短路径的经典算法。它的时间复杂度为O(n^3)&#xff0c;适用于节点数量不多&#xff08;通常不超过几百个&#xff09;的密集图。该算法不仅能处理带权有向图&#xff0c;还能处理带权无向图。…

模拟建造游戏:城市:天际线2(都市天际线2)中文免安装,解压即撸

《城市&#xff1a;天际线2》&#xff08;Cities: Skylines II&#xff09;是一款模拟经营游戏&#xff0c;由Colossal Order开发&#xff0c;Paradox Interactive发行。 下载地址&#xff1a;https://pan.quark.cn/s/84e69332ec3e 更多游戏&#xff1a;https://kdocs.cn/l/cuH…

vue3引入openlayers

安装ol包 OpenLayers作为 ol npm包提供&#xff0c;它提供了官方支持的API的所有模块。 官方地址&#xff1a;ol npm install ol模块和子模块约定 具有CamelCase名称的OpenLayers模块提供类作为默认导出&#xff0c;并且可能包含其他常量或函数作为命名导出&#xff1a; i…

HarmonyOS Next 省市区级联(三级联动)筛选框

效果图 完整代码 实例对象 export class ProvinceBean {id?: stringpid?: stringisSelect?: booleandeep?: objectextName?: stringchildren?: ProvinceBean[] }级联代码 import { MMKV } from tencent/mmkv/src/main/ets/utils/MMKV import { ProvinceBean } from ..…

MLIR的TOY教程学习笔记

MLIR TOY Language 文章目录 MLIR TOY Language如何编译该项目ch1: MLIR 前端IR解析ch2: 定义方言和算子 (ODS)1. 定义方言2. 定义OP3. OP相关操作4. 定义OP ODS (Operation Definition Specification)1. 基本定义2. 添加文档3. 验证OP4. 新增构造函数5. 定义打印OP的格式 ch3:…

【数据结构】:用Java实现链表

在 ArrayList 任意位置插入或者删除元素时&#xff0c;就需要将后序元素整体往前或者往后搬移&#xff0c;时间复杂度为 O(n)&#xff0c;效率比较低&#xff0c;因此 ArrayList 不适合做任意位置插入和删除比较多的场景。因此&#xff1a;java 集合中又引入了 LinkedList&…

电脑怎么恢复删除的文件?8个方法,简单搞定文件恢复!(强力推荐)

电脑怎么恢复删除的文件&#xff1f;随着如今几乎每个人都拥有或使用计算机&#xff0c;文件丢失和误删已成为我们在日常计算机使用中难以避免的问题之一。在我们使用计算机的过程中&#xff0c;经常会遇到各种问题&#xff0c;有些可以轻松解决&#xff0c;而有些可能需要专业…

键盘是如何使用中断机制的?当打印一串字符到显示屏上时发生了什么???

当在键盘上按下一个键时会进行一下操作&#xff1a; 1.当按下任意一个键时&#xff0c;键盘编码器监控会来判断按下的键是哪个 2.键盘控制器用将解码,将键盘的数据保存到键盘控制器里数据寄存器里面 3.此时发送一个中断请求给中断控制器&#xff0c;中断控制器获取到中断号发送…

Spring Security认证授权介绍

一、目标 真正控制系统权限的&#xff0c;需要引入专门的安全框架才行&#xff0c;所以&#xff0c;我们今天重点来学习Spring家族中的一员Spring Security安全框架。最终呢&#xff0c;我们会使用Spring Security框架来控制养老项目的后台管理系统 能够熟悉常见的权限控制的方…

释疑 803-(1)概述 精炼提纯版

目录 习题 1-01计算机网络可以向用户提供哪些服务? 1-02 试简述分组交换的要点。 1-03 试从多个方面比较电路交换、报文交换和分组交换的主要优缺点。 1-05 互联网基础结构的发展大致分为哪几个阶段?请指出这几个阶段最主要的特点。 1-06 简述互联网标准制定的几个阶段…

导航网站WP主题/WP黑格导航主题BlackCandy-简约酷黑色高逼格+焕然一新的UI设计

源码简介&#xff1a; 导航网站WP主题-WP黑格导航主题BlackCandy&#xff0c;它有着简约酷黑色高逼格&#xff0c;而且有焕然一新的UI设计。它是一个简约漂亮的 WordPress 自媒体主题。黑格网址导航主题&#xff0c;自适应电脑端和手机端。 BlackCandy-V2.0这次全新升级了&am…

Godot游戏制作 03世界构建1.0版

在game场景&#xff0c;删除StaticBody2D节点&#xff0c;添加TileMap节点 添加TileSet图块集 添加TileSet源 拖动图片到图块&#xff0c;自动创建图块 使用橡皮擦擦除。取消橡皮擦后按住Shift创建大型图块。 进入选择模式&#xff0c;TileMap选择绘制&#xff0c;选中图块后在…