深度学习:激活函数曲线总结

news2025/4/21 20:22:01

深度学习:激活函数曲线总结

在深度学习中有很多时候需要利用激活函数进行非线性处理,在搭建网路的时候也是非常重要的,为了更好的理解不同的激活函数的区别和差异,在这里做一个简单的总结,在pytorch中常用的激活函数的数学表达形式,同时为了更直观的感受,给出不同激活函数的曲线形式,方便查询。

import torch
import torch.nn as nn
x = torch.linspace(-4, 4, 400) # 在-4和4之间画400个点。

1. nn.leakyReLU()

给负值一个斜率,不全为零。

  • 数学公式:
    LeakyReLU ( x ) = { x ,  if  x ≥ 0 negative_slope × x ,  otherwise  \text{LeakyReLU}(x) = \begin{cases} x, & \text{ if } x \geq 0 \\ \text{negative\_slope} \times x, & \text{ otherwise } \end{cases} LeakyReLU(x)={x,negative_slope×x, if x0 otherwise 
leakyrelu = nn.LeakyReLU(negative_slope=0.01)

negative_slope 是一个小于1的值,通常设置为0.01,用于控制在输入小于0时的输出斜率。这意味着在nn.LeakyReLU中,负数输入会乘以negative_slope,而正数输入保持不变。

  • 对应曲线:

leakyrelu

2. nn.Relu()

ReLU是一个常用的激活函数,它将负数值设为0,保持正数值不变。

  • 数学公式:
    ReLU ( x ) = ( x ) + = max ⁡ ( 0 , x ) \text{ReLU}(x) = (x)^+ = \max(0, x) ReLU(x)=(x)+=max(0,x)
relu = nn.ReLU()
  • 函数曲线:
    Relu

3. nn.Tanh()

Tanh函数将输入映射到-1和1之间

  • 数学公式
    Tanh ( x ) = tanh ⁡ ( x ) = exp ⁡ ( x ) − exp ⁡ ( − x ) exp ⁡ ( x ) + exp ⁡ ( − x ) \text{Tanh}(x) = \tanh(x) = \frac{\exp(x) - \exp(-x)} {\exp(x) + \exp(-x)} Tanh(x)=tanh(x)=exp(x)+exp(x)exp(x)exp(x)
Tanh = nn.Tanh()
  • 函数曲线
    Tanh

4. nn.PReLU()

PReLU是具有可学习参数的激活函数,用于克服ReLU的一些问题

  • 数学公式
    RReLU ( x ) = { x if  x ≥ 0 a x  otherwise  \text{RReLU}(x) = \begin{cases} x & \text{if } x \geq 0 \\ ax & \text{ otherwise } \end{cases} RReLU(x)={xaxif x0 otherwise 
PReLU = nn.PReLU(num_parameters=1)
  • 函数曲线

PRelu

5. nn.ELU()

所有点上都是连续的和可微的,训练快

  • 数学公式:
    ELU ( x ) = { x ,  if  x > 0 α ∗ ( exp ⁡ ( x ) − 1 ) ,  if  x ≤ 0 \text{ELU}(x) = \begin{cases} x, & \text{ if } x > 0\\ \alpha * (\exp(x) - 1), & \text{ if } x \leq 0 \end{cases} ELU(x)={x,α(exp(x)1), if x>0 if x0
ELU = nn.ELU()
  • 函数曲线
    ELU

6. nn.SELU()

  • 数学公式:
    SELU ( x ) = scale ∗ ( max ⁡ ( 0 , x ) + min ⁡ ( 0 , α ∗ ( exp ⁡ ( x ) − 1 ) ) ) \text{SELU}(x) = \text{scale} * (\max(0,x) + \min(0, \alpha * (\exp(x) - 1))) SELU(x)=scale(max(0,x)+min(0,α(exp(x)1)))
SELU = nn.SELU()
  • 函数曲线:
    SELU

7. nn.GELU()

  • 数学公式:
    GELU ( x ) = x ∗ Φ ( x ) \text{GELU}(x) = x * \Phi(x) GELU(x)=xΦ(x)
GELU = nn.GELU()
  • 函数曲线:
    GELU

8. nn.Mish()

  • 数学公式:
    Mish ( x ) = x ∗ Tanh ( Softplus ( x ) ) \text{Mish}(x) = x * \text{Tanh}(\text{Softplus}(x)) Mish(x)=xTanh(Softplus(x))
Mish = nn.Mish()
  • 函数曲线:
    Mish

9 . nn.Softmax()

  • 数学公式:
    Softmax ( x i ) = exp ⁡ ( x i ) ∑ j exp ⁡ ( x j ) \text{Softmax}(x_{i}) = \frac{\exp(x_i)}{\sum_j \exp(x_j)} Softmax(xi)=jexp(xj)exp(xi)
Softmax = nn.Softmax()
y = Softmax(x)
  • 函数曲线:
    softmax

总结

感觉还是看曲线的形状,把大体的形状记住更直观些。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1136850.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何使用爬虫做一个网站

​ 大家如果有兴趣做网站,在买了VPS,部署了wordpress,配置LNMP环境,折腾一番却发现内容提供是一个大问题,往往会在建站的大(da)道(keng)上泄气 ,别怕&#xf…

找免费商用字体,就上这5个网站,再也不怕侵权了。

很多新手设计师没有版权意识,网上找了字体直接使用结果被发律师函,造成巨大损失,建议大家使用前先去查询一下这款字体是否能商用,另外就是去找一些可以免费商用的字体使用。如何才能找到免费商用字体呢? 下面我就把我…

迅镭激光万瓦切割设备中标全球轨交装备龙头中国中车

轨道交通装备被称之为国之重器,历经60多年的发展,我国轨交装备制造业已成为自主创新程度最高、国际创新竞争力最强、产业带动效应最明显的行业之一。 而承担我国现代化轨道交通装备研发制造的中国中车股份有限公司(以下称“中国中车”),也在用…

微前端qiankun接入Vue和React项目

主应用:Vue3Webpack 1、创建主应用: npx vue create main-vue3-app 2、安装qiankun npx yarn add qiankun 3、项目中使用的vue、vue-router、qiankun依赖如下,webpack版本为5.x 4、在根目录下创建vue.config.js const { defineConfig }…

一张逻辑图讲清楚OS在做什么:浅谈OS

本文旨在通过思维导图的方式、对os主要的知识点简短介绍,让读者能短时间快速把os是什么、干什么给串起来。当别人问起来时,可以用3-5分钟讲清楚。如果读者对os有更加深入的兴趣,可点对点针对某一内容再做进一步研究。通常对于互联网从业者来说…

TSINGSEE青犀老旧小区升级改造AI+视频监控方案

一、背景与需求 近年来,政府高度重视城镇老旧小区改造工作,强调要加快老旧小区改造,不断完善城市管理和服务,彻底改变粗放型管理方式,让人民群众在城市生活得更方便、更舒心、更美好。老旧小区升级改造面临以下问题&a…

绿米Aqara S1【妙控开关 S1E】的破解方法

概述 为了更好地向友商学习,我们采购了绿米的一块妙控开关 S1E的屏幕,用来研究。 首先上图看一下他的设计及推广的说明: 产品详情,参见Aqara的官方网站: 具体链接:妙控开关 S1E|Aqara 全屋智能 硬件概要 这里我就直接上硬件的说明了。 官方的设备参数如下: 我来写…

SRS srs-bench

1 srs-bench 音视频压测工具,包括RTMP/FLV/WebRTC/GB28181等,未来还会完善。 SB(SRS Bench) is a set of benchmark and regression test tools, for SRS and other media servers, supports HTTP-FLV, RTMP, HLS, WebRTC and GB28181. For RTMP/HLS/F…

7.MySQL复合查询

个人主页:Lei宝啊 愿所有美好如期而遇 目录 复合查询 基本查询回顾 多表查询 自连接 子查询 单行子查询 多行子查询 多列子查询 在from子句中使用子查询 合并查询 union union all 实战OJ 复合查询 前面我们讲解的mysql表的查询都是对一张表进行查询…

图像恢复介绍(持续更新)

前言 噪声的产生是信号在采集、传输以及记录过程中,受到成像设备自身因素和外界环境的影响而产生的。现实中的噪声是随机分布的,事实上,噪声无法完全去除,只能使得重现信号尽可能的接近原始信号,因此,去噪严…

JavaSpringbootmysql农产品销售管理系统47627-计算机毕业设计项目选题推荐(附源码)

摘 要 随着互联网趋势的到来,各行各业都在考虑利用互联网将自己推广出去,最好方式就是建立自己的互联网系统,并对其进行维护和管理。在现实运用中,应用软件的工作规则和开发步骤,采用Java技术建设农产品销售管理系统。…

Matplotlib | 高阶绘图案例【4】- 2023年编程语言榜单Python稳坐第一

文章目录 🏳️‍🌈 1. 导入模块🏳️‍🌈 2. 数据处理2.1 高效数据2.2 保留需要的列 🏳️‍🌈 3. 绘图3.1 绘制图布,添加3个子图3.2 绘制子图1条形图3.3 子图1条形图添加数据标签3.4 绘制子图2条…

toluaframework中C#怎么调用Lua的方法以及无GC方法

toluaframework中C#怎么调用Lua的方法 问题Util.CallMethodLuaManager.CallFunctionLuaFunction.LazyCall 解决方案LuaFunction脚本无GC消耗的调用 用法总结 问题 用过luaframework框架的人应该都知道框架提供了Util的工具类,工具类提供了一个方法就是Util.CallMet…

口袋参谋:30秒导出淘宝同行的全部数据,是如何做到的?

作为一名淘宝天猫的商家,想要了解产品当下的市场行情数据。 则可以通过,【同类目数据导出】功能: 一键获取相同类目下,所有店铺市场推广数据。 ​【同类目数据导出】功能使用 1、安装插件 2、登录千牛后台→数据→生意参谋→市…

C# 海康威视平台API接入 和网页摄像头部署

文章目录 前言相关网址综合安防管理平台网址获取Appkey和Secret/密码和密钥测试个人魔改工具类 海康视频接入获取摄像头Id下载海康Web插件原生Html导入网页设置 JS封装封装代码使用设置成功! 前言 最近有个需求是将海康的摄像头视频画面传到我们平台上,…

C++简单的栈模型示例

前言 最近在学习C,由于该语言是手动管理内存,所以要对内存池、栈、数组等相关模型要多多了解,下面是一个简单的栈模型。 // dome.cpp : 此文件包含 "main" 函数。程序执行将在此处开始并结束。 // #define _CRT_SECURE_NO_WARNIN…

【踩坑记】js用a.push(...b)进行数组组合报栈溢出

建议&#xff1a;进行数组合并时&#xff0c;若不确定数组最终长度或者数组长度超过下述表中数据&#xff0c;建议使用 concat 最近踩了个坑&#xff0c;在进行数组合并时出现了栈溢出的报错。 示例代码&#xff1a; const arr [] for (let i 0; i < 500000; i) {arr.pu…

iOS自动混淆测试处理笔记

1 打开 ipa&#xff0c;导出ipa 路径和配置文件路径会自动填充 2 点击 开始自动混淆测试处理 自动混淆测试是针对 oc 类和oc方法这两个模块进行自动混淆ipa&#xff0c;并ipa安装到设备中运行&#xff0c;通过检测运行ipa包是否崩溃&#xff0c;来对oc类和oc方法进行筛选。如果…

COSCon'23 真·黑客马拉松准备出发!

众多开源爱好者翘首期盼的开源盛会&#xff1a;第八届中国开源年会&#xff08;COSCon23&#xff09;将于 10月28-29日在四川成都市高新区菁蓉汇举办。本次大会的主题是&#xff1a;“开源&#xff1a;川流不息、山海相映”&#xff01;各位新老朋友们&#xff0c;欢迎到成都&a…

【java学习—九】模板方法(TemplateMethod)设计模式(4)

文章目录 1. 在java中什么是模板2. 模板方法设计解决了什么问题&#xff1f;3. 代码化理解 1. 在java中什么是模板 抽象类体现的就是一种模板模式的设计&#xff0c;抽象类作为多个子类的通用模板&#xff0c;子类在抽象类的基础上进行扩展、改造&#xff0c;但子类总体上会保留…