2023-简单点-机器学习中常用的特殊函数,激活函数[sigmoid tanh ]

news2025/1/12 1:04:21

机器学习中的特殊函数

  • Sigmoid
  • softplus函数
  • tanh
  • ReLu(x)
  • Leaky-Relu
  • ELU
  • SiLu/ Swish
  • Mish
  • 伽玛函数
  • beta函数
  • Ref

Sigmoid

在这里插入图片描述

在这里插入图片描述

值域: 【0,1】
定义域:【负无穷,正无穷】
特殊点记忆: 经过 [0 , 0.5]
关键点[0,0.5]处的导数是 0.025

相关导数:
在这里插入图片描述

softplus函数

在这里插入图片描述

值域: (0,无穷大】
定义域:【负无穷,正无穷】
特殊点记忆: 经过 [0 , 1]
关键点[0,1]处的导数是 0.5,是sigmoid函数在x=0时的值
在这里插入图片描述
其中:

在这里插入图片描述

相关的导数性质:
在这里插入图片描述
关键点[0,1]处的导数是 0.5,是sigmoid函数在x=0时的值

在这里插入图片描述
在这里插入图片描述

tanh

tanh ⁡ ( x ) = e x − e − x e x + e − x \tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}} tanh(x)=ex+exexex

值域: 【-1,1】
定义域:【负无穷,正无穷】
特殊点记忆: 经过 [0 , 0]
关键点[0,0]处的导数是 1
在这里插入图片描述
相关导数:
d d x tanh ⁡ ( x ) = 1 − tanh ⁡ 2 ( x ) \frac{d}{dx}\tanh(x) = 1 - \tanh^2(x) dxdtanh(x)=1tanh2(x)
关键点[0,0]处的导数是 1

ReLu(x)

这个很简单
m a x ( 0 , x ) max(0,x) max(0,x)

在这里插入图片描述

Leaky-Relu

m a x ( α ∗ x , x ) max(\alpha * x, x) max(αx,x)

在这里插入图片描述

α = 0.1 \alpha = 0.1 α=0.1时:
在这里插入图片描述

ELU

在这里插入图片描述
ELU是结合了sigmoid的左侧软饱和性和ReLU的右侧无饱和性而提出的一种新的激活函数。从上面图中不难看到这一特点。右侧线性部分使得ELU可以缓解梯度消失问题,而左侧软饱和性能让ELU对输入变化或噪声更鲁棒。而且ELU的输出均值接近于0,所以没有严重的偏移现象,所以收敛速度更快。但是计算复杂了些
在这里插入图片描述

SiLu/ Swish

SiLU(Sigmoid Linear Unit)函数的 LaTeX 表达式是:

S i L U ( x ) = x ⋅ σ ( x ) SiLU(x) = x \cdot \sigma(x) SiLU(x)=xσ(x)

其中, σ ( x ) \sigma(x) σ(x) 表示 sigmoid 函数,即 σ ( x ) = 1 1 + e − x \sigma(x) = \frac{1}{1+e^{-x}} σ(x)=1+ex1

SiLU 函数的值域是 ( − ∞ , ∞ ) (-\infty, \infty) (,),因为该函数在输入值 x x x 的正负范围内都有输出。

SiLU 函数的导数表达式是:

( S i L U ( x ) ) ′ = σ ( x ) + x ⋅ σ ( x ) ⋅ ( 1 − σ ( x ) ) (SiLU(x))' = \sigma(x) + x \cdot \sigma(x) \cdot (1 - \sigma(x)) (SiLU(x))=σ(x)+xσ(x)(1σ(x))

这里的导数表达式是基于 SiLU 函数的定义和求导法则计算得出的。

需要注意的是,SiLU 函数是一种较为新型的激活函数,与传统的 sigmoid 和 ReLU 函数相比,它在某些任务上可能具有更好的性能表现。

相对于ReLU函数,SiLU函数在接近零时具有更平滑的曲线,并且由于其使用了sigmoid函数,可以使网络的输出范围在0和1之间。这使得SiLU在一些应用中比ReLU表现更好,例如在语音识别中使用SiLU比ReLU可以取得更好的效果。

在这里插入图片描述
导数:
在这里插入图片描述

Mish

Mish激活函数的LaTeX表达式是:

M i s h ( x ) = x ⋅ tanh ⁡ ( ln ⁡ ( 1 + e x ) ) Mish(x) = x \cdot \tanh(\ln(1 + e^x)) Mish(x)=xtanh(ln(1+ex))

Mish激活函数的值域是 ( − ∞ , ∞ ) (-\infty, \infty) (,),与SiLU函数类似,它在输入值 x x x的正负范围内都有输出。

关于Mish激活函数的导数,其LaTeX表达式相对复杂。根据导数的定义和链式法则,我们可以推导出:

( M i s h ( x ) ) ′ = tanh ⁡ ( ln ⁡ ( 1 + e x ) ) + 4 e x ( 1 + e x ) 2 (Mish(x))' = \tanh(\ln(1 + e^x)) + \frac{4e^x}{(1 + e^x)^2} (Mish(x))=tanh(ln(1+ex))+(1+ex)24ex

需要注意的是,Mish激活函数是一种相对较新的激活函数,被提出用于改善神经网络的性能。它具有一些有趣的特性,例如非单调性和自门控性质,这使得它在某些任务上可能具有更好的性能表现。与SiLU相比,Mish在一些实验中被证明能够取得更好的结果。

在这里插入图片描述

导数图:
在这里插入图片描述

引用原始论文,Mish 是“通过系统分析和实验发现并使 Swish 更加有效”。 就目前来说Mish可能是
最好的激活函数,但请原始论文仅在计算机视觉任务上对其进行了测试。

伽玛函数

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

beta函数

在这里插入图片描述

Ref

huaxiaozhuan

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1264847.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

群晖NAS配置之自有服务器frp实现内网穿透

什么是frp frp 是一个专注于内网穿透的高性能的反向代理应用,支持 TCP、UDP、HTTP、HTTPS 等多种协议,且支持 P2P 通信。可以将内网服务以安全、便捷的方式通过具有公网 IP 节点的中转暴露到公网。今天跟大家分享一下frp实现内网穿透 为什么使用 frp &a…

selenium 工具 的基本使用

公司每天要做工作汇报,汇报使用的网页版, 所以又想起 selenium 这个老朋友了。 再次上手,发现很多接口都变了, 怎么说呢, 应该是易用性更强了, 不过还是得重新看看, 我这里是python3。 pip安装…

Blender动画导入Three.js

你是否在把 Blender 动画导入你的 ThreeJS 游戏(或项目)中工作时遇到问题? 您的 .glb (glTF) 文件是否正在加载,但没有显示任何内容? 你的骨骼没有正确克隆吗? 如果是这样,请阅读我如何使用 SkeletonUtils.js 解决此问题 1、前提条件 你正在使用 Blender 3.1+(此版本…

微服务--03--OpenFeign 实现远程调用 (负载均衡组件SpringCloudLoadBalancer)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 OpenFeign其作用就是基于SpringMVC的常见注解,帮我们优雅的实现http请求的发送。 RestTemplate实现了服务的远程调用 OpenFeign快速入门负载均衡组件Spr…

【Linux】Linux第一个小程序 --- 进度条

👦个人主页:Weraphael ✍🏻作者简介:目前正在学习c和Linux还有算法 ✈️专栏:Linux 🐋 希望大家多多支持,咱一起进步!😁 如果文章有啥瑕疵,希望大佬指点一二 …

内置函数【MySQL】

文章目录 MySQL 内置函数日期和时间函数字符串函数数学函数信息函数参考资料 MySQL 内置函数 MySQL 的内置函数主要分为以下几种: 字符串函数:用于对字符串进行操作,如连接、截取、替换、反转、格式化等。数值函数:用于对数值进…

Phpstudy v8.0/8.1小皮升级Apache至最新,同时升级openssl版本httpd-2.4.58 apache 2.4.58

1.apache官网下载最新版本的apache 2.4.58 2.phpstudy下apache停止运行,把原来的Apache文件夹备份一份 复制图中的文件替换apache目录下文件 3.phpstudy中开启apache

西南科技大学(数据结构A)期末自测练习二

一、填空题(每空1分,共10分) 1、在线性表的下列运算中,不改变数据元素之间结构关系的运算是( D ) A、插入 B、删除 C、排序 D、定位 2、顺序表中第一个元素的存储地址是100,每个元素的长度为2,则第5个元素的地址是( B ) A.110 B.108 C.100 …

11.28C++

#include <iostream>using namespace std;int main() {string str;cout << "请输入一个字符串&#xff1a;" << endl;getline(cin,str);int size str.size();int a0,b0,c0,d0,e0;for(int i0; i < size; i){if(str.at(i) > A && str…

直线(蓝桥杯)

直线 题目描述 本题为填空题&#xff0c;只需要算出结果后&#xff0c;在代码中使用输出语句将所填结果输出即可。 在平面直角坐标系中&#xff0c;两点可以确定一条直线。如果有多点在一条直线上&#xff0c; 那么这些点中任意两点确定的直线是同一条。 给定平面上 2 3 个…

神奇植物在哪里?文心大模型助力一秒读懂花草的“前世今生”

本期文心开发者说邀请到飞桨开发者技术专家谢杰航老师&#xff0c;分享如何利用AI技术构建风景园林行业的植物知识科普系统&#xff0c;接着还介绍了大模型应用的基本技术流程框架&#xff0c;多模态特征提取以及使用向量数据库的优势&#xff0c;使用飞桨星河社区运行向量数据…

解决git action发布报错:Input required and not supplied: upload_url

现象&#xff1a; 这个问题死活都找不到原因&#xff0c;后来打了一段调试的代码 - name: Debug Create Release Output run: | echo "Release ID: ${{ env.RELEASE_ID }}" echo "Release Upload URL: ${{ env.RELEASE_UPLOAD_URL }}" env: RELEASE_ID: ${…

css-tricks网站图例

使用css实现钟表 <template><div><p><small>CSS sin() and cos() does <strong>NOT</strong> work in your browser.</small></p><div class"clock"><div id"app" class"clock-face"…

解决:SyntaxError: Non-UTF-8 code starting with À in file but no encoding declared

解决&#xff1a;SyntaxError: Non-UTF-8 code starting with in file but no encoding declared 文章目录 解决&#xff1a;SyntaxError: Non-UTF-8 code starting with in file but no encoding declared背景报错问题报错翻译报错原因解决方法使用utf-8格式使用gbk格式今天…

89基于matlab的人工蜂群和粒子群混合优化的路径规划算法

基于matlab的人工蜂群和粒子群混合优化的路径规划算法&#xff0c;起点和终点确定的前提下&#xff0c;在障碍物中寻找最佳路径。数据可更换自己的&#xff0c;程序已调通&#xff0c;可直接运行。 89人工蜂群和粒子群混合优化 (xiaohongshu.com)https://www.xiaohongshu.com/e…

【数据结构】排序效率最优解之一:二叉树-堆

Hello everybody!今天打算给大家介绍一个功能比较强大的数据结构的基础&#xff0c;它不仅具有很高的应用价值而且排序效率很高。冒泡排序都知道叭&#xff0c;它的时间复杂度为O(n^2)&#xff0c;而堆排序的时间复杂度为O(n*logn)。堆排序直接碾压冒泡排序。在c语言阶段&#…

MySQL- CRUD

一、INSERT 添加 公式 INSERT INTO table_name [(column [, column...])] VALUES (value [, value...]); 示例&#xff1a; CREATE TABLE goods (id INT ,good_name VARCHAR(10),price DOUBLE ); #添加数据 INSERT INTO goods (id,good_name,price ) VALUES (20,华为手机,…

【SpringCloud系列】@FeignClient微服务轻舞者

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

【Rust】所有权的认识

所有权 所有程序都必须管理其运行时使用计算机内存的方式。一些语言中具有垃圾回收机制&#xff0c;在程序运行时有规律地寻找不再使用的内存&#xff1b;在另一些语言中&#xff0c;程序员必须亲自分配和释放内存。 Rust 则选择了第三种方式&#xff1a;通过所有权系统管理内…

L型骨牌覆盖问题。

问题&#xff1a;解决一个2k*2k的特殊棋牌上的L型骨牌覆盖问题。 思路&#xff1a; 棋盘覆盖实现的基本方法为分治法 当k0时(1ⅹ1棋盘)&#xff0c;及特殊方格&#xff0c;骨牌数为0 当k >0时&#xff0c;将2kⅹ2k棋盘分割为4个2k-1ⅹ2k-1子棋盘了 特殊方格位于4个较小…