日撸java三百行day74

news2025/1/10 20:25:24

文章目录

  • 说明
  • 通用BP神经网络之激活函数
    • 1. 激活函数
    • 2. 激活函数分类
      • 1.1 反正切函数(ArcTan)
      • 1.2 指数线性函数(ELU)
      • 1.3 恒等函数
      • 1.4 泄漏线性整流函数(LEAKY_RELU)
      • 1.5 softsign
      • 1.6 softplus
      • 1.7 Relu函数
      • 1.8 sigmoid函数
      • 1.9 双曲正切函数(tanh)
      • 1.10 Binary step函数
      • 1.11 ISRU函数
      • 1.12 Swish函数

说明

闵老师的文章链接: 日撸 Java 三百行(总述)_minfanphd的博客-CSDN博客
自己也把手敲的代码放在了github上维护:https://github.com/fulisha-ok/sampledata

通用BP神经网络之激活函数

1. 激活函数

激活函数就是在人工神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端(百度百科的解释)即可以理解为在神经网络的每个层中,激活函数对输入信号进行处理,并生成输出信号
在这里插入图片描述
上面这张图应该不陌生,我在上一篇文章中也用到过。
激活函数大多数都是非线性函数(通过下面的图像也可以感受到),通过使用非线性激活函数,神经网络可以引入非线性特性,从而使得网络能够学习和表示更加复杂的函数关系(但这句话就我目前来说我不能很深刻的理解)

2. 激活函数分类

随着学习会慢慢增加

1.1 反正切函数(ArcTan)

  • 公式
    f ( x ) = t a n − 1 ( x ) f(x) = tan^{-1}(x) f(x)=tan1(x)
    f ′ ( x ) = 1 1 + x 2 f'(x)=\frac{1}{1+x^2} f(x)=1+x21
  • 图像
    在这里插入图片描述

1.2 指数线性函数(ELU)

f ( x ) = { α ( e x − 1 ) , x < 0 x , x ≥ 0 f(x) = \begin{cases} \alpha(e^{x}-1), & x<0 \\ x,&x\geq 0 \\ \end{cases} f(x)={α(ex1),x,x<0x0
f ′ ( x ) = { α e x , x < 0 1 , x ≥ 0 f'(x) = \begin{cases} \alpha e^{x}, & x<0 \\ 1,&x\geq 0 \\ \end{cases} f(x)={αex,1,x<0x0

  • 图像
    在这里插入图片描述

1.3 恒等函数

  • 公式
    f ( x ) = x f(x)=x f(x)=x
    f ′ ( x ) = 1 f'(x)=1 f(x)=1
  • 图像
    在这里插入图片描述

1.4 泄漏线性整流函数(LEAKY_RELU)

f ( x ) = { λ x , x < 0 x , x ≥ 0 f(x) = \begin{cases} \lambda x, & x<0 \\ x,&x\geq 0 \\ \end{cases} f(x)={λx,x,x<0x0
f ′ ( x ) = { λ , x < 0 1 , x ≥ 0 f'(x) = \begin{cases} \lambda, & x<0 \\ 1,&x\geq 0 \\ \end{cases} f(x)={λ,1,x<0x0

  • 图像
    在这里插入图片描述

1.5 softsign

  • 公式
    f ( x ) = 1 1 + ∣ x ∣ f(x) = \frac{1}{1 + |x|} f(x)=1+x1
    f ′ ( x ) = { 1 ( 1 + x ) 2 , x ≥ 0 1 ( 1 − x ) 2 , x < 0 f'(x) = \begin{cases} \frac{1}{(1 + x)^2},&x\geq 0 \\ \frac{1}{(1 - x)^2}, & x<0 \\ \end{cases} f(x)={(1+x)21,(1x)21,x0x<0
  • 图像
    在这里插入图片描述

1.6 softplus

  • 公式
    f ( x ) = log ⁡ ( 1 + e x ) f(x)=\log(1+e^{x}) f(x)=log(1+ex)
    f ′ ( x ) = 1 1 + e − x f'(x)=\frac{1}{1+e^{-x}} f(x)=1+ex1
  • 图像
    在这里插入图片描述

1.7 Relu函数

  • 公式
    f ( x ) = m a x ( 0 , x ) f(x) = max(0, x) f(x)=max(0,x)
    f ′ ( x ) = { 1 , x ≥ 0 0 , x < 0 f'(x) = \begin{cases} 1,&x\geq 0 \\ 0, & x<0 \\ \end{cases} f(x)={1,0,x0x<0

  • 图像
    在这里插入图片描述

1.8 sigmoid函数

  • 公式
    f ( x ) = 1 1 + e − x f(x) = \frac{1}{1+e^{-x}} f(x)=1+ex1
    f ′ ( x ) = e − x ( 1 + e − x ) 2 = f ( x ) ( 1 − f ( x ) ) f'(x) = \frac{e^{-x}}{(1+e^{-x})^2}=f(x)(1-f(x)) f(x)=(1+ex)2ex=f(x)(1f(x))
  • 图像
    在这里插入图片描述

1.9 双曲正切函数(tanh)

  • 公式
    f ( x ) = e x − e − x e x + e − x f(x) = \frac{e^x-e^{-x}}{e^x + e^{-x}} f(x)=ex+exexex
    f ′ ( x ) = 1 − f ( x ) 2 f'(x) = 1-f(x)^2 f(x)=1f(x)2
  • 图像
    在这里插入图片描述

1.10 Binary step函数

  • 公式
    f ( x ) = { 1 , x ≥ 0 0 , x < 0 f(x) = \begin{cases} 1,&x\geq 0 \\ 0, & x<0 \\ \end{cases} f(x)={1,0,x0x<0

  • 图像
    在这里插入图片描述

1.11 ISRU函数

  • 公式
    f ( x ) = x 1 + α x 2 f(x) = \frac{x}{\sqrt{1 + \alpha x^2}} f(x)=1+αx2 x
    f ′ ( x ) = ( 1 1 + α x 2 ) 3 f'(x) =(\frac{1}{\sqrt{1 + \alpha x^2}})^3 f(x)=(1+αx2 1)3
  • 图像
    在这里插入图片描述

1.12 Swish函数

f ( x ) = x 1 + e − k x = x ∗ S i g m o i d ( k x ) f(x) = \frac{x}{1+e^{-kx}} = x*Sigmoid(kx) f(x)=1+ekxx=xSigmoid(kx)

f ′ ( x ) = k f ( x ) + S i g m o i d ( k x ) ( 1 − k f ( x ) ) f'(x) = kf(x) + Sigmoid(kx)(1-kf(x)) f(x)=kf(x)+Sigmoid(kx)(1kf(x))

  • 图像
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/746765.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一拖三充电线(单USB-C转三充)的解决方案--HUSB251

HUSB251是一款PD DRP双向快充协议芯片&#xff0c;符合USB PD3.1协议&#xff0c;支持PPS、28V EPR FPDO和EPR AVS&#xff0c;并可提供灵活的可编程PDO。当其在Source模式下时&#xff0c;DPDM PHY支持可编程的专有协议&#xff0c;支持BC1.2和5V2.4A、QC2.0/3.0、AFC、FCP和S…

免费系统维护清理工具:Onyx for Mac图文安装教程

OnyX 是一款适用于 macOS 的免费系统维护和优化工具。它由法国开发者 Jol Barrire&#xff08;也称为 Titanium&#xff09;创建&#xff0c;旨在帮助 macOS 用户管理和优化其计算机系统。 OnyX 提供了许多功能和工具&#xff0c;可以帮助用户执行各种系统维护任务。它是一个非…

【雕爷学编程】Arduino动手做(117)---P10V706LED屏模组2

37款传感器与执行器的提法&#xff0c;在网络上广泛流传&#xff0c;其实Arduino能够兼容的传感器模块肯定是不止这37种的。鉴于本人手头积累了一些传感器和执行器模块&#xff0c;依照实践出真知&#xff08;一定要动手做&#xff09;的理念&#xff0c;以学习和交流为目的&am…

logstash的四个插件

grok 正则捕获插件 内置正则表达式调用 在logstash conf.d文件夹下面创建filter conf文件&#xff0c;内容如下 ​编辑 logstash 官方也给了一些常用的常量来表达那些正则表达式&#xff0c;可以到这个 Github 地址查看有哪些常用的常量&#xff1a; 自定义表达式调用 muta…

【深度学习】梳理一下概念和术语

1 说明 您是深度学习的新手,正在寻找全面的指南来帮助您了解基础知识及其他方面吗?不要再看了!在本文中,我们将深入研究 20 个基本的深度学习概念,从基础知识开始,逐渐转向更高级的主题。从人工神经网络(ANN)到梯度下降和激活函数(Sigmoid,ReLU,SoftMax),我们将探…

Pytorch 安装与配置

Pytorch 安装与配置 NVIDIA系统管理界面查看 nvidia-smi 进入NVIDIA系统管理界面 对应的详细解释看下图 参考博文 (53条消息) nvidia-smi命令详解和一些高阶技巧介绍_Chaos_Wang_的博客-CSDN博客 CUDA 查看 CUDA 有两类&#xff1a;其中一类是驱动API(Driver API)&#xff…

「深度学习之优化算法」(十二)水波算法

1. 水波算法简介 (以下描述,均不是学术用语,仅供大家快乐的阅读)   水波算法(Water wave optimization)是根据水波理论提出的优化算法。什么是水波理论?简单来说就是水波的宽度越小,其频率越高,频率与水波宽度的平方根成反比(具体细节我也不懂,物理方面的)。水波…

换零钱II:Python代码解Java题目

银行现存零钱面值种类动态变化但数量无限&#xff0c;类方法change()完成指定金额的最少零钱个数兑换。 (本笔记适合学透python基本数据结构&#xff0c;熟悉class的基构造&#xff0c;对类内全局变量有一定认的 coder 翻阅) 【学习的细节是欢悦的历程】 Python 官网&#xff1…

Mysql——》慢查询日志

推荐链接&#xff1a; 总结——》【Java】 总结——》【Mysql】 总结——》【Redis】 总结——》【Kafka】 总结——》【Spring】 总结——》【SpringBoot】 总结——》【MyBatis、MyBatis-Plus】 总结——》【Linux】 总结——》【MongoD…

TCR中的缓存和共享属性与PTE中的缓存和共享属性的区别是啥?

那么就请继续思考&#xff1a; Translation Table Walk访问页表的缓存策略&#xff0c;这里的页表到底是缓存到cache中&#xff0c;还是缓存到PTW中呢&#xff1f;

使用腾讯云轻量应用服务器搭建网站教程

腾讯云轻量应用服务器怎么搭建网站&#xff1f;太简单了&#xff0c;轻量服务器选择宝塔Linux镜像&#xff0c;然后在宝塔面板上添加站点&#xff0c;以WordPress建站为例&#xff0c;腾讯云服务器网来详细说下腾讯云轻量应用服务器搭建网站全流程&#xff0c;包括轻量服务器配…

【Elasticsearch】ES精确查询和范围查询,ES时间字段排序实例,ES倒排索引介绍

本文ES版本是7.X以上&#xff0c;之前的版本语法可能会有些差异&#xff0c;请注意这些比较重要的细节。问海量数据搜索时为什么ES会比较快&#xff1f; 精确查询 termQuery BoolQueryBuilder boolQuery QueryBuilders.boolQuery();boolQuery.must(QueryBuilders.termQuery(…

ORB-SLAM2学习笔记2之TUM开源数据运行ORB-SLAM2生成轨迹并用evo工具评估轨迹

文章目录 0 引言1 evo工具1.1 简介1.2 常用命令1.3 安装 2 TUM数据3 单目ORB-SLAM23.1 运行ORB-SLAM23.2 evo评估轨迹3.2.1 载入和对比轨迹3.2.2 计算绝对位姿误差 4 RGB-D ORB-SLAM24.1 运行ORB-SLAM24.2 evo评估轨迹4.2.1 载入和对比轨迹4.2.2 计算绝对轨迹误差 ORB-SLAM2学习…

软件工程——第12章面向对象实现知识点整理

本专栏是博主个人笔记&#xff0c;主要目的是利用碎片化的时间来记忆软工知识点&#xff0c;特此声明&#xff01; 文章目录 1. 面向对象语言技术的特点&#xff1f; 2.选择面向对象程序设计语言时主要应该考虑哪些因素&#xff1f; 3.面向对象设计结果只能用面向对象语言实…

第三方ipad电容笔哪个品牌好用?平板电容笔推荐

可能很多人都认为&#xff0c;苹果原装的电容笔&#xff0c;是不可取代&#xff0c;但我认为&#xff0c;这还要看个人的预算&#xff0c;以及实际的需求。苹果Pencil对于那些不太讲究画质的用户来说实在是太贵了&#xff0c;要是我们仅用于书写上&#xff0c;其实我们可以用平…

尚硅谷Docker实战教程-笔记13【高级篇,Docker轻量级可视化工具Portainer】

尚硅谷大数据技术-教程-学习路线-笔记汇总表【课程资料下载】视频地址&#xff1a;尚硅谷Docker实战教程&#xff08;docker教程天花板&#xff09;_哔哩哔哩_bilibili 尚硅谷Docker实战教程-笔记01【基础篇&#xff0c;Docker理念简介、官网介绍、平台入门图解、平台架构图解】…

Python 自学 day01 变量,变量命名规则,一些语法

1. Python 的变量的知识 1.1 Python 编程命令的读取时从上到下的。 1.2 Python 变量的命名规则&#xff1a; 1.2.1变量名只能包含字母、数字和下划线。变量名能以字母或下划线打头&#xff0c;但不能以数字打 头。例如&#xff0c;可将变量命名为message…

BATJ 面试 Java 岗:精选 1200+ 面试题及答案

Z 认为&#xff0c;对于 Java 面试以及进阶的最佳学习方法莫过于刷题博客书籍总结&#xff0c;前三者 LZ 将淋漓尽致地挥毫于这篇文章中&#xff0c;至于总结在于个人&#xff0c;实际上越到后面你会发现面试并不难&#xff0c;其次就是在刷题的过程中有没有去思考&#xff0c;…

网络安全(黑客技术)自学路线笔记

一、什么是黑客&#xff1f; 黑客泛指IT技术主攻渗透窃取攻击技术的电脑高手&#xff0c;现阶段黑客所需要掌握的远远不止这些。 二、为什么要学习黑客技术&#xff1f; 其实&#xff0c;网络信息空间安全已经成为海陆空之外的第四大战场&#xff0c;除了国与国之间的博弈&am…

stm32 mpu6050 cubemx 卡尔曼滤波法读取角度

文章目录 前言一、cubemx配置二、mpu6050文件移植mpu6050.cmpu6050.h 三、主函数 前言 本文简述使用mpu6050读取原始数据后解算出角度。 网上大多都是dmp库来解算&#xff0c;但是这种情况操作起来相对复杂。 更方便的方法是使用卡尔曼滤波法来解算出角度&#xff0c;好处是代…