深度学习入门(四):激活函数与LSTM

news2024/9/29 3:32:21

激活函数

激活函数在神经网络中扮演着至关重要的角色。它们的主要功能是引入非线性因素,这使得神经网络能够学习和近似任何非线性函数,从而处理复杂的数据模式和决策边界。如果没有激活函数,即使网络拥有很多层,其表达能力仍然只限于线性函数,这大大限制了神经网络处理各种数据的能力。

激活函数的作用

  1. 引入非线性:激活函数使得神经网络可以处理非线性问题。在没有激活函数(或者说使用线性激活函数)的情况下,无论网络有多少层,输出仍是输入的线性组合。
  2. 帮助反向传播:在神经网络的训练过程中,激活函数的导数用于在反向传播算法中计算权重更新。如果没有可微的激活函数,这个优化过程将无法进行。

常见激活函数

  • Sigmoid:将输入压缩至0和1之间。它非常适合用作输出层在二分类问题中,表示概率或是是否。但它有明显的缺点,包括梯度消失问题和输出非零中心化问题。
  • ReLU (Rectified Linear Unit):提供了一个简单的非线性变换。如果输入为正则输出该值,否则输出0。ReLU 由于计算效率高且在正区间内梯度恒定,使其在实践中非常流行。然而,它也有缺点,比如“死亡ReLU”问题,即一些神经元可能永远不会激活,因为它们的输出总是0。
  • Tanh (Hyperbolic Tangent):输出范围从-1到1,比sigmoid函数的形状更平滑,也是零中心的,这使得数据在模型的每一层中保持稳定。然而,它也会遇到梯度消失的问题。

激活对于非线性模型的函数生成

激活函数是生成非线性模型函数的关键组成部分。通过堆叠包含非线性激活函数的层,神经网络能够构建复杂的函数映射,这些映射可以捕获输入数据中的高度非线性关系。这使得神经网络可以在各种任务中,如图像识别、语音处理或任何其他需要非线性决策边界的领域,表现出色。


LSTM与激活函数

LSTM(长短期记忆网络)的工作机制包含了内部的激活函数,这些激活函数在门控机制中起到了关键作用,而全连接层(Dense layer)通常需要额外的激活函数来引入非线性,使得网络可以学习更复杂的函数。

LSTM层的激活函数

LSTM单元的设计包括三个主要的门控机制:遗忘门、输入门和输出门。每个门控机制的计算都涉及到激活函数:

  1. 遗忘门(Forget Gate):决定了哪些信息应该被遗忘或保留。这通常通过一个sigmoid函数实现,sigmoid函数输出一个0到1之间的数值,表示保留信息的比例

  2. 输入门(Input Gate):确定新输入数据中的哪些信息是值得保留的。它同样使用sigmoid函数来决定保留哪些信息,以及一个tanh函数来创建一个候选值向量,这个向量会被加入到细胞状态

  3. 输出门(Output Gate):决定下一个隐藏状态应该包含哪些信息。这个门控同样依赖于sigmoid函数来决定输出哪些信息,以及一个tanh函数来处理细胞状态,使其能够影响输出。

Dense层的激活函数

与LSTM层不同,Dense层或全连接层通常只是执行线性变换(即 Wx+bWx + bWx+b 形式的变换),并不自带如LSTM中那样的复杂结构和门控机制。因此,为了引入必要的非线性并使网络能够学习更复杂的模式,我们需要在Dense层后添加激活函数。

为什么需要这些激活函数?

  • 在LSTM中:激活函数是内置在门控机制中的,它们帮助模型决定信息的流动(保留或忘记哪些信息),这对于捕捉时间序列数据中的长期依赖至关重要。
  • 在Dense层中:激活函数使得层可以进行非线性变换,增强了网络的表示能力,使其可以适用于各种复杂的任务,如分类、回归等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1992009.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

青岛国真携手图扑软件共建青岛西海岸区一网统管平台

为深入贯彻关于垃圾分类的重要指示精神,积极响应住房和城乡建设部开展的全国城市生活垃圾分类宣传周活动,5 月 25 - 27 日,以“发挥行业协会新动能 助力垃圾分类新时尚”为主题的“ 2023 垃圾分类高峰论坛”在青岛西海岸成功举办。 青岛国真智…

使用影子凭证进行域权限维持

本文来源无问社区,更对实战内容,渗透思路可前往查看http://wwlib.cn/index.php/artread/artid/15293.html Microsoft 推出了 Windows Hello 企业版 (WHfB),以使用基于密钥的信任模型替换传统的基于密码的身份验证。此…

【Material-UI】按钮组:尺寸与颜色详解

文章目录 一、按钮组概述1. 组件介绍2. 基本用法 二、按钮组的尺寸(Sizes)1. 小尺寸(Small)2. 中等尺寸(Medium)3. 大尺寸(Large) 三、按钮组的颜色(Colors)1…

gitea docker 快捷安装部署

前言 在前一篇博文(什么是 Gitea?)中,我们详细介绍了gitea的功能特性,以及其与其它git服务器之间的特性多维度对比。 在本文中,我们将详细介绍gitea的快捷安装部署,docker方式! 1…

qt客户端与服务端通信

服务器要一处于监听状态 客户端主动连接服务器 服务器的ui界面 客户端的ui界面 很简陋 服务端listen 按钮的槽函数 QHostAddress::Any,port 监听任何端口 void MainWindow::on_listen_clicked() {if(ui->lineEdit->text().isEmpty()){return ;}int port ui->li…

【第九节】python中xml解析和json编解码

目录 一、Python XML 解析 1.1 什么是XML 1.2 Python 对 XML 的解析方法 1.3 SAX解析xml 1.4 xml.dom解析xml 1.6 ElementTree解析XML 二、Python编解码json 2.1 什么是json 2.2 使用json 库 2.3 使用第三方库Demjson 一、Python XML 解析 1.1 什么是XML XML&#x…

Python新手错误集锦(PyCharm)

# 自学Python,用Pycharm作环境。我这个手新到这时我学习的第一个编程软件,且本人专业是化学,以前对电脑最高级的使用是玩扫雷游戏。所以这里集合的错误都是小透明错误,大部分人请绕道。不断更新中...... 缩进错误 记住“indent”…

Jmeter之BeanShell使用(全网最详细的介绍)-第九天

一.什么是BeanShell Java写成的⼩型、免费的Java源代码解释器可以执⾏标准Java语句和表达式,完全符合java语法的java脚本语⾔(需要会javase语⾔)包括⼀些脚本命令,有⾃⼰的⼀些语法和⽅法,是⼀种松散类型的脚本语⾔(这…

静电消除器的产品功能介绍

省维护:超高等级 冲击波可引起空间隔断,从而将外部空气的进入降至最低。与以往的针尖保护构造相比,通过形成绝对的空气屏障,实现了低流量且惊人的省维护性能。 大范围消除静电 配备了 Hi-Power I.C.C. 系统,除了可根据…

普通话水平测试证书真的有用吗?

对于部分考生而言报名普通话水平测试只是随大流,看周围同学都考了,自己也来报名。还有一些呢是看到博主总结哪些证好考有用,先拿下再说但是并不知道具体有什么用。那么,普通话水平测试证书,究竟能为我们带来什么呢&…

MyBatis Generator 代码生成器数据库表新增字段,不覆盖原文件

1.数据库窜库&#xff0c;配置了覆盖插件他会找其他库中同名的表 修改数据库链接 添加 &amp;nullCatalogMeansCurrenttrue <!-- 配置数据源&#xff0c;需要根据自己的项目修改 --><jdbcConnection driverClass"com.mysql.cj.jdbc.Driver"connect…

钡铼技术防水分线盒M12双通道4路DIN智能建筑自动化

钡铼技术的DB系列4路M12双通道预铸线缆分线盒是专为智能建筑自动化和工业自动化设备设计的先进解决方案。其工业级设计和耐酸碱腐蚀材料壳体&#xff0c;使其能够在恶劣环境下稳定运行&#xff0c;并且具备IP67和IP69K防护等级&#xff0c;保证了在高压高温水流清洗条件下的可靠…

python学习自制彩色,自定义格式日志打印制作LLoghelper

python学习自制彩色&#xff0c;自定义格式日志打印LLoghelper python print(xxx) 打印出来只显示白色黑底&#xff0c;没有时间&#xff0c;路径&#xff0c;不同的控制台颜色&#xff0c;对一个没有错误崩溃的python项目来说这样调试起一些逻辑非常不方便 目标&#xff1a; …

下载mmcv或者mmcv-full第三方库失败(已解决)

一、问题描述 首先跑yolov8改进的时候要下载mmcv-full&#xff0c;直接在环境里pip install一直失败&#xff0c;或者下载了之后运行代码说不存在程序啥的&#xff0c;也是没下对的意思。 mmcv或者说mmcv-full第三方库下载的版本是有要求的&#xff0c;要和自己的pytorch版本对…

解决maven java.rmi.ConnectException: Connection refused to host: 127.0.0.1 错误

highlight: gruvbox-dark theme: cyanosis 你好&#xff0c;我是 shengjk1&#xff0c;多年大厂经验&#xff0c;努力构建 通俗易懂的、好玩的编程语言教程。 欢迎关注&#xff01;你会有如下收益&#xff1a; 了解大厂经验拥有和大厂相匹配的技术等 希望看什么&#xff0c;…

2.2 Python变量与数据类型

欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;欢迎订阅相关专栏&#xff1a; 工&#x1f497;重&#x1f497;hao&#x1f497;&#xff1a;野老杂谈 ⭐️ 全网最全IT互联网公司面试宝典&#xff1a;收集整理全网各大IT互联网公司技术、项目、HR面试真题.…

好用到哭的翻译工具,百度翻译领衔,2024新宠来袭!

在全球化的浪潮中&#xff0c;语言障碍已经越来越不是问题了&#xff0c;翻译工具就像是我们的文化差异跨越助手。今天&#xff0c;我们就来聊聊几款翻译界的佼佼者&#xff0c;它们各有千秋&#xff0c;让我们的多语言之旅变得更加轻松。百度翻译算是其中的佼佼者&#xff0c;…

【机器学习】BP神经网络正向计算

&#x1f308;个人主页: 鑫宝Code &#x1f525;热门专栏: 闲话杂谈&#xff5c; 炫酷HTML | JavaScript基础 ​&#x1f4ab;个人格言: "如无必要&#xff0c;勿增实体" 文章目录 BP神经网络正向计算1. 引言2. BP神经网络结构回顾3. 正向计算的基本原理4. 数学…

微信小程序通过code换取手机号

一、调用小程序验证组件&#xff0c;这两个组件都是可以文档地址。 二、首先还是得先拿到code &#xff08;1&#xff09;、必须在手机端去执行&#xff0c;开发者工具获取不到code。解决办法&#xff1a;将拿到的code在页面上渲染出来在复制一下就好了。 &#xff08;2&#…

文件上传漏洞(一,漏洞简介及简单利用)

本文仅作为学习参考使用&#xff0c;本文作者对任何使用本文进行渗透攻击破坏不负任何责任。 一&#xff0c;文件上传漏洞简介。 1&#xff0c;什么是文件上传漏洞。 文件上传漏洞&#xff0c;是指web应用允许用户上传诸如&#xff1a;木马&#xff0c;病毒&#xff0c;执行…