【深度学习笔记】浅层神经网络

news2025/4/13 9:05:04

本专栏是网易云课堂人工智能课程《神经网络与深度学习》的学习笔记，视频由网易云课堂与 deeplearning.ai 联合出品，主讲人是吴恩达 Andrew Ng 教授。感兴趣的网友可以观看网易云课堂的视频进行深入学习，视频的链接如下：

https://mooc.study.163.com/course/2001281002

也欢迎对神经网络与深度学习感兴趣的网友一起交流 ~

目录

1 神经网络的结构

2 激活函数

3 随机初始化

1 神经网络的结构

你可以把很多 sigmoid 单元堆叠起来，构建一个神经网络。神经网络的每个节点对应两个计算步骤：前一层输出的线性组合（z 值），以及非线性激活（a 值）。

对于包含 2 层 sigmoid 单元的神经网络，用 $x$ 表示输入特征，第一层参数 $W^{[1]}, \, b^{[1]}$ ，第二层参数 $W^{[2]}, \, b^{[2]}$ ，有

$z^{[1]} = W^{[1]} \, x + b^{[1]}$

$a^{[1]} = \sigma(z^{[1]})$

$z^{[2]} = W^{[2]} \, x + b^{[2]}$

$a^{[2]} = \sigma(z^{[2]})$

神经网络可以分成输入层（Input Layer）、隐藏层（Hidden Layer）和输出层（Output Layer）。上图中的神经网络被称为双层神经网络（2 Layer Neural Network），输入层不被计算，原因是输入层不包含参数和非线性激活过程。

在使用监督学习的神经网络中，训练集包含了输入 x 和输出 y，隐藏层的含义是，在训练集中，你无法看到中间节点的数值。

2 激活函数

当构建神经网络时，你可以选择隐藏层用哪一个激活函数，以及输出单元用什么激活函数。

tanh 函数是 sigmoid 函数的平移版本。通常情况下，tanh 函数比 sigmoid 函数更好。但是这两个函数有一个·缺点：当 z 很大或很小时，函数的梯度值接近 0，这个问题被称为”梯度消失问题”。

另外两个常用的激活函数是 ReLU 函数和带泄露的 ReLU 函数。

3 随机初始化

当训练神经网络时，初始化权重的选取非常重要。对于 Logistic 回归，你可以将初始权重设为 0。但是对于神经网络，在初始值全 0 的情况下，神经网络中的隐藏单元都在进行完全相同的计算，这时隐藏单元的数量将失去意义。

问题的解决方案是随机初始化权重 $W$ ，通常的做法是使用 random 函数随机生成数值，为了避免初始权值太大导致梯度下降法变慢，可以乘上一个小的系数，比如 0.01，不过偏置值 $b$ 是可以初始化为 0 的。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/716460.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

GoLand live template自定义模板失效问题解决

GoLand live template自定义模板失效问题解决

目录问题背景原因分析问题解决问题背景我希望在goland自定义一个注解模板，输入/**Enter可以补全如下图所示 /** * description TODO * param null * return * author user * date 2023/7/4 15:24*/ func main() {print("hello world\n") }于是我在Fi…

阅读更多...

Vue指令案例

Vue指令案例

案例需求： 将Vue数据模型中的数据以表格的形式渲染展示具体代码如下： <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-wid…

阅读更多...

1、CCeisum简介

1、CCeisum简介

CCesium是c版本的cesium桌面端程序，底层基于opengl实现的c框架，本质上依赖于opengl的api进行渲染。与web端cesium基本一致，只需简单的几行代码即可实现桌面端的三维地图，通过api接口实现三维地图的基本功能，初始化地图…

阅读更多...

看流动的电流，Livewire电路仿真动态演示！

看流动的电流，Livewire电路仿真动态演示！

Livewire是一个模拟电子实验室，它使用动画和声音来演示电子电路的原理。开关，晶体管，二极管，集成电路和其他数百个组件都可以连接在一起，以研究隐藏的概念，例如电压，电流和电荷。可以设计的电路…

阅读更多...

使用myCobot 280 Jeston Nano进行物体精确识别追踪

使用myCobot 280 Jeston Nano进行物体精确识别追踪

前言我们在YouTube上看到有人使用机械臂实现物体跟踪功能的视频时，深受启发，对这个项目产生了浓厚的兴趣，并决定独立开发一个类似的程序。我们的目标是开发一个能够准确识别和跟踪物体的机械臂系统，以便在实际应用中发挥作用&a…

阅读更多...

SpringBoot 整合Redis 实战篇

SpringBoot 整合Redis 实战篇

一、解决数据乱码问题🍉 在上篇文章中我们整合了redis，当我们存入一个对象时会发现redis中的数据存在乱码问题，这是jdk编码的问题 springboot整合redis时提供了两个模板工具类，StringRedisTemplate和RedisTemplate. 1.使用Red…

阅读更多...

Vue指令--v-if、v-show、v-for

Vue指令--v-if、v-show、v-for

目录 v-if和v-show指令的展示如下： v-for指令的展示如下： v-if和v-show指令的展示如下： v-if指令具有两个配套的指令v-else-if和v-else进行条件判断来决定是否渲染展示某元素具体代码展示如下：（代码中的注释值得一…

阅读更多...

音视频入门知识学习

音视频入门知识学习

音视频入门知识学习视频相关视频压缩空间冗余时间冗余视觉冗余信息熵冗余知识冗余 I帧 P帧 B帧压缩思路I帧P帧B帧 H.264VCLNALNAL（片（宏块）） 音频概念采样和采样频率采样位数声道码率声音与音频数字音频相关特点时域冗余频域冗余…

阅读更多...

Redis高可用——哨兵模式

Redis高可用——哨兵模式

Redis——哨兵模式一、Redis 哨兵模式1.哨兵模式的作用2.故障转移机制3.主节点的选举二、搭建Redis 哨兵模式1.修改 Redis 哨兵模式的配置文件（所有节点操作）2.启动哨兵模式3.查看哨兵信息4.故障模拟5.验证结果一、Redis 哨兵模式主从切换技术的方法…

阅读更多...

【网络原理之一】应用层协议、传输层协议UDP和TCP，TCP的三次握手和四次挥手以及TCP的可靠和效率机制

【网络原理之一】应用层协议、传输层协议UDP和TCP，TCP的三次握手和四次挥手以及TCP的可靠和效率机制

应用层协议XML协议JSONHTTP 传输层协议UDP协议UDP的特点UDP协议格式 TCP协议TCP的特点TCP协议格式TCP的安全和效率机制确认应答(可靠机制)超时重传(可靠机制)连接管理(可靠机制)三次握手(连接过程)四次挥手(断开的过程)状态的转化滑动窗口(效率机制)流量控制(可靠机制)拥塞控制…

阅读更多...

遥感云大数据在灾害、水体与湿地领域典型案例及GPT模型

遥感云大数据在灾害、水体与湿地领域典型案例及GPT模型

详情点击链接：遥感云大数据在灾害、水体与湿地领域典型案例实践及GPT模型第一：基础一：平台及基础开发平台 GEE平台及典型应用案例； GEE开发环境及常用数据资源； ChatGPT、文心一言等GPT模型 JavaScript基础&am…

阅读更多...

企业如何认识数字化及数字化战略

企业如何认识数字化及数字化战略

随着信息和通信技术的发展，数字技术在各个领域广泛应用并深入影响生活、工作和社会的时代。在这个时代里，数字技术不仅改变了我们与世界互动的方式，还催生了全新的商业模式、服务和机会。数字化时代的关键特征包括： 数字技术的…

阅读更多...

Flutter开发微信小程序实战：构建一个简单的天气预报小程序

Flutter开发微信小程序实战：构建一个简单的天气预报小程序

微信小程序是一种快速、高效的开发方式，Flutter则是一款强大的跨平台开发框架。结合二者，可以轻松地开发出功能丰富、用户体验良好的微信小程序。这里将介绍如何使用Flutter开发一个简单的天气预报小程序，并提供相应的代码示例。 1. 准备工…

阅读更多...

2023年最新Java八股文面试题，面试应该是够用了（吊打面试官）

2023年最新Java八股文面试题，面试应该是够用了（吊打面试官）

前言大家先看一下互联网大厂各职级薪资对应表（技术线），看看你想到哪个级别去！ 每个技术人都有个大厂梦，我觉得这很正常，并不是饭后的谈资而是每个技术人的追求。像阿里、腾讯、美团、字节跳动、京东等等的技…

阅读更多...

小型企业如何进行高效的文档数据管理？

小型企业如何进行高效的文档数据管理？

关键词：知识文档管理系统、群晖NAS、数据安全我国小型企业数量占全国总数的98%以上，但企业在文档数据管理方面存在诸多问题。比如：文档管理混乱、文档共享不便利、传统的FTP传输文件文档安全难以保障等。但由于市面上的文档管理产品价格高昂…

阅读更多...

思科Cisco C9200交换机端口调配

思科Cisco C9200交换机端口调配

前言最近DNAC和交换机等网络设备之间的同步出现问题，在思科的BUG库里找到了相关信息，DNAC2.2.3.6版本的BUG，导致交换机端口的调配无法成功部署推送。但是因为业务的需求，需要对交换机进行端口调配。其和华为/华三的逻辑一致&…

阅读更多...

让你不再好奇音频转换格式软件免费有哪些

让你不再好奇音频转换格式软件免费有哪些

小美：你好，最近我需要将一些音频文件转换成其他格式，但是不知道常用的音频转换工具有哪些，你有什么建议吗？ 李明：当然，有很多音频转换工具可以选择。建议你关注下这篇文章，我将通过…

阅读更多...

Bluez HCI Commands

Bluez HCI Commands

在 lib/Hci.h 头文件中定义了很的我 HCI Commands，这些命令是分组的，每个组下面又提供了具体的命令，如： 其中 OGF 为 OpCode Group Flag，表明命令级别 OCF 为 OpCode Command Flag，表明要执行的命令 Hci…

阅读更多...

泰迪智能科技基于产业技能生态链学生学徒制的双创工作室--促进学生高质量就业

泰迪智能科技基于产业技能生态链学生学徒制的双创工作室--促进学生高质量就业

据悉，6月28日，广东省人力资源和社会保障厅在广东岭南现代技师学院举行广东省“产教评”技能生态链建设对接活动。该活动以“新培养、新就业、新动能”为主题，总结推广“产教评”技能人才培养新模式，推行“岗位培养”学徒就业新形式…

阅读更多...

【无标题】用Javascript编写魔方程序(详解）2023-7-4

【无标题】用Javascript编写魔方程序(详解）2023-7-4

第一步，先初始化魔方，如上图，可以很直观的看到魔方的6个面。直接贴代码 <!doctype html> <html><head><meta charset"utf-8"><meta name"viewport" content"widthdevice-width, initia…

阅读更多...

推荐文章

最新文章