人工智能-深度学习计算:层和块

news2025/1/12 12:17:47

我们关注的是具有单一输出的线性模型。 在这里,整个模型只有一个输出。

注意,单个神经网络 (1)接受一些输入; (2)生成相应的标量输出; (3)具有一组相关 参数(parameters),更新这些参数可以优化某目标函数。

然后,当考虑具有多个输出的网络时, 我们利用矢量化算法来描述整层神经元。 像单个神经元一样,层(1)接受一组输入, (2)生成相应的输出, (3)由一组可调整参数描述。 当我们使用softmax回归时,一个单层本身就是模型。 然而,即使我们随后引入了多层感知机,我们仍然可以认为该模型保留了上面所说的基本架构。

对于多层感知机而言,整个模型及其组成层都是这种架构。 整个模型接受原始输入(特征),生成输出(预测), 并包含一些参数(所有组成层的参数集合)。 同样,每个单独的层接收输入(由前一层提供), 生成输出(到下一层的输入),并且具有一组可调参数, 这些参数根据从下一层反向传播的信号进行更新。

事实证明,研究讨论“比单个层大”但“比整个模型小”的组件更有价值。 例如,在计算机视觉中广泛流行的ResNet-152架构就有数百层, 这些层是由层组(groups of layers)的重复模式组成。 这个ResNet架构赢得了2015年ImageNet和COCO计算机视觉比赛 的识别和检测任务 (He et al., 2016)。 目前ResNet架构仍然是许多视觉任务的首选架构。 在其他的领域,如自然语言处理和语音, 层组以各种重复模式排列的类似架构现在也是普遍存在。

为了实现这些复杂的网络,我们引入了神经网络的概念。 (block)可以描述单个层、由多个层组成的组件或整个模型本身。 使用块进行抽象的一个好处是可以将一些块组合成更大的组件, 这一过程通常是递归的。 通过定义代码来按需生成任意复杂度的块, 我们可以通过简洁的代码实现复杂的神经网络。

 下面的代码生成一个网络,其中包含一个具有256个单元和ReLU激活函数的全连接隐藏层, 然后是一个具有10个隐藏单元且不带激活函数的全连接输出层。

import torch
from torch import nn
from torch.nn import functional as F

net = nn.Sequential(nn.Linear(20, 256), nn.ReLU(), nn.Linear(256, 10))

X = torch.rand(2, 20)
net(X)
tensor([[ 0.0343,  0.0264,  0.2505, -0.0243,  0.0945,  0.0012, -0.0141,  0.0666,
         -0.0547, -0.0667],
        [ 0.0772, -0.0274,  0.2638, -0.0191,  0.0394, -0.0324,  0.0102,  0.0707,
         -0.1481, -0.1031]], grad_fn=<AddmmBackward0>)

在这个例子中,我们通过实例化nn.Sequential来构建我们的模型, 层的执行顺序是作为参数传递的。 简而言之,nn.Sequential定义了一种特殊的Module, 即在PyTorch中表示一个块的类, 它维护了一个由Module组成的有序列表。 注意,两个全连接层都是Linear类的实例, Linear类本身就是Module的子类。 另外,到目前为止,我们一直在通过net(X)调用我们的模型来获得模型的输出。 这实际上是net.__call__(X)的简写。 这个前向传播函数非常简单: 它将列表中的每个块连接在一起,将每个块的输出作为下一个块的输入。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1167131.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

BUUCTF RSA4

BUUCTF RSA4 下载题目&#xff0c;可见文件给出了3组n和c N 331310324212000030020214312244232222400142410423413104441140203003243002104333214202031202212403400220031202142322434104143104244241214204444443323000244130122022422310201104411044030113302323014101…

基于仿真的飞机ICD工具测试

机载电子系统是飞机完成飞行任务的核心保障之一。从1949年新中国建立至今70余年的发展过程中&#xff0c;随着我国在航空航天领域的投资逐年增多&#xff0c;机载电子系统大致经历了四个发展过程阶段&#xff0c;按照出现的先后顺序进行排序&#xff0c;分别为&#xff1a; 1、…

MyBatis实现多表映射、分页显示、逆向工程

目录 一、MyBatis实现多表映射 1.1 实体类设计 1.2 一对一关系实现案例 1.3 对多配置实现案例 1.4 设置自动映射与n张表关联映射 二、MyBatis实现分页功能 2.1 mybatis插件工作原理 2.2 引入插件与插件的使用 三、逆向工程插件 3.1 什么是逆向工程 3.2 MyBat…

vue3路由配置

npm下载安装路由 npm install vue-router4 --save新建router目录 新建routes路由表可以分离&#xff0c;也可以写在路由文件下的index.js 想用方式引入&#xff0c;需要新建vite.config.ts文件配置

【Redis】使用Java操作Redis

&#x1f389;&#x1f389;欢迎来到我的CSDN主页&#xff01;&#x1f389;&#x1f389; &#x1f3c5;我是Java方文山&#xff0c;一个在CSDN分享笔记的博主。&#x1f4da;&#x1f4da; &#x1f31f;推荐给大家我的专栏《Redis》。&#x1f3af;&#x1f3af; &#x1f4…

文本内容转换成语音播放的工具:Speech Mac

Speech Mac版是一款适用于Mac电脑的语音合成工具。它将macOS语音合成器的所有功能整合到一个易于使用的界面中。通过Speech Mac版&#xff0c;用户可以选择40多种声音和语言&#xff0c;方便地将文本转换为语音。用户可以将文本拖放或粘贴到Speech中&#xff0c;并随时更改语音…

JPA编程使用注解@LastModifiedDate,自动更新修改时间字段

一、背景 jpa编程中&#xff0c;我们一般会设计以下五个字段&#xff1a; 在新增记录的时候&#xff0c;无需对创建时间和修改时间进行赋值。 此外&#xff0c;你还得在类上&#xff0c;增加注解EntityListeners(AuditingEntityListener.class)。 EntityListeners(Auditing…

用中文编程工具给澳大利亚客户定制开发的英文版服装进销存软件应用实例

用中文编程工具给澳大利亚客户定制开发的英文版服装进销存软件应用实例 软件从2016年一直用到现在&#xff0c;而且开的分店也是安装的这个软件&#xff0c;上图是定制打印的格式。 该编程工具不但可以连接硬件&#xff0c;而且可以开发大型的软件。 编程系统化课程总目录及明…

Linux下的IMX6ULL——构建bootloader、内核、文件系统(四)

前言&#xff1a; Linux 平台上有许多开源的嵌入式linux系统构建框架(框架的意思就是工 具)&#xff0c;这些框架极大的方便了开发者进行嵌入式系统的定制化构建&#xff0c;目前比较常 见的有OpenWrt, Buildroot, Yocto,等等。其中Buildroot功能强大&#xff0c;使用 简单&…

CY3-N3的荧光特性Cyanine3 azide星戈瑞

CY3-N3是一种荧光染料&#xff0c;其荧光特性通常取决于其分子结构和环境条件。CY3-N3的激发波长通常位于500到550纳米之间。这表示当暴露在具有适当激发光的条件下时&#xff0c;CY3-N3会吸收光并进入激发态。 CY3-N3的发射波长通常位于550到650纳米之间。这意味着在激发后&a…

Mac连接linux的办法(自带终端和iterm2)

1. 使用Mac自带终端Terminal 1.1 点击右上角的聚焦搜索&#xff0c;再输入终端 1.2 查找linux系统的ip地址 在虚拟机里输入如下命令&#xff0c;找到蓝色区域的就是ip地址 ip addr 如果没有显示ip地址&#xff0c;可以重新安装一下虚拟机&#xff0c;之后确保以太网的连接是打…

竹胶板木板片:多功能建筑模板的理想选择

竹胶板木板片作为一种多功能的建筑模板材料&#xff0c;在各类建筑项目中扮演着重要的角色。其防水、耐磨的特性使其成为庭院、阳台等室外空间制模的理想选择。本文将重点介绍竹胶板木板片的特点以及其在建筑模板领域的应用。 竹胶板木板片由优质的竹材制成&#xff0c;经过胶合…

Java中Deque栈对象的增删查(所有方法详解)

1、Deque栈的增删查方法总结 2、方法增删查 栈顶添加&#xff1a;push、offFirst栈尾添加&#xff1a;add、offer、offerLast栈顶删除&#xff1a;remove、pop、poll、pollFirst栈尾删除&#xff1a;pollLast栈顶查看&#xff1a;peek、peekFirst栈尾查看&#xff1a;peekLast…

Miniconda 使用进阶,把它添加到右键菜单中

因为最近有写 python 的需求&#xff0c;且我是用 Miniconda 来管理本地 python 环境的&#xff0c;所以就涉及到需要频繁的进入到环境的命令行中&#xff0c;每次都需要通过官方提供的快捷方式&#xff0c;然后还要一路设置环境和路径&#xff0c;好烦呀。因为之前添加过 Wind…

OceanMind海睿思加入江苏省勘察设计行业协会,数字化能力受勘察设计行业认可

近日&#xff0c;中新赛克海睿思 通过江苏省勘察设计行业协会八届五次常务理事会议审议批准&#xff0c;正式成为江苏省勘察设计行业协会会员单位。 江苏省勘察设计行业协会 江苏省勘察设计行业协会成立于1986年4月&#xff0c;是我国勘察设计行业成立协会较早的省份之一&…

HarmonyOS 数据管理与应用数据持久化(二)

通过键值型数据库实现数据持久化 场景介绍 键值型数据库存储键值对形式的数据&#xff0c;当需要存储的数据没有复杂的关系模型&#xff0c;比如存储商品名称及对应价格、员工工号及今日是否已出勤等&#xff0c;由于数据复杂度低&#xff0c;更容易兼容不同数据库版本和设备…

FreeRTOS_软件定时器

目录 1. 软件定时器简介 2. 定时器服务/Daemon 任务 2.1 定时器服务任务与队列 2.2 定时器相关配置 2.2.1 configUSE_TIMERS 2.2.2 configTIMER_TASK_PRIORITY 2.2.3 configTIMER_QUEUE_LENGTH 2.2.4 configTIMER_TASK_STACK_DEPTH 2.3 单次定时器和周期定时器 2.4 复…

在公共安全场景下,智能监控如何做到保障安全的同时又最大化地提供便利?

智能监控系统应用的场景十分广泛&#xff0c;其中&#xff0c;公共安全场所的需求尤为重要&#xff0c;为保障公共区域的安全&#xff0c;提升人民群众的归属感&#xff0c;增强公共场所的安全性&#xff0c;智慧安防EasyCVR智能视频监控系统做出了极大努力。具体细节如下&…

33 mysql find_in_set 的实现

前言 这里我们主要是来探讨一下 mysql 中 in 的使用, find_in_set 的使用 这两者 在我们实际应用中应该也是 非常常用的了 测试数据表如下 CREATE TABLE tz_test (id int(11) unsigned NOT NULL AUTO_INCREMENT,field1 varchar(16) DEFAULT NULL,field2 varchar(16) DEFAU…

MobPush智能推送:数智化运营加速用户转化

随着移动应用市场竞争日益激烈&#xff0c;如何保持APP用户活跃度实现商业价值成为无数APP运营者的烦恼。是继续加大力度拉新促活&#xff0c;用庞大的用户体量获得平台商业价值&#xff1f;还是加强对存量用户的精细化运营&#xff0c;激发存量用户付费转化实现弯道超车&#…