深度学习——基础知识

深度学习——基础知识

news2026/3/31 5:37:40

深度学习的重点在于优化，其中很重要的步骤在于如何调参，会涉及到一些微积分等数学知识。不同于以往接触到的数值运算，深度（机器）学习都是关于张量Tensor（向量）的计算，Python中最常用的包就是Numpy，其次张量类支持调用包可自动微分。

一、基础操作运算

1.1 导入torch

先导入torch，虽然是pytorch版本的深度学习，但是代码中使用torch，而不是pytorch.
在这里插入图片描述

1.2 arange创建行向量

在这里插入图片描述

1.3 通过张量的shape属性来访问张量的形状或维度

在这里插入图片描述

1.4 张量的大小

张量中元素的总数，即shape属性中所有元素的乘积。
在这里插入图片描述

一维向量的shape和size是相同的数值

1.5 改变张量的形状reshape

要想改变一个张量的形状而不改变元素数量和元素值，可以调用reshape函数。
在这里插入图片描述

在reshape时，不需要特别指定每个维度的参数，在知道元素总数的前提下，知道宽度（高度）后，高度（宽度）会被自动计算得出，不需要自己手动计算，可以通过-1来调用此自动计算出形状。

在这里插入图片描述

1.6 初始化矩阵

1.6.1 将张量中所有元素设置为0

在这里插入图片描述

1.6.2 将张量中所有元素设置为1

在这里插入图片描述

1.6.3 标准高斯分布：均值为0，标准差为1，随机初始化参数的值

在这里插入图片描述

1.6.4 自定义张量

可以通过包含数值的python列表（嵌套列表）来为所需张量中的每个元素赋予确定值。
在这里插入图片描述

二、张量运算符

2.1 按元素计算

在这里插入图片描述

2.2 张量连接

在这里插入图片描述

dim=0对行进行拼接;dim=1对列进行拼接。

2.3 逻辑运算符

在这里插入图片描述

2.3 求和

在这里插入图片描述

三、广播机制

形状相同的张量按元素操作，在某些情况下，即使形状不同，可以通过调用广播机制来执行按元素操作。
广播机制在大多数情况下，沿着数组中长度为1的轴进行广播。
在这里插入图片描述
a和b分别是31和12的矩阵，如果让它们相加，它们的形状不匹配，我们将两个矩阵广播为一个更大的3*2矩阵，矩阵a将复制列，矩阵b将复制行，然后按元素相加。
$\begin{bmatrix} 0 & 0 \\ 1 & 1 \\ 2 &2 \end{bmatrix}+\begin{bmatrix} 0 & 1 \\ 0 & 1 \\ 0 & 1 \end{bmatrix} = \begin{bmatrix} 0 & 1 \\ 1 & 2 \\ 2 & 3 \end{bmatrix}$
在这里插入图片描述

四、转换为其他Python对象

torch张量和numpy数组可以互相转化.
在这里插入图片描述
要将大小为1的张量转换为python标量，可以用item函数或者python的内置函数。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2129927.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【oj刷题】滑动窗口篇：滑动窗口的应用场景和注意事项

【oj刷题】滑动窗口篇：滑动窗口的应用场景和注意事项

前言： 滑动窗口其实基本原理还是双指针，但在双指针中左右指针可能会有回退操作，而滑动窗口的左右指针只会向前走，不会回退，下面就来讲解一下滑动窗口的概念和具体操作（主要是例题讲解） 目录一、…

阅读更多...

【 Linux】基础命令及常用小技巧

【 Linux】基础命令及常用小技巧

文章目录 Linux基础命令常用小技巧基本命令pwd : print work directory 打印当前的工作目录cd : change driectory 改变当前工作目录ls: list 查看指定目录下的文件mkdir: make directory 创建目录文件操作命令查找命令管道命令和过滤命令wc : word count 单词统计echo 输出命…

阅读更多...

Hotohiko Sakamoto算法，以及用其计算星期几【算法 15】

Hotohiko Sakamoto算法，以及用其计算星期几【算法 15】

探索Hotohiko Sakamoto算法：构建素数排列的奥秘在算法领域，Hotohiko Sakamoto算法以其独特的构造方式和深刻的数学背景，吸引了众多算法爱好者和研究者的关注。本文将带您一起探索Hotohiko Sakamoto算法的核心思想，了解它是如何构…

阅读更多...

深度学习_GPT2Block详解（casual attention）

深度学习_GPT2Block详解（casual attention）

一、GTP2Block 整体结构 1.1 block准备 import torch from torch import nn from transformers import GPT2Model, GPT2Config from transformers.models.gpt2.modeling_gpt2 import GPT2Blockcfg GPT2Config() print(cfg.add_cross_attention) blk GPT2Block(cfg, layer_…

阅读更多...

“汉语新解” Prompt新高度，火爆的李继刚

“汉语新解” Prompt新高度，火爆的李继刚

“汉语新解” prompt 是由李继刚设计的一个用于启发人工智能模型进行创意性文本生成的指令模板。这个 prompt 的设计初衷是为了让AI能够以一种独特的方式解析和重新诠释常见的中文词汇，从而产生出具有深刻洞察力和幽默感的文本内容，仿佛是由鲁迅或林语堂…

阅读更多...

Linux线程同步：深度解析条件变量接口

Linux线程同步：深度解析条件变量接口

🍑个人主页：Jupiter. 🚀 所属专栏：Linux从入门到进阶欢迎大家点赞收藏评论😊 目录 🍑Linux线程同步🐉条件变量---实现线程同步💧同步概念与竞态条件🐆条件变量接口*初始…

阅读更多...

sqli-labs靶场自动化利用工具——第13关

sqli-labs靶场自动化利用工具——第13关

文章目录概要整体架构流程技术细节执行效果小结概要 Sqli-Labs靶场对于网安专业的学生或正在学习网安的朋友来说并不陌生，或者说已经很熟悉。那有没有朋友想过自己开发一个测试脚本能实现自动化化测试sqli-labs呢？可能有些人会说不是有sqlmap&#…

阅读更多...

每日OJ_牛客_马戏团（模拟最长上升子序列）

每日OJ_牛客_马戏团（模拟最长上升子序列）

目录牛客_马戏团（模拟最长上升子序列） 解析代码牛客_马戏团（模拟最长上升子序列） 马戏团__牛客网搜狐员工小王最近利用假期在外地旅游，在某个小镇碰到一个马戏团表演，精彩的表演结束后发现团长正和大…

阅读更多...

《基于深度半监督学习的目标检测综述》泛读

《基于深度半监督学习的目标检测综述》泛读

基于深度半监督学习的目标检测方法分为 1、生成式方法 2、一致性正则化方法 3、基于图的方法 4、伪标记方法和混合方法然后基于常用数据集对典型方法进行了性能对比，最后分析了其挑战和发展趋势，旨在为相关研究提供参考收获就是： 1…

阅读更多...

Redis -- 全记录(面试)

Redis -- 全记录(面试)

目录 All : 缓存穿透缓存击穿互斥锁逻辑过期比较 : 缓存雪崩 redis怎么和数据库保持一致双写一致性 : 延迟双删 : 保证强一致性 : 允许一定的延迟基于mq的异步通知基于Canal的异步通知总结 Redis的持久化 RDB AOF 总结 Redis数据过期策略惰性删除…

阅读更多...

【算法专题】搜索算法

【算法专题】搜索算法

二叉树剪枝 LCR 047. 二叉树剪枝 - 力扣（LeetCode） 本题要求我们将全部为0的二叉树去掉，也就是剪枝，当我们举一个具体的例子进行模拟时，会发现，只关注于对其中一个子树的根节点进行剪枝，由于我…

阅读更多...

Docker部署MySQL8.0.39报错解决方案

Docker部署MySQL8.0.39报错解决方案

Docker部署MySQL8.0.39报错解决方案 2024-09-11T06:09:09.317582Z 0 [Warning] [MY-010139] [Server] Changed limits: max_open_files: 1024 (requested 8161) 2024-09-11T06:09:09.317586Z 0 [Warning] [MY-010142] [Server] Changed limits: table_open_cache: 431 (reques…

阅读更多...

李彦宏内部讲话曝光，谈大模型三大认知误区：智能体还是非共识

李彦宏内部讲话曝光，谈大模型三大认知误区：智能体还是非共识

“外界对大模型有相当多的误解，”近日据媒体报道，李彦宏的一则内部讲话曝光。在最近一次和员工交流中，李彦宏谈及三个大模型认知误区，涵盖了大模型竞争、开源模型效率、智能体趋势等热点话题。李彦宏认为未来大模型之间的差距可…

阅读更多...

【Axure教程】高级搜索

【Axure教程】高级搜索

高级搜索可以通过使用精确的关键词或短语，帮助用户找到特定的内容。尤其在面对大量搜索结果时，通过过滤条件缩小范围，能够节省时间。他允许用户使用多个条件进行组合（例如条件匹配、模糊搜索、区间筛选等）来精准获取相…

阅读更多...

购物车装载状态检测系统源码分享

购物车装载状态检测系统源码分享

购物车装载状态检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Comput…

阅读更多...

瑞幸卖奶茶，霸王茶姬不慌

瑞幸卖奶茶，霸王茶姬不慌

瑞幸和霸王茶姬，打不起来。转载定焦（dingjiaoone）原创作者 | 苏琦编辑 | 魏佳最近，瑞幸因为联名游戏大作《黑神话：悟空》无法核销套餐被骂上热搜，但业内人士更关注的，是它不久前推出的轻乳…

阅读更多...

【网络安全】-rce漏洞-pikachu

【网络安全】-rce漏洞-pikachu

rce漏洞包含命令执行漏洞与代码执行漏洞文章目录前言什么是rce漏洞？ 1.rce漏洞产生原因： 2.rce的分类： 命令执行漏洞： 命令拼接符： 常用函数： 代码执行漏洞： 常用函数： 分类&…

阅读更多...

AI算力池化技术助力运营商打造智算生态

AI算力池化技术助力运营商打造智算生态

数字经济时代，算力已成为国民经济发展的重要基础设施。随着数字化转型的不断深入和人工智能技术的广泛应用，构建以新型智算中心为核心的智能算力生态体系正驱动着数字经济快速发展，成为人工智能赋能千行百业的重中之重。 2022年2月&#xff…

阅读更多...

Vulnhub-RickdiculouslyEasy靶场（9个flag）

Vulnhub-RickdiculouslyEasy靶场（9个flag）

flag1 端口9090有一个flag flag2 13337端口 flag3 使用dirb进行扫描网站的80端口，发现一些敏感文件访问80端口，没有发现有效信息访问passwords目录访问FLAG.txt 再返回访问passwords.html文件查看页面源代码发现一个密码 flag4 之前扫描到了robo…

阅读更多...

书接上文，介绍下Quartz Java体系结构

书接上文，介绍下Quartz Java体系结构

体系结构总结 JobDetail 我们创建一个实现 Job 接口的类，使用 JobBuilder 包装成 JobDetail，它可以携带 KV 的数据。 Trigger 定义任务的触发规律，Trigger，使用 TriggerBuilder 来构建。JobDetail 跟 Trigger 是 1:N 的关系。思…

阅读更多...

推荐文章

最新文章