PyTorch张量：内存布局

PyTorch张量：内存布局

news2026/2/14 21:27:34

你可能对 torch 上的某些函数感到困惑，它们执行相同的操作但名称不同。例如： reshape()、view()、permute()、transpose() 等。

这些函数的做法真的不同吗？不！但为了理解它，我们首先需要了解一下张量在 pytorch 中是如何实现的。

NSDT工具推荐： Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎

张量（tensor）是抽象或逻辑结构，就像数组一样，无法按照其设想的方式实现。显而易见的原因是内存单元是连续（contiguous）的，因此我们需要找到一种方法将它们保存在内存中。例如，如果我们有一个如下所示的二维张量（或数组）：

将其保存到内存中的正常（或连续）方式是逐行排列。所以我们将有：

每个张量都有元数据来声明如何读取张量。例如，在这个 2d 张量中，为了访问下一行，我们必须向前移动 3 步，而下一列我们应该向前移动 1 步。我们称这两个数字为步幅（stride）。所以我们可以像下面这样提取它们：

这为我们开辟了新的可能性，因为们可以通过改变步幅元数据来改变张量！例如，如果我们将步长从(3, 1) 更改为(1, 3)，我们实际上转置了矩阵，而无需对所有内存项进行任何操作：

正如你所注意到的，张量不再连续，因为我们更改了它！为了转到下一行，我们只需跳过 1 个值，而跳过3 个值则移动到下一列。
如果我们回想一下张量的内存布局，这是有道理的：

[0, 1, 2, 3, 4, …, 11]

为了移动到下一列（例如从0到3，我们必须跳过 3 个值。因此张量不再是连续的！要使其连续，只需对其调用contigously()即可：

当你调用contigious()时，它实际上会创建张量的副本，因此元素的顺序将与从头开始创建相同形状的张量相同。

请注意，“连续”这个词有点误导，因为它并不是张量的内容分布在断开连接的内存块周围。这里字节仍然分配在一块内存中，但元素的顺序不同！

同样，视图函数 view()只是原始变量的视图，这意味着如果更改原始内存，它也会发生变化：

这实际上非常有效，因为我们不必为转换创建新的内存槽。但 reshape()可以复制原始数据。来自原始文档：

连续输入和具有兼容步幅的输入可以在不复制的情况下进行重塑，但你不应依赖于复制与查看行为。

例如，如果我们有如下代码：

运行输出结果如下：

该视图不适用于非连续数据。

另外，考虑到 permute() 是另一个仅适用于元数据的函数，因此它也会创建不连续的数据。 permute() 改变轴的顺序，因此它与改变矩阵形状的 view() 或 reshape() 完全不同。

原文链接：Pytorch张量内存布局 - BimAnt

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1304016.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

AR-LDM原理及代码分析

AR-LDM原理及代码分析

AR-LDM原理AR-LDM代码分析pytorch_lightning(pl)的hook流程main.py 具体分析TrainSampleLightningDatasetARLDM blip mm encoder AR-LDM原理左边是模仿了自回归地从1, 2, ..., j-1来构造 j 时刻的 frame 的过程。在普通Stable Diffusion的基础上，使用了1, 2, .…

阅读更多...

人工智能|深度学习——知识蒸馏

人工智能|深度学习——知识蒸馏

一、引言 1.1 深度学习的优点特征学习代替特征工程：深度学习通过从数据中自己学习出有效的特征表示，代替以往机器学习中繁琐的人工特征工程过程，举例来说，对于图片的猫狗识别问题，机器学习需要人工的设计、提取出猫的…

阅读更多...

产品＜Axure的安装以及组件介绍

产品＜Axure的安装以及组件介绍

Axure介绍： Axure是一款用户体验设计工具，可以用于创建交互式原型、线框图和设计文档。它支持快速原型开发、界面设计、信息架构、流程图和注释等功能，可以帮助设计师快速地创建和共享交互式原型，从而更好地与客户和团队协作。 …

阅读更多...

从 MQTT、InfluxDB 将数据无缝接入 TDengine，接入功能与 Logstash 类似

从 MQTT、InfluxDB 将数据无缝接入 TDengine，接入功能与 Logstash 类似

利用 TDengine Enterprise 和 TDengine Cloud 的数据接入功能，我们现在能够将 MQTT、InfluxDB 中的数据通过规则无缝转换至 TDengine 中，在降低成本的同时，也为用户的数据转换工作提供了极大的便捷性。由于该功能在实现及使用上与 Logstash 类…

阅读更多...

「差生文具多系列」推荐两个好看的 Redis 客户端

「差生文具多系列」推荐两个好看的 Redis 客户端

📢 声明： 🍄 大家好，我是风筝 🌍 作者主页：【古时的风筝CSDN主页】。 ⚠️ 本文目的为个人学习记录及知识分享。如果有什么不正确、不严谨的地方请及时指正，不胜感激。直达博主：「…

阅读更多...

总结6种@Transactional注解的失效场景

总结6种@Transactional注解的失效场景

作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO 联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬引言昨天有粉丝咨询了…

阅读更多...

【漏洞修复】Cisco IOS XE软件Web UI权限提升漏洞及修复方法

【漏洞修复】Cisco IOS XE软件Web UI权限提升漏洞及修复方法

关于Cisco IOS XE软件Web UI权限提升漏洞及修复方法文章目录漏洞基本信息漏洞影响范围确认设备是否受影响漏洞修复方法推荐阅读漏洞基本信息 Cisco IOS XE Unauthenticatd Remote Command Execution (CVE-2023-20198) (Direct Check) Severity:Critical Vulnerability Pri…

阅读更多...

【Jeecg Boot 3 - 第二天】2.1、nginx 部署 JEECGBOOT VUE3

【Jeecg Boot 3 - 第二天】2.1、nginx 部署 JEECGBOOT VUE3

一、场景二、实战 ▶ 2.1、打包（build 前端） ＞ Stage 1：修改配置文件 .env.production（作用：指向后端接口地址） ＞ Stage 2：点击build（作用&#xff1…

阅读更多...

动态规划——数塔问题（三维数组的应用）

动态规划——数塔问题（三维数组的应用）

一、例题要求及理论分析声明：理论指导《算法设计与分析第四版》因为这个地方用到了三维数组，感觉很有意思就故意挑出来分享给大家（三维数组可以看成很多页二维数组） 4.5.1认识动态规划数塔问题： 如图4-12所示的一…

阅读更多...

小型洗衣机哪个牌子质量好？迷你洗衣机排名前十名

小型洗衣机哪个牌子质量好？迷你洗衣机排名前十名

随着内衣洗衣机的流行，很多小伙伴在纠结该不该入手一款内衣洗衣机，专门来洗一些贴身衣物，答案是非常有必要的，因为我们现在市面上的大型洗衣机只能做清洁，无法对我们的贴身衣物进行一个高强度的清洁，而小小…

阅读更多...

2023年最新prometheus + grafana搭建和使用+gmail邮箱告警配置

2023年最新prometheus + grafana搭建和使用+gmail邮箱告警配置

一、安装prometheus 1.1 安装 prometheus官网下载地址 sudo -i mkdir -p /opt/prometheus #移动解压后的文件名到/opt/,并改名prometheus mv prometheus-2.45 /opt/prometheus/ #创建一个专门的prometheus用户： -M 不创建家目录， -s 不让登录 useradd…

阅读更多...

web服务器之——搭建两个基于不同端口访问的网站

web服务器之——搭建两个基于不同端口访问的网站

要求如下： 建立一个使用web服务器默认端口的网站，设置DocumentRoot为/www/port/80，网页内容为：the port is 80。建立一个使用10000端口的网站，设置DocumentRoot为/www/port/10000，网页内容为：t…

阅读更多...

Centos7 首次安装Mysql8.0

Centos7 首次安装Mysql8.0

随笔记录背景介绍：重装Centos7 系统，没有安装mysql 目录 1. 查看否有MariaDB与MySQL 2. MySQL官网下载适用于centos7的mysql安装包 2.1 查询服务器是x86_64架构还是arm架构 2.2 查系统版本 2.3 下载适用于系统版本安装包 2.3.1 国内镜像源下载…

阅读更多...

@Transactional失效问题

@Transactional失效问题

作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO 联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬关于Transactional 日…

阅读更多...

应用在LED灯光控制触摸屏中的触摸芯片

应用在LED灯光控制触摸屏中的触摸芯片

LED灯光控制触摸屏方法，包括：建立触摸屏的触摸轨迹信息与LED灯光驱动程序的映射关系；检测用户施加在触摸屏上的触摸轨迹，生成触摸轨迹信息；根据生成的触摸轨迹信息，调用对应的LED灯光驱动程序，控…

阅读更多...

算法-05-二分查找

算法-05-二分查找

二分查找（Binary Search）算法，也叫折半查找算法，是一种针对有序数据集合的查找算法。 1-二分查找的思想我们生活中猜数字的游戏，告诉你一个数据范围，比如0-100，然后你说出一个数字&#xff0c…

阅读更多...

pathlib --- 面向对象的文件系统路径

pathlib --- 面向对象的文件系统路径

3.4 新版功能. 源代码 Lib/pathlib.py 该模块提供表示文件系统路径的类，其语义适用于不同的操作系统。路径类被分为提供纯计算操作而没有 I/O 的纯路径，以及从纯路径继承而来但提供 I/O 操作的具体路径。如果以前从未用过此模块，或不确定…

阅读更多...

1、springboot项目运行报错

1、springboot项目运行报错

问题1：获取不到配置文件的参数我的配置文件获取的参数如下： public class Configures{Value("${configmdm.apk.apkName}")private static String apkName;private void setApkName(String apkName) {Configures.apkName apkName;}private …

阅读更多...

k8s详细教程(一)

k8s详细教程(一)

—————————————————————————————————————————————— 博主介绍：Java领域优质创作者,博客之星城市赛道TOP20、专注于前端流行技术框架、Java后端技术领域、项目实战运维以及GIS地理信息领域。 🍅文末获取源码…

阅读更多...

OpenSSL 编程指南

OpenSSL 编程指南

目录前言初始化SSL库创建SSL 上下文接口(SSL_CTX)安装证书和私钥加载证书(客户端/服务端证书)加载私钥/公钥加载CA证书设置对端证书验证例1 SSL服务端安装证书例2 客户端安装证书创建和安装SSL结构建立TCP/IP连接客户端创建socket服务端创建连接创建SSL结构中的BIOSSL握手服务…

阅读更多...

推荐文章

最新文章