【pytorch】nn.linear 中为什么是y=xA^T+b

【pytorch】nn.linear 中为什么是y=xA^T+b

news2026/2/13 21:25:55

我记得读教材的时候是y=Wx+b, 左乘矩阵W，这样才能表示线性变化。
但是pytorch中的nn.linear中，计算方式是y=xA^T+b，其中A是权重矩阵。
为什么右乘也能表示线性变化操作呢？因为pytorch中，照顾到输入是多个样本一起算的（第一个维度是多个样本数，所以输入默认是行向量），所以用y=xA^T+b，输出的y也是行向量。

在这里插入图片描述

我们的教材中默认输入是列向量的，而pytorch为了用户方便，输入当作列向量，维度为（batch, dim），每行是特征

m = nn.Linear(20, 30)
input = torch.randn(128, 20)
output = m(input)

print(output.size())
>>> torch.Size([128, 30])
print(m.weight.shape)
>>>torch.Size([30, 20])  # 注意这里的权重维度

我们再看一张图片，理解一下代码中的实现逻辑：
在这里插入图片描述

至此应该对代码的实现很理解了，但是需要注意，大家写文章中用的都还是Wx+b的写法。
不管怎样，文章和代码都是能对应上的，最多是表示方式的区别（有的用行向量，有的用列向量）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1422155.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【Ubuntu 22.04.3 LTS】apt-get下载安装有关问题可能原因及解决方法

【Ubuntu 22.04.3 LTS】apt-get下载安装有关问题可能原因及解决方法

ubuntu 22.04.3 LTS unaccountably error 装啥啥没依赖可能是用了不合适的源，换个就好了 Now, let’s take a look at the lsb_release output, with a special focus on the Codename, which could be a crucial piece of information. The lsb_release comm…

阅读更多...

使用ChatGPT学习大象机器人六轴协作机械臂mechArm

使用ChatGPT学习大象机器人六轴协作机械臂mechArm

引言我是一名机器人方向的大学生，近期学校安排自主做一个机器人方面相关的项目。学校给我们提供了一个小型的六轴机械臂，mechArm 270M5Stack，我打算使用ChatGPT让它来辅助我学习如何使用这个机械臂并且做一个demo。本篇文章将记录我是如何使…

阅读更多...

Windows编程入门-窗口控件-资源操作

Windows编程入门-窗口控件-资源操作

window控件： 控件是常见的窗口上的交互元素例如：一个按钮，一个复选框，一个列表框等。当控件的特定功能被触发后，会主动发送消息通知父窗口，父窗口可以通过发送消息给控件控制控件的行为。控件的本质是一个…

阅读更多...

使用visual studio写一个简单的c语言程序

使用visual studio写一个简单的c语言程序

官网下载visual studio，社区版免费的 https://visualstudio.microsoft.com/zh-hans/ 下载好以后选择自己的需求进行安装，我选择了两个，剩下的是默认。创建文件：

阅读更多...

Linux编辑器之vim的使用

Linux编辑器之vim的使用

文章目录一、vim简介二、vim的基本概念三、vim的基本操作四、vim正常模式命令集移动光标删除文字复制替换撤销上一次操作更改跳至指定的行vim末行模式命令集列出行号跳到文件中的某一行查找字符保存文件离开vim 五、进阶vim玩法打开文件批量注释代码执行shell命令指定注释窗口…

阅读更多...

如何判断 LM358 芯片是否损坏或故障？

如何判断 LM358 芯片是否损坏或故障？

LM358 芯片是一种流行的低功耗双运放，广泛应用于各种电子电路中，包括放大器、滤波器、积分器、比较器等。它以其低成本、高性价比和广泛的工作电源范围（3V至32V单电源或1.5V至16V双电源）而被广泛使用。然而，像所有电…

阅读更多...

怎么查询鸿蒙真机支持的API版本

怎么查询鸿蒙真机支持的API版本

1、打开设备的开发者模式与USB调试并通过USB连接上电脑。 2、管理员身份运行cmd。 3、进入hdc.exe所在目录。(鸿蒙OS IDE的SDK下载目录中) 4、输入hdc shell，进入特殊模式 5、输入 getprop hw_sc.build.os.apiversion 查看API版本 6、输入 getprop hw_sc.build…

阅读更多...

盘点Python网页开发轻量级框架Flask知识

盘点Python网页开发轻量级框架Flask知识

目录一、Flask框架概述二、核心组件 1、WSGI服务器 2、Jinja2模板引擎 3、URL路由 4、数据库集成三、应用场景博客平台内容管理系统（CMS） API开发四、优缺点优点： 缺点： 五、总结随着Web开发的日益普及&…

阅读更多...

c# textbox 提示文字

c# textbox 提示文字

1. 定义提示文字内容 private readonly string RemarkText "最多输入100字"; // 提示文字 2. 添加textbox 焦点事件， 初始化textbox提示文字和字体颜色 public UserControl(){InitializeComponent();tb_Remark.Text RemarkText;tb_Remark.ForeColor…

阅读更多...

提高 NFS Azure 文件共享性能

提高 NFS Azure 文件共享性能

本文内容适用于增加预读大小以提高读取吞吐量Nconnect另请参阅本文介绍如何提高 NFS Azure 文件共享的性能。适用于展开表文件共享类型SMBNFS标准文件共享 (GPv2)、LRS/ZRS 标准文件共享 (GPv2)、GRS/GZRS 高级文件共享 (FileStorage)、LRS/ZRS 增加预读大…

阅读更多...

第七篇：node中间件详解

第七篇：node中间件详解

🎬 江城开朗的豌豆：个人主页 🔥 个人专栏 :《 VUE 》《 javaScript 》 📝 个人网站 :《江城开朗的豌豆🫛 》 ⛺️ 生活的理想，就是为了理想的生活 ! 目录 📘 引言： &#…

阅读更多...

Jedis连接池究竟是何物？

Jedis连接池究竟是何物？

一、前言连接池的用途实际上有过开发经验的朋友都已经比较清楚了，当资源对象的创建/销毁比较耗时的场景下，可以通过"池化"技术，达到资源的复用，以此来减少系统的开销、增大系统吞吐量，比如数据库连接池、线…

阅读更多...

fastadmin后台自定义按钮和弹窗

fastadmin后台自定义按钮和弹窗

工具栏自定义按钮-ajax请求前端代码 1.在对应模块的模板文件index.html添加自定义按钮，注意按钮要添加id以绑定点击事件 <div class"panel panel-default panel-intro">{:build_heading()}<div class"panel-body"><div id&qu…

阅读更多...

开源博客项目Blog .NET Core源码学习（8：EasyCaching使用浅析）

开源博客项目Blog .NET Core源码学习（8：EasyCaching使用浅析）

开源博客项目Blog使用EasyCaching模块实现缓存功能，主要是在App.Framwork项目中引用了多类包，包括内存缓存（EasyCaching.InMemory）、Redis缓存（EasyCaching.CSRedis），同时支持多种序列化方式&am…

阅读更多...

python中的josn方法相关介绍

python中的josn方法相关介绍

如果需要在不同的编程语言之间传递对象，就必须把对象序列化为标准格式，比如XML，但更好的方法是序列化为JSON，因为JSON表示出来就是一个字符串，可以被所有语言读取，也可以方便地存储到磁盘或者通过网络传输。…

阅读更多...

pormetheus之promQL语法

pormetheus之promQL语法

1、基本语法 （1）node_cpu_guest_seconds_total监控项数据（指标项） （2）node_cpu_guest_seconds_total{cpu"0"}时间序列花括号里的表示标签。node使用cpu的描述统计，符合标签cpu0的…

阅读更多...

测试 35 个 webshell 检测引擎的查杀结果

测试 35 个 webshell 检测引擎的查杀结果

最近发现了一个有意思的使用分支对抗技术制作的 PHP Webshell 开源项目，共数十个查杀引擎免杀，项目地址：https://github.com/icewolf-sec/PerlinPuzzle-Webshell-PHP 什么是 Webshell Webshell 是一种恶意脚本，它能让攻击者通过…

阅读更多...

Spring Boot 中文件上传

Spring Boot 中文件上传

Spring Boot 中文件上传一、MultipartFile二、单文件上传案例三、多文件上传案例四、Servlet 规范五、Servlet 规范实现文件上传上传文件大家用的最多的就是 Apache Commons FileUpload，这个库使用非常广泛。Spring Boot3 版本中已经不能使用了。代替它的是 Sprin…

阅读更多...

F5怎么样应对来自多云的挑战？一文讲透

F5怎么样应对来自多云的挑战？一文讲透

伴随着5G、物联网、云计算等技术的快速发展，越来越多的企业也将其业务迁移到云，企业也在寻求多种云解决方案，以优化资源并降低成本，进一步优化IT运营。根据Deloitte发布的《美国云计算未来调查报告》，近80%的企业表示它…

阅读更多...

CUDA编程- - GPU线程的理解 thread,block,grid - 学习记录

CUDA编程- - GPU线程的理解 thread,block,grid - 学习记录

GPU线程的理解 thread,block,grid 一、从 cpu 多线程角度理解 gpu 多线程1、cpu 多线程并行加速2、gpu多线程并行加速2.1、cpu 线程与 gpu 线程的理解（核函数）2.1.1 、第一步：编写核函数2.1.2、第二步：调用核函数（使用…

阅读更多...

推荐文章

最新文章