【李沐深度学习笔记】矩阵计算(4)

news2024/11/17 11:55:15

课程地址和说明

线性代数实现p4
本系列文章是我学习李沐老师深度学习系列课程的学习笔记,可能会对李沐老师上课没讲到的进行补充。
本节是第四篇,由于CSDN限制,只能被迫拆分

矩阵计算

矩阵的导数运算

向量对向量求导的基本运算规则

已知向量函数 y → = f → ( x → ) \overrightarrow y=\overrightarrow {f}(\overrightarrow x) y =f (x )与向量 x → = [ x 1 x 2 ⋮ x m ] m × 1 \overrightarrow x=\begin{bmatrix} x_{1}\\ x_{2}\\ \vdots \\ x_{m} \end{bmatrix}_{m\times 1} x = x1x2xm m×1

  • y → = a → \overrightarrow y=\overrightarrow a y =a ,且 a → \overrightarrow a a 不是 x → \overrightarrow x x 的函数(即 a → \overrightarrow a a 中没有分量和 x → \overrightarrow x x 相关)时,则有:
    ∂ y → ∂ x → = [ ∂ f ( x → ) ∂ x 1 ∂ f ( x → ) ∂ x 2 ⋮ ∂ f ( x → ) ∂ x m ] = [ 0 0 ⋮ 0 ] = 0 → \frac{\partial {\overrightarrow y}}{\partial\overrightarrow x}= \begin{bmatrix} \frac{\partial {{f}(\overrightarrow x)}}{\partial {x_{1}}}\\ \frac{\partial {{f}(\overrightarrow x)}}{\partial {x_{2}}}\\ \vdots \\ \frac{\partial {{f}(\overrightarrow x)}}{\partial {x_{m}}} \end{bmatrix}=\begin{bmatrix} 0\\ 0\\ \vdots \\ 0 \end{bmatrix}=\overrightarrow 0 x y = x1f(x )x2f(x )xmf(x ) = 000 =0
  • y → = x → \overrightarrow y=\overrightarrow x y =x 时,即 y → = [ f 1 ( x → ) f 2 ( x → ) ⋮ f m ( x → ) ] = [ x 1 x 2 ⋮ x m ] \overrightarrow y=\begin{bmatrix} f_{1}(\overrightarrow x) \\ f_{2}(\overrightarrow x) \\ \vdots \\ f_{m}(\overrightarrow x) \end{bmatrix}=\begin{bmatrix} x_{1} \\ x_{2} \\ \vdots \\ x_{m} \end{bmatrix} y = f1(x )f2(x )fm(x ) = x1x2xm ,则有:
    ∂ y → ∂ x → = [ ∂ f ( x → ) ∂ x 1 ∂ f ( x → ) ∂ x 2 ⋮ ∂ f ( x → ) ∂ x m ] = [ ∂ f 1 ( x → ) ∂ x 1 ∂ f 2 ( x → ) ∂ x 1 … ∂ f n ( x → ) ∂ x 1 ∂ f 1 ( x → ) ∂ x 2 ∂ f 2 ( x → ) ∂ x 2 … ∂ f n ( x → ) ∂ x 2 ⋮ ⋮ ⋱ ⋮ ∂ f 1 ( x → ) ∂ x m ∂ f 2 ( x → ) ∂ x m … ∂ f n ( x → ) ∂ x m ] m × n = [ 1 0 … 0 0 1 … 0 ⋮ ⋮ ⋱ ⋮ 0 0 … 1 ] = I 或 E (单位矩阵的两种不同记号,含义一致) \frac{\partial {\overrightarrow y}}{\partial\overrightarrow x}= \begin{bmatrix} \frac{\partial {{f}(\overrightarrow x)}}{\partial {x_{1}}}\\ \frac{\partial {{f}(\overrightarrow x)}}{\partial {x_{2}}}\\ \vdots \\ \frac{\partial {{f}(\overrightarrow x)}}{\partial {x_{m}}} \end{bmatrix}=\begin{bmatrix} \frac{\partial {{f_{1}}(\overrightarrow x)}}{\partial {x_{1}}}& \frac{\partial {{f_{2}}(\overrightarrow x)}}{\partial {x_{1}}} & \dots &\frac{\partial {{f_{n}}(\overrightarrow x)}}{\partial {x_{1}}} \\ \frac{\partial {{f_{1}}(\overrightarrow x)}}{\partial {x_{2}}}& \frac{\partial {{f_{2}}(\overrightarrow x)}}{\partial {x_{2}}} & \dots &\frac{\partial {{f_{n}}(\overrightarrow x)}}{\partial {x_{2}}} \\ \vdots & \vdots & \ddots &\vdots \\ \frac{\partial {{f_{1}}(\overrightarrow x)}}{\partial {x_{m}}}& \frac{\partial {{f_{2}}(\overrightarrow x)}}{\partial {x_{m}}} & \dots &\frac{\partial {{f_{n}}(\overrightarrow x)}}{\partial {x_{m}}} \end{bmatrix}_{m\times n}=\begin{bmatrix} 1& 0&\dots &0 \\ 0& 1& \dots &0 \\ \vdots & \vdots & \ddots &\vdots \\ 0 & 0& \dots &1 \end{bmatrix}=\bm{I}或\bm{E}(单位矩阵的两种不同记号,含义一致) x y = x1f(x )x2f(x )xmf(x ) = x1f1(x )x2f1(x )xmf1(x )x1f2(x )x2f2(x )xmf2(x )x1fn(x )x2fn(x )xmfn(x ) m×n= 100010001 =IE(单位矩阵的两种不同记号,含义一致)
  • y → = A x → \overrightarrow y=\bm{A}\overrightarrow {x} y =Ax A = [ a 11 a 12 ⋯ a 1 m a 21 a 22 ⋯ a 2 m ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m m ] \bm{A}=\begin{bmatrix} a_{11}&a_{12} & \cdots & a_{1m}\\ a_{21}&a_{22} & \cdots & a_{2m} \\ \vdots & \vdots & \ddots &\vdots \\ a_{m1}&a_{m2} & \cdots & a_{mm} \end{bmatrix} A= a11a21am1a12a22am2a1ma2mamm ,则有:
    ∂ y → ∂ x → = ∂ A x → ∂ x → = A T (按分母布局) \frac{\partial {\overrightarrow y}}{\partial\overrightarrow x}=\frac{\partial {\bm{A}\overrightarrow x}}{\partial {\overrightarrow x}} =\bm{A}^{T}(按分母布局) x y =x Ax =AT(按分母布局)
    ∂ y → ∂ x → = ∂ A x → ∂ x → = A (按分子布局) \frac{\partial {\overrightarrow y}}{\partial\overrightarrow x}=\frac{\partial {\bm{A}\overrightarrow x}}{\partial {\overrightarrow x}} =\bm{A}(按分子布局) x y =x Ax =A(按分子布局)
    (证明见本节第三篇)
  • y → = x → T A \overrightarrow y=\overrightarrow {x}^{T}\bm{A} y =x TA A = [ a 11 a 12 ⋯ a 1 m a 21 a 22 ⋯ a 2 m ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m m ] \bm{A}=\begin{bmatrix} a_{11}&a_{12} & \cdots & a_{1m}\\ a_{21}&a_{22} & \cdots & a_{2m} \\ \vdots & \vdots & \ddots &\vdots \\ a_{m1}&a_{m2} & \cdots & a_{mm} \end{bmatrix} A= a11a21am1a12a22am2a1ma2mamm
    y → = x → T A = [ x 1 , x 2 , … , x m ] ⋅ [ a 11 a 12 ⋯ a 1 m a 21 a 22 ⋯ a 2 m ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m m ] = [ a 11 x 1 + a 21 x 2 + ⋯ + a m 1 x m , a 12 x 1 + a 22 x 2 + ⋯ + a m 2 x m , … , a 1 m x 1 + a 2 m x 2 + ⋯ + a m m x m ] \overrightarrow y=\overrightarrow {x}^{T}\bm{A}=\begin{bmatrix} x_{1}, & x_{2} ,& \dots ,& x_{m} \end{bmatrix}\cdot \begin{bmatrix} a_{11}&a_{12} & \cdots & a_{1m}\\ a_{21}&a_{22} & \cdots & a_{2m} \\ \vdots & \vdots & \ddots &\vdots \\ a_{m1}&a_{m2} & \cdots & a_{mm} \end{bmatrix}=\begin{bmatrix} a_{11}x_{1}+a_{21}x_{2}+\dots +a_{m1}x_{m}, & a_{12}x_{1}+a_{22}x_{2}+\dots +a_{m2}x_{m} ,& \dots ,& a_{1m}x_{1}+a_{2m}x_{2}+\dots +a_{mm}x_{m} \end{bmatrix} y =x TA=[x1,x2,,xm] a11a21am1a12a22am2a1ma2mamm =[a11x1+a21x2++am1xm,a12x1+a22x2++am2xm,,a1mx1+a2mx2++ammxm],所以按一一对应法则只能理解成(这里行向量列向量混用了,没办法) y → = [ f 1 ( x → ) f 2 ( x → ) ⋮ f m ( x → ) ] = [ a 11 x 1 + a 21 x 2 + ⋯ + a m 1 x m a 12 x 1 + a 22 x 2 + ⋯ + a m 2 x m ⋮ a 1 m x 1 + a 2 m x 2 + ⋯ + a m m x m ] \overrightarrow y=\begin{bmatrix} f_{1}(\overrightarrow x) \\ f_{2}(\overrightarrow x) \\ \vdots \\ f_{m}(\overrightarrow x) \end{bmatrix}=\begin{bmatrix} a_{11}x_{1}+a_{21}x_{2}+\dots +a_{m1}x_{m}\\ a_{12}x_{1}+a_{22}x_{2}+\dots +a_{m2}x_{m}\\ \vdots \\ a_{1m}x_{1}+a_{2m}x_{2}+\dots +a_{mm}x_{m} \end{bmatrix} y = f1(x )f2(x )fm(x ) = a11x1+a21x2++am1xma12x1+a22x2++am2xma1mx1+a2mx2++ammxm ,则有:
    ∂ y → ∂ x → = ∂ x → T A ∂ x → = [ ∂ f 1 ( x → ) ∂ x 1 ∂ f 2 ( x → ) ∂ x 1 … ∂ f n ( x → ) ∂ x 1 ∂ f 1 ( x → ) ∂ x 2 ∂ f 2 ( x → ) ∂ x 2 … ∂ f n ( x → ) ∂ x 2 ⋮ ⋮ ⋱ ⋮ ∂ f 1 ( x → ) ∂ x m ∂ f 2 ( x → ) ∂ x m … ∂ f n ( x → ) ∂ x m ] = [ a 11 a 21 … a m 1 a 12 a 22 … a m 2 ⋮ ⋮ ⋱ ⋮ a 1 m a 2 m … a m m ] = A T \frac{\partial {\overrightarrow y}}{\partial\overrightarrow x}=\frac{\partial {\overrightarrow {x}^{T}\bm{A}}}{\partial {\overrightarrow x}} =\begin{bmatrix} \frac{\partial {{f_{1}}(\overrightarrow x)}}{\partial {x_{1}}}& \frac{\partial {{f_{2}}(\overrightarrow x)}}{\partial {x_{1}}} & \dots &\frac{\partial {{f_{n}}(\overrightarrow x)}}{\partial {x_{1}}} \\ \frac{\partial {{f_{1}}(\overrightarrow x)}}{\partial {x_{2}}}& \frac{\partial {{f_{2}}(\overrightarrow x)}}{\partial {x_{2}}} & \dots &\frac{\partial {{f_{n}}(\overrightarrow x)}}{\partial {x_{2}}} \\ \vdots & \vdots & \ddots &\vdots \\ \frac{\partial {{f_{1}}(\overrightarrow x)}}{\partial {x_{m}}}& \frac{\partial {{f_{2}}(\overrightarrow x)}}{\partial {x_{m}}} & \dots &\frac{\partial {{f_{n}}(\overrightarrow x)}}{\partial {x_{m}}} \end{bmatrix}=\begin{bmatrix} a_{11}& a_{21}&\dots &a_{m1} \\ a_{12}& a_{22}& \dots &a_{m2} \\ \vdots & \vdots & \ddots &\vdots \\ a_{1m}& a_{2m}& \dots &a_{mm} \end{bmatrix}=\bm{A}^{T} x y =x x TA= x1f1(x )x2f1(x )xmf1(x )x1f2(x )x2f2(x )xmf2(x )x1fn(x )x2fn(x )xmfn(x ) = a11a12a1ma21a22a2mam1am2amm =AT
  • y → = a u → \overrightarrow y=a\overrightarrow u y =au a a a是任意常数, u → = u → ( x → ) \overrightarrow u=\overrightarrow {u}(\overrightarrow x) u =u (x ),则有:
    ∂ y → ∂ x → = a ∂ u → ∂ x → = \frac{\partial {\overrightarrow y}}{\partial\overrightarrow x}=a\frac{\partial {\overrightarrow u}}{\partial\overrightarrow x}= x y =ax u =
  • y → = A u → \overrightarrow y=\bm{A}\overrightarrow u y =Au u → = u → ( x → ) \overrightarrow u=\overrightarrow {u}(\overrightarrow x) u =u (x ) A \bm{A} A中的元素与 x → \overrightarrow x x 中的元素无关系,则有:
    ∂ y → ∂ x → = A ∂ u → ∂ x → = \frac{\partial {\overrightarrow y}}{\partial\overrightarrow x}=\bm{A}\frac{\partial {\overrightarrow u}}{\partial\overrightarrow x}= x y =Ax u =
  • y → = u → + v → \overrightarrow y=\overrightarrow u+\overrightarrow v y =u +v 时, u → = u → ( x → ) , v → = v → ( x → ) \overrightarrow u = \overrightarrow {u}(\overrightarrow x),\overrightarrow v = \overrightarrow {v}(\overrightarrow x) u =u (x ),v =v (x ),则有:
    ∂ y → ∂ x → = ∂ u → ∂ x → + ∂ v → ∂ x → = \frac{\partial {\overrightarrow y}}{\partial\overrightarrow x}=\frac{\partial {\overrightarrow u}}{\partial\overrightarrow x}+\frac{\partial {\overrightarrow v}}{\partial\overrightarrow x}= x y =x u +x v =

拓展到矩阵

就是升维度,升到了四维空间,矩阵可以相当于四维空间里的向量,反正挺难懂的,我看个乐hhhhhhhh

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1032893.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何实现线程池之间的数据透传 ?

如何实现线程池之间的数据透传 ? 引言transmittable-thread-local概览capture如何 capture如何保存捕获的数据 save 和 replayrestore 小结 引言 当我们涉及到数据的全链路透传场景时,通常会将数据存储在线程的本地缓存中,如: 用户认证信息透…

灾备系统中的多线程传输功能

多线程传输是指同时使用多个线程进行文件传输,使多个数据包可以同时传输,从而充分利用网络带宽的最大值,提高传输速度。 正常的IE页面文件下载与上传都只有一个线程,有些软件可以实现多线程文件传输,就好像在传输文件…

JDK21你可以不用,新特性还是要了解的

大家好,我是风筝 今年6月份的时候,写过一篇JDK21引入协程,再也不用为并发而头疼了,那时候只是预览版,终于,前两天(2023年9月19日)发布了 JDK21 正式版。 老早就在 YouTube 上订阅了…

在电脑上怎么分类管理笔记?支持分类整理的电脑云笔记软件

对于大多数上班族而言,在使用电脑办公时,随手记录工作笔记是一个非常常见的场景。无论是会议纪要、工作总结还是项目计划,记录下每一次思考和灵感是提高工作效率的关键。然而,随着时间的推移,电脑上记录的笔记内容逐渐…

OceanMind海睿思入选弯弓研究院《2023中国营销技术生态图谱8.0》

近日,由国内MarTech领域知名机构 弯弓研究院 主办的第五届营销数字化大会暨营销科技MarTech交易展在广州成功召开。 本次大会发布了《2023中国营销技术生态图谱8.0版》 (以下简称“弯弓图谱8.0”),中新赛克海睿思 凭借成熟的技术实力成功入选弯弓图谱8.0…

K-最近邻算法

一、说明 KNN算法是一个分类算法,基本数学模型是距离模型。K-最近邻是一种超级简单的监督学习算法。它可以应用于分类和回归问题。虽然它是在 1950 年代引入的,但今天仍在使用。然而如何实现,本文将给出具体描述。 来源:维基百科 …

Docker 安装Redis(集群)

3主3从redis集群配置 1、新建6个docker容器 redis 实例 docker run -d --name redis-node-1 --net host --privilegedtrue -v /data/redis/share/redis-node-1:/data redis:6.0.8 --cluster-enabled yes --appendonly yes --port 6381 docker run -d --name redis-node-2 --ne…

Fiddler抓取Https请求配置

官网:https://www.telerik.com/fiddler 配置抓取https包 1.Tools->Options->Https,勾选下面。 2.Actions ->Trust Root Certificate.安装证书到本地 3.在手机端设置代理:本机ip如:192.168.1.168 端口号:8888。 4.手机…

有一个新工具,能让程序员变成高手,优雅撸它!

不知道从什么时候开始,程序员这个职位变得家喻户晓,对程序员的印象也从以前的高深莫测变成如今的加班代名词。对于程序员加班,不懂有话要说。 作为大厂的一枚螺丝钉,接到任务的第一时间需要缕清底层逻辑,并随时关注部门…

【2603. 收集树中金币】

来源:力扣(LeetCode) 描述: 给你一个 n 个节点的无向无根树,节点编号从 0 到 n - 1 。给你整数 n 和一个长度为 n - 1 的二维整数数组 edges ,其中 edges[i] [ai, bi] 表示树中节点 ai 和 bi 之间有一条…

基于SpringBoot的网上超市系统的设计与实现

目录 前言 一、技术栈 二、系统功能介绍 管理员功能实现 用户功能实现 三、核心代码 1、登录模块 2、文件上传模块 3、代码封装 前言 网络技术和计算机技术发展至今,已经拥有了深厚的理论基础,并在现实中进行了充分运用,尤其是基于计…

【Java 基础篇】Java网络编程:下载进度监控实现详解

文件下载是许多应用程序的重要功能,而下载进度监控是提高用户体验的关键。在本文中,我们将详细介绍如何使用Java实现文件下载进度监控,以便用户可以实时了解文件下载的进度。 什么是下载进度监控 下载进度监控是一种用户界面元素或功能&…

真白给,太好考了!大爆冷+扩招!

一、学校及专业介绍 太原科技大学(Taiyuan University of Science and Technology)位于山西省太原市,入选了国家中西部高校基础能力建设工程、教育部数据中国“百校工程”,教育部首批新工科研究与实践项目实施高校。 1.1 招生情况 太原科技…

【word格式】mathtype公式插入 | 段落嵌入后格式对齐 | 字体大小调整 |空心字体

1. 公式嵌入 推荐在线latex编辑器,可以截图转 latex 识别率很高 https://www.latexlive.com/home 美中不足,不开会员每天只能用3次识别。 通过公式识别后,输出选择align环境,然后在mathtype中直接粘贴latex就可以转好。 2.公式…

在线人才测评,招聘技术研发类岗位的人才测评方案

企业的发展离不开技术创新,与其他岗位的员工相比,研发岗位创造性强,较为独立,技术专业度高,对研发技术类岗位的招聘,不仅仅是在专业能力方面做要求,还需要从人员素质,潜在能力方面入…

解决方案:TSINGSEE青犀+智能分析网关助力智慧仓储智能化监管

为全面保障物流仓储的安全性与完整性,解决仓库管理难题,优化物流仓储方式,提升仓储效率,降低人工成本,旭帆科技推出智慧仓储AI视频智能分析方案,利用物联网、大数据、云计算等技术,对仓储管理进…

图像形态学操作(连通性、腐蚀、膨胀)

相关概念 形态学操作-腐蚀 参数: img: 要处理的图像kernal :核结构iteration :腐蚀的次数,默认是1 形态学操作-膨胀 参数: img : 要处理的图像kernal : 核结构iteration : 膨胀的次数,默认为1 import cv2 as cv im…

推荐几款实用的项目进度管理软件

做好项目的进度管理是项目经理的重要职责,在这个过程中,并非单凭人力就可以把控。项目进度管理软件出现,成为人们在项目管理过程中最需要的工具之一。一个项目无论大小,都需要一款高效且实用的项目管理工具,对项目流程…

03Nginx的静态资源部署,反向代理,负载均衡,动静分离的配置

Nginx具体应用 部署静态资源 Nginx相对于Tomcat处理静态资源的能力更加高效,所以在生产环境下一般都会将Nginx可以作为静态web服务器来部署静态资源 静态资源: 在服务端真实存在并且能够直接展示的一些html页面、css文件、js文件、图片、视频等资源文件将静态资源部署到Ngin…

金典成为饿了么小蓝盒首个低碳“盒”伙人:战略合作迎绿色亚运

即将到来的杭州第19届亚洲运动会,将绿色低碳理念融入到了方方面面。9月20日,杭州亚运会官方指定乳制品、伊利旗下高端牛奶品牌金典与亚运会官方电子订餐平台饿了么宣布达成低碳战略合作,双方将通过共同打造环保运动周边、招募骑手低碳配送以及…