本文参考www.deeplearningbook.org一书第二章2.3 Identity and Inverse Matrices 2.4 Linear Dependence and Span
本文围绕线性方程求解依次介绍矩阵的逆、线性组合、线性独立等线性代数的基础知识点。
一、线性方程
本文主要围绕求解线性方程展开,我们先把线性方程写出来,方程如下:
其中,是已知的;,是已知的;,是未知的,需要我们求解。即上述方程已知和,求。
为了求,有很多思路,其中有个思路就是通过矩阵的逆来求。对于一些,可以通过矩阵的逆来求。
二、单位矩阵(identity matrix)和矩阵的逆(matrix inverse)
在介绍矩阵的逆之前,需要先了解下单位矩阵。
单位矩阵
单位矩阵是指这样一个矩阵:当一个矩阵乘一个向量,相乘的结果依然是这个向量,那么这个矩阵就是单位矩阵。即对 ,有 ,其中 。
单位矩阵的形式是很简单的,矩阵的主对角线上的值为1,其余位置的值都为0。例如:
; ; ;等等
单位矩阵有一个性质,那就是对于,有 。
矩阵的逆
如果一个矩阵 满足,那么矩阵 就是矩阵 的逆(更具体来讲叫左逆)。我们一般把这样的矩阵 计作,即。
根据矩阵的逆的定义,我们可以推导出来以下结论:
推导1、当矩阵 是方阵时,矩阵 的逆才有可能存在;当矩阵 不是方阵时,矩阵 的逆一定不存在。
推导2、当矩阵 是方阵时,矩阵 的逆可能存在,也可能不存在;不是所有的方阵都有逆矩阵。
推导3、当矩阵 是方阵并且矩阵 的逆存在时,也是方阵,并且是唯一的。
关于这三个推导的证明会写在另外一篇文章里~
那么如果是方阵并且矩阵 的逆存在的话,我们可以用来求解线性方程里的。具体求解过程如下:
我们可以得到:如果矩阵 的逆存在的话,对于任意的,都可以求出线性方程里的,由于是唯一的,所以对于固定的,求出的只有一个。
也就是说如果矩阵 的逆存在,那么线性方程对所有的 ,都有解且解唯一,反之也成立。我们暂且把这个结论计作结论1。
当然,如果矩阵 的逆不存在的话(包括不是方阵、是方阵但的逆矩阵不存在),就不能上述求解过程来求解,但是并不代表没有解。
那么当矩阵 的逆不存在时,我们怎样求解呢?我们接下来引入线性独立这个概念。
三、线性组合和线性独立
求解方程里的可能有哪些情况呢?我们不妨先列举出来可能出现的情况。
①、有一个解。②、没有解。③、有无数解。④、有几个解。
对于④,我们可以先排除掉。因为如果方程只有两个解 和 ,那么 依然是方程的解(简单证明一下就能明白)。
我们已经知道,如果矩阵 的逆存在的话,对于任意,方程里的只有一个解,是唯一的,是①这种情况。那么什么样的和能有②、③这种情况呢?我们接下来从线性组合的角度来理解下①②③这三种情况。
线性组合
我们可以把求解的过程想成这样:
把矩阵的每一列看成是从原点出发,沿着不同方向延伸的向量;决定延伸到多远,决定的第 列延伸到多远;然后我们看看有多少种方法能够到达 (也就是求解)。
那么可以写成如下形式:
其中 指的第 列(向量), 指 的第 个数值(实数)。
式子里的 一般叫做线性组合。我们可以对线性组合做个一般性的描述:一组向量 的线性组合就是给每个向量乘上一个实数系数再将向量相加后得到的向量:
一组向量的跨度(span)就是这组向量通过线性组合能够得到的所有向量。 的所有列的跨度就是所能代表的所有向量(任意改变每个维度的值)。
有了跨度这个概念之后,我们可以这样理解,如果 在 的所有列的跨度里,那么就存在,使得,也就是说 有解。 的所有列的跨度也可以叫做的列空间。
线性独立
我们先从一个问题入手分析,那就是要使得线性方程对所有的 ,都有解, 需要满足什么条件。
如果要使得线性方程对所有的 ,都有解,那么需要使得所有的 都应该在的列空间里,那么就需要满足的列空间就是 (如果的一个向量不在的列空间里,那么这个向量作为里的 时,无解)。要使得的列空间就是 ,首先 ()必须至少要有列,也就是。举个例子,比如是一个 矩阵,是3维向量,是 2 维向量,那么随意改变每个维度的值最多也只能使这个线性组合布满由的两个列向量为边界的一个平面(里的一个平面), 在这个平面里 ,方程有解, 不在这个平面里 ,方程无解。其次 中至少能找出一组个没有冗余的列向量。举个例子,比如是一个 矩阵,的两个列向量是相同的,是2维向量,是 2 维向量,那么随意改变每个维度的值最多也只能使这个线性组合是一条直线(里的一条直线),而不能覆盖整个平面 , 在这个直线上 ,方程有解, 不在这个直线上 ,方程无解。这里所说到的没有冗余一般叫做线性独立,如果一组向量里的任何一个向量不可能由其他向量通过线性组合的方式得到,那么这组向量就是线性独立的。
通过分析,我们可以得出如下结论:
结论2:如果线性方程对所有的 ,都有解,那么一定有,反之不成立。
结论3:如果线性方程对所有的 ,都有解,那么在 中至少能找出一组个线性独立的列向量,反义也成立。在 中只能找出1组个线性独立的列向量,有唯一解,在 中能找出2组及以上个线性独立的列向量,有无数解。
我们可以将结论1和结论3对比得出:如果在 中只能找出一组个线性独立的列向量,那么并且线性方程对所有的 ,都有解(唯一解),那么可逆。可以得到可逆矩阵一定是方阵,也可以得到如果矩阵可逆,那么 的个列向量线性独立,反之也成立。
如果在 中能找出二组及以上个线性独立的列向量,那么,那么不是方阵当然也不可逆。
四、总结
(不是零向量) | (不是零向量) | |
n=m(方阵)且可逆( 的 n 个列向量线性独立) | 任意 | 有解(唯一解) |
n=m(方阵)且不可逆( 的 n 个列向量线性有关) | 在的列空间里 | 有解(无数解) |
n=m(方阵)且不可逆( 的 n 个列向量线性有关) | 不在的列空间里 | 无解 |
n>m 且中至少存在一组 个列向量线性独立 | 任意 | 有解(存在一组有唯一解,存在2组及以上有无数解) |
n>m 且中不存在一组 个列向量线性独立 | 在的列空间里 | 有解(无数解) |
n>m 且中不存在一组 个列向量线性独立 | 不在的列空间里 | 无解 |
本文就讲到这里啦,欢迎大家留言呀~