- 注: 以下内容均由个人整理, 不保证完全准确, 如有纰漏, 欢迎交流讨论
- 参考: 杨明, 刘先忠. 矩阵论(第二版)[M]. 武汉: 华中科技大学出版社, 2005
4 矩阵的广义逆
4.1 矩阵的左逆与右逆
左逆 右逆
Def’ 4.1: 设 A ∈ C m × n A\in C^{m\times n} A∈Cm×n
- ∃ B ∈ C n × m \exists B\in C^{n\times m} ∃B∈Cn×m, B A = I n BA=I_n BA=In, 则 B B B 为 A A A 左逆, 记为 A L − 1 A_L^{-1} AL−1
- ∃ C ∈ C n × m \exists C\in C^{n\times m} ∃C∈Cn×m, A C = I m AC=I_m AC=Im, 则 C C C 为 A A A 右逆, 记为 A R − 1 A_R^{-1} AR−1
左逆:
必要条件 ⇒
n
=
r
(
B
A
)
≤
r
(
A
)
≤
m
n=r(BA)\leq r(A)\leq m
n=r(BA)≤r(A)≤m
充要条件:
⟺
A
A
A 列满秩(瘦高)
n
=
r
a
n
k
(
A
)
≤
m
n=rank(A)\leq m
n=rank(A)≤m
⟺
A
H
A
A^HA
AHA 可逆 (
A
L
−
1
A
=
(
(
A
H
A
)
−
1
A
H
)
A
=
I
n
A_L^{-1}A=((A^HA)^{-1}A^H)A=I_n
AL−1A=((AHA)−1AH)A=In) ⇒ 左逆求法:
A
L
−
1
=
(
A
H
A
)
−
1
A
H
A_L^{-1}=(A^HA)^{-1}A^H
AL−1=(AHA)−1AH
⟺ 零空间
N
(
A
)
=
{
0
}
N(A)=\{0\}
N(A)={0}
右逆:
必要条件 ⇒
m
=
r
(
A
C
)
≤
r
(
A
)
≤
n
m=r(AC)\leq r(A)\leq n
m=r(AC)≤r(A)≤n
充要条件:
⟺
A
A
A 行满秩(矮胖)
m
=
r
a
n
k
(
A
)
≤
n
m=rank(A)\leq n
m=rank(A)≤n
⟺
A
A
H
AA^H
AAH 可逆 (
A
A
R
−
1
=
A
(
A
H
(
A
A
H
)
−
1
)
=
I
m
AA_R^{-1}=A(A^H(AA^H)^{-1})=I_m
AAR−1=A(AH(AAH)−1)=Im) ⇒ 右逆求法:
A
R
−
1
=
A
H
(
A
A
H
)
−
1
A_R^{-1}=A^H(AA^H)^{-1}
AR−1=AH(AAH)−1
⟺ 列空间
R
(
A
)
=
C
m
R(A)=C^m
R(A)=Cm
m ≠ n m\neq n m=n 时, 左逆和右逆不可能同时存在
单侧逆求解线性方程组
求解线性方程组: A m × n X n = b m A_{m\times n}X_n=b_m Am×nXn=bm
左可逆矩阵:
- 条件: ( I m − A A L − 1 ) b = 0 (I_m-AA_L^{-1})b=0 (Im−AAL−1)b=0
- 唯一解:
(
A
H
A
)
−
1
A
H
b
(A^HA)^{-1}A^Hb
(AHA)−1AHb (
A
L
−
1
A_L^{-1}
AL−1 不唯一, 但
A
L
−
1
b
A_L^{-1}b
AL−1b 唯一)
理解: A A A 左可逆是列满秩瘦高的矩阵, 相当于 A X = b AX=b AX=b 有过多等式, 等式个数大于未知数个数, 即 m > n m > n m>n, 此时等式过多很可能没有解, 有解也是唯一解.
右可逆矩阵:
- 条件: 无(都有解)
- 多个解: 任一
A
R
−
1
b
A_R^{-1}b
AR−1b (所以
A
H
(
A
A
H
)
−
1
b
A^H(AA^H)^{-1}b
AH(AAH)−1b 是一个解)
理解: A A A 右可逆是行满秩矮胖的矩阵, 相当于 A X = b AX=b AX=b 等式个数小于未知数个数, 即 m < n m < n m<n, 所以一定有解, 且解不唯一.
4.2 广义逆矩阵
减号广义逆
Def’ 4.2 减号逆:
A
∈
C
m
×
n
A\in C^{m\times n}
A∈Cm×n, 若
G
∈
C
n
×
m
G\in C^{n\times m}
G∈Cn×m 使得
A
G
A
=
A
AGA=A
AGA=A
则称矩阵
G
G
G 为
A
A
A 的减号(广义)逆, 或 {1}-逆.
A
A
A 的全部减号逆集合记为
A
{
1
}
=
{
A
1
−
,
A
2
−
,
.
.
.
}
A\{1\}=\{A_1^-,A_2^-,...\}
A{1}={A1−,A2−,...}
A
A
A 可逆, 则
A
−
1
∈
A
{
1
}
A^{-1}\in A\{1\}
A−1∈A{1}
A
A
A 单侧可逆, 则
A
L
−
1
∈
A
{
1
}
A_L^{-1}\in A\{1\}
AL−1∈A{1}/
A
R
−
1
∈
A
{
1
}
A_R^{-1}\in A\{1\}
AR−1∈A{1}
A
=
0
A=0
A=0, 则
A
{
1
}
=
C
m
×
n
A\{1\}=C^{m\times n}
A{1}=Cm×n
Th 4.5:
A
∈
C
m
×
n
,
r
a
n
k
(
A
)
=
r
A\in C^{m\times n},rank(A)=r
A∈Cm×n,rank(A)=r, 若存在可逆阵
P
,
Q
P,Q
P,Q 使
P
A
Q
=
[
I
r
0
0
0
]
PAQ=\begin{bmatrix}I_r&0\\0&0\end{bmatrix}
PAQ=[Ir000], 则
A
−
∈
A
{
1
}
A^-\in A\{1\}
A−∈A{1} ⟺
A
−
=
Q
[
I
r
U
V
W
]
n
×
m
P
A^-=Q\begin{bmatrix} I_r&U\\ V&W \end{bmatrix}_{n\times m}P
A−=Q[IrVUW]n×mP
其中
U
∈
C
r
×
(
m
−
r
)
U\in C^{r\times (m-r)}
U∈Cr×(m−r),
V
∈
C
(
n
−
r
)
×
r
V\in C^{(n-r)\times r}
V∈C(n−r)×r,
W
∈
C
(
n
−
r
)
×
(
m
−
r
)
W\in C^{(n-r)\times(m-r)}
W∈C(n−r)×(m−r)
是任意的.
减号逆性质 A ∈ C m × n , A − A\in C^{m\times n}, A^- A∈Cm×n,A−:
- A A A 可逆时减号逆唯一.
- r a n k ( A ) ≤ r a n k ( A − ) rank(A)\leq rank(A^-) rank(A)≤rank(A−) ( A − ∼ [ I r U V W ] A^-\sim\begin{bmatrix}I_r&U\\V&W\end{bmatrix} A−∼[IrVUW])
- A A − AA^- AA− 与 A − A A^-A A−A 都是幂等阵, 且 r a n k ( A ) = r a n k ( A A − ) = r a n k ( A − ) rank(A) = rank(AA^-) = rank(A^-) rank(A)=rank(AA−)=rank(A−)
- R ( A A − ) = R ( A ) R(AA^-)=R(A) R(AA−)=R(A), N ( A − A ) = N ( A ) N(A^-A)=N(A) N(A−A)=N(A)
减号逆求法
目标: 求 A ∈ C m × n A\in C^{m\times n} A∈Cm×n 的减号逆 A − ∈ C n × m A^-\in C^{n\times m} A−∈Cn×m
- 构造增广矩阵
[ A I I 0 ] \left[\begin{array}{c:c} A&I\\ \hdashline I&0 \end{array}\right] [AII0] - 对该增广矩阵先进行行初等变换得到最简形; 再进行列初等变换, 至最简形每一行只有最左侧一个"1", 即
A
A
A 转换为
[
I
r
0
0
0
]
\begin{bmatrix}I_r&0\\0&0\end{bmatrix}
[Ir000] , 此时增广矩阵即为:
[ ( I r 0 0 0 ) P Q 0 ] \left[\begin{array}{c:c} \begin{pmatrix}I_r&0\\0&0\end{pmatrix}&P\\ \hdashline Q&0 \end{array}\right] ⎣⎡(Ir000)QP0⎦⎤ - 由上述增广矩阵得到 P , Q P,Q P,Q, 取大小符合的任意 U , V , W U,V,W U,V,W 构成 [ I r U V W ] n × m \begin{bmatrix}I_r&U\\V&W\end{bmatrix}_{n\times m} [IrVUW]n×m
减号逆求解线性方程组
设
A
∈
C
m
×
n
,
A
−
∈
A
{
1
}
A\in C^{m\times n}, A^-\in A\{1\}
A∈Cm×n,A−∈A{1}. 若
A
m
×
n
X
n
=
b
m
A_{m\times n}X_n = b_m
Am×nXn=bm 有解, 则其通解可表示为:
X
=
A
−
b
+
(
I
n
−
A
−
A
)
z
X=A^-b+(I_n-A^-A)z
X=A−b+(In−A−A)z,
z
∈
C
n
z\in C^n
z∈Cn 任意.
(
A
−
b
A^-b
A−b 为
A
X
=
b
AX=b
AX=b 特解,
(
I
n
−
A
−
A
)
z
(I_n-A^-A)z
(In−A−A)z 为
A
x
=
0
Ax=0
Ax=0 通解)
M-P 广义逆(加号广义逆)
Def 4.3’ 加号逆: 设矩阵
A
∈
C
m
×
n
A\in C^{m\times n}
A∈Cm×n, 若
∃
G
∈
C
n
×
m
\exists G\in C^{n\times m}
∃G∈Cn×m 使得:
A
G
A
=
A
AGA = A
AGA=A
G
A
G
=
G
GAG = G
GAG=G
(
A
G
)
H
=
A
G
(AG)^H = AG
(AG)H=AG
(
G
A
)
H
=
G
A
(GA)^H = GA
(GA)H=GA
则称
G
G
G 为
A
A
A 的 M-P 广义逆(加号逆), 记为
G
=
A
+
G=A^+
G=A+.
矩阵的加号逆存在且唯一.
加号逆性质 A ∈ C m × n , A + A\in C^{m\times n}, A^+ A∈Cm×n,A+:
- ( A + ) + = A (A^+)^+=A (A+)+=A
- ( A + ) H = ( A H ) + (A^+)^H=(A^H)^+ (A+)H=(AH)+
- ( λ A ) + = λ + A + (\lambda A)^+=\lambda^+A^+ (λA)+=λ+A+, 其中 λ + = { 1 λ , λ ≠ 0 0 , λ = 0 \lambda^+=\begin{cases}\frac{1}{\lambda},&\lambda\neq0\\0,&\lambda=0\end{cases} λ+={λ1,0,λ=0λ=0
-
A
A
A 列满秩:
A
+
=
(
A
H
A
)
−
1
A
H
A^+=(A^HA)^{-1}A^H
A+=(AHA)−1AH (左逆的特殊解)
A A A 行满秩: A + = A H ( A A H ) − 1 A^+=A^H(AA^H)^{-1} A+=AH(AAH)−1 (右逆的特殊解) - A A A 有满秩分解: A = B C A=BC A=BC, 则 A + = C + B + \pmb{A^+=C^+B^+} A+=C+B+A+=C+B+A+=C+B+
- r a n k ( A ) = r a n k ( A + ) = r a n k ( A A + ) = r a n k ( A + A ) rank(A)=rank(A^+)=rank(AA^+)=rank(A^+A) rank(A)=rank(A+)=rank(AA+)=rank(A+A)
加号逆求法
目标: 求 A ∈ C m × n A\in C^{m\times n} A∈Cm×n 的加号逆 A + ∈ C n × m A^+\in C^{n\times m} A+∈Cn×m
法一:
- 对 A A A 进行满秩分解, 得到列满秩和行满秩的 B , C B,C B,C
- 利用左右逆的特殊解求 B , C B,C B,C 的加号逆: B + = ( B H B ) − 1 B H B^+=(B^HB)^{-1}B^H B+=(BHB)−1BH, C + = C H ( C C H ) − 1 C^+=C^H(CC^H)^{-1} C+=CH(CCH)−1
- 求得 A A A 的加号逆 A + = C + B + A^+=C^+B^+ A+=C+B+
法二:
- 对 A A A 进行奇异值分解, 得 A = U m × m [ Δ 0 0 0 ] m × n V n × n H A=U_{m\times m}\begin{bmatrix}\Delta&0\\0&0\end{bmatrix}_{m\times n}V^H_{n\times n} A=Um×m[Δ000]m×nVn×nH
- 则矩阵加号逆:
A + = V [ Δ − 1 0 0 0 ] n × m U H A^+=V\begin{bmatrix}\Delta^{-1}&0\\0&0\end{bmatrix}_{n\times m}U^H A+=V[Δ−1000]n×mUH
特殊矩阵的加号逆:
- [ 0 ] m × n + = [ 0 ] n × m [0]_{m\times n}^+=[0]_{n\times m} [0]m×n+=[0]n×m
- [ a ] + = [ 1 a ] [a]^+=[\frac{1}{a}] [a]+=[a1]
- d i a g ( λ 1 , . . . , λ n ) + = d i a g ( λ 1 + , . . . , λ n + ) diag(\lambda_1,...,\lambda_n)^+=diag(\lambda_1^+,...,\lambda_n^+) diag(λ1,...,λn)+=diag(λ1+,...,λn+)
- 非零向量 x = ( x 1 , . . . , x n ) T x=(x_1,...,x_n)^T x=(x1,...,xn)T, x + = x H ∣ ∣ x ∣ ∣ 2 x^+=\frac{x^H}{||x||^2} x+=∣∣x∣∣2xH
4.3 投影变换
投影变换 投影矩阵
Def’ 4.4: 设 C n = L ⊕ M C^n =L\oplus M Cn=L⊕M, 向量 x ∈ C n x\in C^n x∈Cn, x = y + z , y ∈ L , z ∈ M x = y + z, y\in L, z\in M x=y+z,y∈L,z∈M, 如果线性变换 σ : C n → C n \sigma:C^n\rightarrow C^n σ:Cn→Cn, σ ( x ) = y \sigma(x) = y σ(x)=y, 则称 σ \sigma σ 为从 C n C^n Cn 沿子空间 M M M 到子空间 L L L ( y ∈ L y\in L y∈L)的投影变换. 投影变换在 C n C^n Cn 空间的一组基下的矩阵称为投影矩阵.
C n = R ( σ ) ⊕ N ( σ ) C^n=R(\sigma)\oplus N(\sigma) Cn=R(σ)⊕N(σ)
- R ( σ ) = L R(\sigma)=L R(σ)=L: 像空间
- N ( σ ) = M N(\sigma)=M N(σ)=M: 核空间
C n C^n Cn 上线性变换 σ \sigma σ 是投影变换 ⟺ σ \sigma σ 是幂等变换 ⟺ 变换矩阵在某组基下是幂等矩阵 A 2 = A A^2=A A2=A
自然基下投影矩阵求法:
到
L
L
L 的投影矩阵:
A
=
(
B
∣
0
)
(
B
∣
C
)
−
1
A=(B|0)(B|C)^{-1}
A=(B∣0)(B∣C)−1
到
M
M
M 的投影矩阵:
A
~
=
I
n
−
A
\tilde{A}=I_n-A
A~=In−A
- B B B: 空间 L L L 的基构成的矩阵
- C C C: 空间 M M M 的基构成的矩阵
正交投影变换
Def’ 4.5: σ \sigma σ 是 C n C^n Cn 上投影变换 C n = R ( σ ) ⊕ N ( σ ) C^n=R(\sigma)\oplus N(\sigma) Cn=R(σ)⊕N(σ). 若 R ( σ ) R(\sigma) R(σ) 正交补子空间 R ( σ ) ⊥ = N ( σ ) R(\sigma)^\perp=N(\sigma) R(σ)⊥=N(σ), 则 σ \sigma σ 是正交投影变换.
C n C^n Cn 上线性变换 σ \sigma σ 是正交投影变换 ⟺ 变换矩阵在某组基下是幂等 Hermite 矩阵 A 2 = A , A H = A A^2=A, A^H=A A2=A,AH=A
正交投影变换(向量)表示: P ( x ) = x − ( x , u ) u P(x)=x-(x,u)u P(x)=x−(x,u)u, u u u 为投影平面的法向
自然基下正交投影矩阵求法:
B
H
C
=
0
B^HC=0
BHC=0
到
L
L
L 的投影矩阵:
A
=
(
B
∣
0
)
(
B
∣
C
)
−
1
=
B
(
B
H
B
)
−
1
B
H
A=(B|0)(B|C)^{-1}=B(B^HB)^{-1}B^H
A=(B∣0)(B∣C)−1=B(BHB)−1BH
到
M
M
M 的投影矩阵:
A
~
=
I
n
−
A
=
C
(
C
H
C
)
−
1
C
H
\tilde{A}=I_n-A=C(C^HC)^{-1}C^H
A~=In−A=C(CHC)−1CH
- B B B: 空间 L L L 的基构成的矩阵
- C C C: 空间 M M M 的基构成的矩阵
正交投影变换性质:
Th 4.16: 设
W
W
W 是
C
n
C^n
Cn 的子空间,
x
0
∈
C
n
,
x
0
∈
W
x_0\in C^n, x_0\in W
x0∈Cn,x0∈W, 如果
σ
\sigma
σ 是空间
C
n
C^n
Cn 向空间
W
W
W 的正交投影, 则:
∣
∣
σ
(
x
0
)
−
x
0
∣
∣
≤
∣
∣
y
−
x
0
∣
∣
,
∀
y
∈
W
||\sigma(x_0)-x_0||\leq||y-x_0||,\forall y\in W
∣∣σ(x0)−x0∣∣≤∣∣y−x0∣∣,∀y∈W
含义: 点
σ
(
x
0
)
\sigma(x_0)
σ(x0) 是空间
W
W
W 中与点
x
0
x_0
x0 距离最近的点
正交投影与 A + A A^+A A+A A A + AA^+ AA+
Th 4.15:
A
∈
C
m
×
n
A\in C^{m\times n}
A∈Cm×n
A
+
A
∈
C
n
×
n
A^+A\in C^{n\times n}
A+A∈Cn×n 性质:
- ( A + A ) 2 = A + A , ( A + A ) H = A + A (A^+A)^2=A^+A, (A^+A)^H=A^+A (A+A)2=A+A,(A+A)H=A+A
-
{
C
n
=
R
(
A
+
)
⊕
N
(
A
)
R
(
A
+
)
⊥
=
N
(
A
)
\begin{cases}C^n=R(A^+)\oplus N(A)\\R(A^+)^\perp=N(A)\end{cases}
{Cn=R(A+)⊕N(A)R(A+)⊥=N(A)
{ C n = R ( A + A ) ⊕ N ( A + A ) R ( A + A ) = R ( A + ) , N ( A + A ) = N ( A ) \begin{cases}C^n=R(A^+A)\oplus N(A^+A)\\R(A^+A)=R(A^+),N(A^+A)=N(A)\end{cases} {Cn=R(A+A)⊕N(A+A)R(A+A)=R(A+),N(A+A)=N(A)
含义: A + A A^+A A+A 是正交投影, 它将向量 x x x 投影到空间 R ( A + ) R(A+) R(A+) 中
A A + ∈ C m × m AA^+\in C^{m\times m} AA+∈Cm×m 性质:
- ( A A + ) 2 = A A + , ( A + A ) H = A A + (AA^+)^2=AA^+, (A^+A)^H=AA^+ (AA+)2=AA+,(A+A)H=AA+
-
{
C
m
=
R
(
A
)
⊕
N
(
A
+
)
R
(
A
)
⊥
=
N
(
A
+
)
\begin{cases}C^m=R(A)\oplus N(A^+)\\R(A)^\perp=N(A^+)\end{cases}
{Cm=R(A)⊕N(A+)R(A)⊥=N(A+)
{ C m = R ( A A + ) ⊕ N ( A A + ) R ( A A + ) = R ( A ) , N ( A A + ) = N ( A + ) \begin{cases}C^m=R(AA^+)\oplus N(AA^+)\\R(AA^+)=R(A),N(AA^+)=N(A^+)\end{cases} {Cm=R(AA+)⊕N(AA+)R(AA+)=R(A),N(AA+)=N(A+)
含义: A A + AA^+ AA+ 是正交投影, 它将向量 x x x 投影到空间 R ( A ) R(A) R(A) 中
4.4 最佳的最小二乘解
最小二乘解 最佳最小二乘解
A
∈
C
m
×
n
,
b
∈
C
m
A\in C^{m\times n}, b\in C^m
A∈Cm×n,b∈Cm
最小二乘解
u
∈
C
n
u\in C^n
u∈Cn ⟺
∣
∣
A
u
−
b
∣
∣
≤
∣
∣
A
x
−
b
∣
∣
,
∀
x
∈
C
n
||Au-b||\leq||Ax-b||,\forall x\in C^n
∣∣Au−b∣∣≤∣∣Ax−b∣∣,∀x∈Cn
最佳最小二乘解
x
0
∈
C
n
x_0\in C^n
x0∈Cn ⟺
∣
∣
x
0
∣
∣
2
≤
∣
∣
u
∣
∣
2
||x_0||_2\leq||u||_2
∣∣x0∣∣2≤∣∣u∣∣2
A x = b Ax=b Ax=b 最佳最小二乘解
有解性判断:
A
m
×
n
x
n
=
b
m
A_{m\times n}x_n=b_m
Am×nxn=bm
- 有解 ⟺ b ∈ R ( A ) b\in R(A) b∈R(A)
- 无解 ⟺ b ∉ R ( A ) b\not\in R(A) b∈R(A)
x 0 = A + b x^0=A^+b x0=A+b 是 A m × n x n = b m A_{m\times n}x_n=b_m Am×nxn=bm 的最佳最小二乘解.
最佳拟合曲线
利用数据
(
x
1
,
y
1
)
,
.
.
.
(
x
n
,
y
n
)
(x_1,y_1),...(x_n,y_n)
(x1,y1),...(xn,yn)使具有两个参数
β
1
,
β
2
\beta_1,\beta_2
β1,β2 的经验公式
f
(
x
,
y
)
f(x,y)
f(x,y) 误差最小
方法:
- 根据经验公式
f
(
x
,
y
)
f(x,y)
f(x,y) 并代入数据构造矩阵方程
[ x 1 y 1 ⋯ ⋯ x n y n ] [ β 1 β 2 ] = [ ⋯ ] \begin{bmatrix} x_1&y_1\\ \cdots&\cdots\\ x_n&y_n \end{bmatrix}\begin{bmatrix} \beta_1\\ \beta_2 \end{bmatrix}=\begin{bmatrix} \\ \cdots\\ \\ \end{bmatrix} ⎣⎡x1⋯xny1⋯yn⎦⎤[β1β2]=⎣⎡⋯⎦⎤ - 求 A x = b Ax=b Ax=b 的最佳最小二乘解 A + b A^+b A+b 确定 β 1 , β 2 \beta_1,\beta_2 β1,β2
- 误差即 ∣ ∣ A β − b ∣ ∣ 2 ||A\beta-b||_2 ∣∣Aβ−b∣∣2