前言
《线性空间》定义了空间,这章节来研究空间与空间的关联性
函数
函数是一个规则或映射,将一个集合中的每个元素(称为自变量)映射到另一个集合中的唯一元素(称为因变量)。
一般函数从 “A” 的每个元素指向 “B” 的一个函数
它不会有一个 “A” 的元素指向多于一个 “B” 的元素,所以一对多在函数是不允许的(“f(x) = 7 或 9” 是不允许的)
但多于一个 “A” 的元素可以指向同一个 “B” 的元素(多对一是允许的)
- 单射的意思是 “A” 的每个元素都有 它独有的在 “B” 的相对元素。单射也称为 “一对一”。但可以有些 “B” 的元素没有相对的 “A” 的元素。单射存在可逆函数,使得B对A单射
- 满射,每个(所有) “B” 的元素都有至少一个相对的 “A” 的元素(可能多于一个)。
- 双射,单射和满射都成立。
线性空间的同构
- 同构映射具有反身性、对称性与传递性。
- 内积空间同构,还需要满足内积不变, ∀ α , β ∈ V , 有 ( σ ( α ) , σ ( β ) ) = ( α , β ) \forall \alpha,\beta \in V, 有(\sigma(\alpha),\sigma(\beta)) = (\alpha, \beta) ∀α,β∈V,有(σ(α),σ(β))=(α,β)
使用单射,满射满足性线空间性质的称为同态(了解下)
线性变换
把上述同构定义中的 V ′ V' V′换成 V V V,即 V V V空间通过双射函数到 V V V空间的映射。称为“自同构”。如果是“单射”或者“满射”函数映射,则称为“自同态”。也称叫“线性变换”。
线性变换(linear transformation)是线性空间V到其自身的线性映射
线性变换的矩阵
从公式可得,因为最终值是不变的,如果基组选取不同,A矩阵会变动
线性变换不同基下的矩阵
由上面的关系式可以看出,若选定不同的基,则同一个线性变换在不同基下面的矩阵是不同的,但是这两个矩阵之间存在着一种特殊的关系
矩阵
A
A
A和矩阵
B
B
B 之间的这种关系为相似关系,即同一个线性变换在不同基下的矩阵是相似的。即有相似矩阵的性质
矩阵的相似对角化
上面讲述了线性变换在不同基下的矩阵之间的关系,知道了线性变换在不同基下的矩阵是相似的。进而我们可以通过选取不同的基,使得线性变换在这组基下的矩阵的形式最简单,由于对角矩阵具有良好的性质,因此我们希望通过选取合适的基,使得线性变换在这组基下的矩阵是对角矩阵。怎么找到对角矩阵
Λ
\Lambda
Λ?
Λ
=
P
−
1
A
P
\Lambda = P^{-1}AP
Λ=P−1AP
A是已知
φ
\varphi
φ,问题等价于寻找一个可逆矩阵P
反过来,若
A
A
A是可相似对角化,那么
A
A
A是否有n个线性无关的特征向量呢?
综上,矩阵
A
A
A可相似对角化的充分必要条件是矩阵
A
A
A有n个线性无关的特征向量
求相似对角化矩阵
- 已知: Λ = P − 1 A P , { ε } P = { η } \Lambda = P^{-1}AP, \{\varepsilon\}P = \{\eta\} Λ=P−1AP,{ε}P={η}, P是过渡矩阵
- 假设 { ε } \{\varepsilon\} {ε}是欧式空间的标准正交基组,已矩阵A
- 验证充分必要条件:矩阵 A A A有n个线性无关的特征向量
- 将n个线性无关的特征向量,组建新的基组{ β \beta β}
- 为了更方便的计算,我们将基组{ β \beta β},施密特正交化,求出标准正交基本组{ η \eta η}
- 根据 { ε } P = { η } \{\varepsilon\}P = \{\eta\} {ε}P={η}得 P = { η } P=\{\eta\} P={η}
- 代入公式 Λ = P − 1 A P \Lambda = P^{-1}AP Λ=P−1AP,得对角矩阵 Λ \Lambda Λ
具体计算过程:实对称矩阵的对角化
对于n维线性空间V上的线性变换A,如果能够找到一个基{ a 1 , a 2 , . . . a n a_1,a_2,...a_n a1,a2,...an}使得在此基下的矩阵A是对角矩阵,那么称A是可对角化。但是如果A不能对角化呢?我们便退而求其次,找到一个基{ a 1 , a 2 , . . . a n a_1,a_2,...a_n a1,a2,...an}使得在此基下的矩阵A是分块对角矩阵。
不变子空间
A
\Alpha
A是线性变换
- Im A \operatorname{Im} A ImA 是指线性变换 A 的值域(Image),也被称为像空间或范围。它表示所有通过该线性变换 A 映射到的向量的集合。
- Ker A \operatorname{Ker} A KerA是指线性变换A的核空间(Kernel),也被称为零空间(Null Space)。它表示所有在该线性变换下映射到零向量的向量的集合。
- A的特征子空间(Eigenspace)是指在线性变换A下与给定特征值 λ {\lambda} λ相对应的所有特征向量构成的子空间 V λ {V_\lambda} Vλ。
一些重要不变子空间
-
Im A \operatorname{Im} A ImA或V空间本身
- 任取 a ∈ V , A a ∈ V a \in V, Aa \in V a∈V,Aa∈V
- A a ∈ Im A , A ( A a ) ∈ Im A Aa \in \operatorname{Im} A, A(Aa) \in \operatorname{Im} A Aa∈ImA,A(Aa)∈ImA
-
Ker A \operatorname{Ker} A KerA或0空间
-
A的特征子空间
假设V在A线性变化下,有一特征值为 λ {\lambda} λ,对应特征向量组成的空间为A的特征子空间,记 V λ {V_\lambda} Vλ.
- 任取 a ∈ V λ , A a = λ a ∈ V λ a \in V_{\lambda},Aa=\lambda a \in V_{\lambda} a∈Vλ,Aa=λa∈Vλ
-
设B也是V上的线性变换,如果A和B可交换,那么 Im B , Ker B , B \operatorname{Im} B,\operatorname{Ker} B,B ImB,KerB,B的特征子空间 是A-子空间
-
V上的线性变换A的不变子空间的和与交仍是A的不变子空间.
- a ∈ A 1 − , b ∈ A 2 − , a + b ∈ A 1 − ⊕ A 2 − a \in A_1-, b \in A_2-, a+b \in A_1- \oplus A_2- a∈A1−,b∈A2−,a+b∈A1−⊕A2−
- A ( a + b ) = A a + A b ∈ A − ⊕ B − A(a+b) = Aa + Ab \in A- \oplus B- A(a+b)=Aa+Ab∈A−⊕B−
线性变换在不变子空间上的限制
不变子空间与线性变换的矩阵化简
把基本不变子空间W分成
(
ε
w
,
ε
o
t
h
r
e
r
)
(\varepsilon_w,\varepsilon_{othrer})
(εw,εothrer),又因为
A
1
A_1
A1是W的线性变化,在
ε
w
\varepsilon_w
εw下必是
ε
w
A
1
\varepsilon_wA_1
εwA1.即当仅仅当矩阵满足以下形状
(
A
1
A
2
0
A
3
)
\begin{pmatrix} A_1 & A_2\\ 0 & A_{3} \end{pmatrix}
(A10A2A3)
才能满足需求。
即:V的线性变换A可分块对角矩阵化的充要条件是 V可分解为A的不变子空间的直和
Hamilton-Cayley定理与值和分解
即将特征多项式
f
(
λ
)
=
|
λ
I
−
A
∣
f(\lambda)=|\lambda I-A|
f(λ)=|λI−A∣
再根据多项式因式分解得
f
(
λ
)
=
f
1
(
λ
)
f
2
(
λ
)
.
.
.
f
n
(
λ
)
=
0
f(\lambda)=f_1(\lambda)f_2(\lambda)...f_n(\lambda) = 0
f(λ)=f1(λ)f2(λ)...fn(λ)=0
其中
f
1
(
λ
)
f
2
(
λ
)
.
.
.
f
n
(
λ
)
f_1(\lambda)f_2(\lambda)...f_n(\lambda)
f1(λ)f2(λ)...fn(λ)互为素数
V
=
Ker
f
(
λ
)
=
Ker
f
1
(
λ
)
⨁
Ker
f
2
(
λ
)
⨁
.
.
.
⨁
Ker
f
n
(
λ
)
V=\operatorname{Ker}f(\lambda)=\operatorname{Ker}f_1(\lambda) \bigoplus \operatorname{Ker}f_2(\lambda)\bigoplus...\bigoplus\operatorname{Ker}f_n(\lambda)
V=Kerf(λ)=Kerf1(λ)⨁Kerf2(λ)⨁...⨁Kerfn(λ)
将
f
(
λ
)
f(\lambda)
f(λ)进一步分解
f
(
λ
)
=
(
λ
−
λ
1
)
r
1
(
λ
−
λ
2
)
r
2
.
.
.
(
λ
−
λ
n
)
r
n
f(\lambda)=(\lambda-\lambda_1)^{r_1}(\lambda-\lambda_2)^{r_2}...(\lambda-\lambda_n)^{r_n}
f(λ)=(λ−λ1)r1(λ−λ2)r2...(λ−λn)rn
再线性变换A代入得
V
=
Ker
(
(
A
−
λ
1
I
)
r
1
)
⨁
Ker
(
(
A
−
λ
2
I
)
r
2
)
⨁
.
.
.
⨁
Ker
(
(
A
−
λ
n
I
)
r
n
)
V=\operatorname{Ker}((A-\lambda_1 I)^{r_1}) \bigoplus \operatorname{Ker}((A-\lambda_2I)^{r_2})\bigoplus...\bigoplus\operatorname{Ker}((A-\lambda_n I)^{r_n})
V=Ker((A−λ1I)r1)⨁Ker((A−λ2I)r2)⨁...⨁Ker((A−λnI)rn)
其中 Ker ( ( A − λ n I ) r n ) , n = 1 , 2... s \operatorname{Ker}((A-\lambda_n I)^{r_n}), n=1,2...s Ker((A−λnI)rn),n=1,2...s,称为根子空间
特征值 λ \lambda λ使用降维的作用,如果不能直接降,可以让 λ \lambda λ旋转来降维,即用线性变化A来代替特征值
主要参考
《单射、满射和双射》
《高等代数】线性空间的同构》
《线性同构与欧氏空间同构》
《什么是矩阵对角化》
《浅谈线性变换和矩阵之间的关系》
《浅谈矩阵的相似对角化(一)》
《线性代数(实对称矩阵的对角化)》
《不变子空间》
《【高等代数(丘维声著)笔记】6.8线性变换的不变子空间》