6.2 算子范数
6.2.1 定义
C n C^n Cn 上任一向量范数 ∥ X ∥ V \Vert X\Vert_V ∥X∥V 都产生一个矩阵范数 ∥ A ∥ = max x ≠ 0 { ∥ A X ∥ V ∥ X ∥ V } \Vert A\Vert=\max_{x\neq 0}\limits \{\frac{\Vert AX\Vert_V}{\Vert X\Vert_V}\} ∥A∥=x=0max{∥X∥V∥AX∥V} , X ∈ C n X\in C^n X∈Cn ,且有相容关系 ∥ A X ∥ V ≤ ∥ A ∥ ⋅ ∥ X ∥ V \Vert AX\Vert_V\le \Vert A\Vert\cdot \Vert X\Vert_V ∥AX∥V≤∥A∥⋅∥X∥V ,这种范数 ∥ A ∥ \Vert A\Vert ∥A∥为算子范数
向量范数生成的矩阵范数
- 若存在常数 M,使 ∀ X ∈ C n \forall X\in C^n ∀X∈Cn ,有 ∥ A X ∥ V ≤ M ∥ X ∥ V \Vert AX\Vert_V\le M\Vert X\Vert_V ∥AX∥V≤M∥X∥V ,则 ∥ A ∥ ≤ M \Vert A\Vert\le M ∥A∥≤M ,即 ∥ X ∥ V \Vert X\Vert_V ∥X∥V 的算子范数是使上述不等式成立的最小范数
a. 证明算子范数是范数
矩阵范数与向量范数相容性:
∥ A ∥ = max X ≠ 0 { ∥ A X ∥ V ∥ X ∥ V } ⇒ ∥ A X ∥ V ∥ X ∥ V ≤ max X ≠ 0 { ∥ A X ∥ V ∥ X ∥ V } = ∥ A ∥ ⇒ ∥ A X ∥ V ≤ ∥ A ∥ ⋅ ∥ X ∥ V \begin{aligned} &\Vert A\Vert=\max_{X\neq 0}\{\frac{\Vert AX\Vert_V}{\Vert X\Vert_V}\}\Rightarrow \frac{\Vert AX\Vert_V}{\Vert X\Vert_V}\le \max_{X\neq 0}\{\frac{\Vert AX\Vert_V}{\Vert X\Vert_V}\}=\Vert A\Vert\\ &\Rightarrow \Vert AX\Vert_V\le \Vert A\Vert\cdot \Vert X\Vert_V \end{aligned} ∥A∥=X=0max{∥X∥V∥AX∥V}⇒∥X∥V∥AX∥V≤X=0max{∥X∥V∥AX∥V}=∥A∥⇒∥AX∥V≤∥A∥⋅∥X∥V
- 由于 ∥ A X ∥ V \Vert AX\Vert_V ∥AX∥V 是X各分量的连续函数,故在有界闭集 ∥ X ∥ V \Vert X\Vert_V ∥X∥V 上可取最大值,因此上述定义是有意义的,即存在 X 0 X_0 X0 使 max ∥ X ∥ V = 1 ∥ A X ∥ V = ∥ A X 0 ∥ V \max_{\Vert X\Vert_V=1}\limits \Vert AX\Vert_V=\Vert AX_0\Vert_V ∥X∥V=1max∥AX∥V=∥AX0∥V ,在 X 0 X_0 X0 处取最大值
6.2.2 常见算子范数
设 A = ( a i j ) ∈ C n . n , X ∈ C n A=\left(a_{ij}\right)\in C^{n.n},X\in C^n A=(aij)∈Cn.n,X∈Cn ,则向量范数 ∥ X ∥ 1 , ∥ X ∥ 2 , ∥ X ∥ ∞ \Vert X\Vert_1,\Vert X\Vert_2,\Vert X\Vert_\infty ∥X∥1,∥X∥2,∥X∥∞ 产生的算子范数为:
- ∥ X ∥ 1 \Vert X\Vert_1 ∥X∥1 产生 ∥ A ∥ 1 = max 1 ≤ j ≤ n ∑ i = 1 n ∣ a i j ∣ \Vert A\Vert_1=\max_{1\le j\le n}\limits \sum_{i=1}\limits^n\vert a_{ij}\vert ∥A∥1=1≤j≤nmaxi=1∑n∣aij∣ (列范数),且 ∥ A X ∥ 1 ≤ ∥ A ∥ 1 ⋅ ∥ X ∥ 1 \Vert AX\Vert_1\le \Vert A\Vert_1\cdot \Vert X\Vert_1 ∥AX∥1≤∥A∥1⋅∥X∥1
- ∥ X ∥ 2 \Vert X\Vert_2 ∥X∥2 产生 ∥ A ∥ 2 = λ 1 , λ 1 为 A H A \Vert A\Vert_2=\sqrt{\lambda_1} ,\lambda_1为A^HA ∥A∥2=λ1,λ1为AHA 的最大特征值(谱范数),且 ∥ A X ∥ 2 ≤ ∥ A ∥ 2 ⋅ ∥ X ∥ 2 \Vert AX\Vert_2 \le \Vert A\Vert_2\cdot \Vert X\Vert_2 ∥AX∥2≤∥A∥2⋅∥X∥2
- ∥ X ∥ ∞ \Vert X\Vert_\infty ∥X∥∞ 产生 ∥ A ∥ ∞ = max i = 1 ∑ j = 1 n ∣ a i j ∣ \Vert A\Vert_\infty =\max_{i=1}\limits\sum_{j=1}\limits^n\vert a_{ij}\vert ∥A∥∞=i=1maxj=1∑n∣aij∣ (行范数),且 ∥ A X ∥ ∞ ≤ ∥ A ∥ ∞ ⋅ ∥ X ∥ ∞ \Vert AX\Vert_\infty\le \Vert A\Vert_\infty\cdot \Vert X\Vert_\infty ∥AX∥∞≤∥A∥∞⋅∥X∥∞
a. 必要条件
任一矩阵范数 ∥ I ∥ ≥ 1 \Vert I\Vert \ge 1 ∥I∥≥1
-
任一算子范数必有 ∥ I ∥ = 1 \Vert I\Vert=1 ∥I∥=1
由公式 ∥ A ∥ = max x ≠ 0 { ∥ A X ∥ V ∥ X ∥ V } \Vert A\Vert=\max_{x\neq 0}\limits \{\frac{\Vert AX\Vert_V}{\Vert X\Vert_V}\} ∥A∥=x=0max{∥X∥V∥AX∥V} ,可知 ∥ I ∥ = max X ≠ 0 { ∥ I X ∣ V ∥ X ∥ V } = 1 \Vert I\Vert=\max_{X\neq 0}\limits \{\frac{\Vert IX\vert_V}{\Vert X\Vert_V}\}=1 ∥I∥=X=0max{∥X∥V∥IX∣V}=1
-
若某个 ∥ I ∥ ∗ > 1 \Vert I\Vert_*>1 ∥I∥∗>1 ,则 ∥ ∙ ∥ ∗ \Vert \bullet\Vert_* ∥∙∥∗ 不是算子范数
eg
可见 ∥ A ∥ F \Vert A\Vert_F ∥A∥F 与 ∥ x ∥ 2 \Vert x\Vert_2 ∥x∥2 是相容的,而 ∥ A ∥ 2 \Vert A\Vert_2 ∥A∥2 作为 ∥ x ∥ 2 \Vert x\Vert_2 ∥x∥2 的算子范数是相容的,但与 ∥ A ∥ F \Vert A\Vert_F ∥A∥F 不同
- ∥ A ∥ 2 ≤ ∥ A ∥ F \Vert A\Vert_2\le \Vert A\Vert_F ∥A∥2≤∥A∥F ,即 ∥ X ∥ V \Vert X\Vert_V ∥X∥V 的算子范数是使 ∥ A ∥ ≤ ∥ A X ∥ V ∥ X ∥ V \Vert A\Vert\le \frac{\Vert AX\Vert_V}{\Vert X\Vert_V} ∥A∥≤∥X∥V∥AX∥V 成立的最小范数
6.2.3 算子范数判断矩阵级数收敛
a. 矩阵级数收敛定义
∑ k = 0 ∞ A k = A 0 + A 1 + ⋯ + A k + ⋯ 收敛于 A ⟺ lim k → ∞ ( A 0 + A 1 + ⋯ + A k ) = A 其中 A k ∈ C n , n , 记为 ∑ k = 0 ∞ A k = A 0 + A 1 + ⋯ + A k = A \begin{aligned} &\sum_{k=0}^{\infty}A_k=A_0+A_1+\cdots+A_k+\cdots收敛于A\iff \lim_{k\rightarrow \infty}(A_0+A_1+\cdots+A_k)=A\\ &其中A_k\in C^{n,n},记为 \sum_{k=0}^\infty A_k=A_0+A_1+\cdots+A_k=A \end{aligned} k=0∑∞Ak=A0+A1+⋯+Ak+⋯收敛于A⟺k→∞lim(A0+A1+⋯+Ak)=A其中Ak∈Cn,n,记为k=0∑∞Ak=A0+A1+⋯+Ak=A
绝对收敛本身必收敛 : 若 ∑ k = 0 ∞ ∥ A k ∥ = ∥ A 0 ∥ + ∥ A 1 ∥ + ⋯ + ∥ A k ∥ + ⋯ \sum_{k=0}\limits^\infty \Vert A_k\Vert=\Vert A_0\Vert+\Vert A_1\Vert+\cdots+\Vert A_k\Vert+\cdots k=0∑∞∥Ak∥=∥A0∥+∥A1∥+⋯+∥Ak∥+⋯ 收敛,则 ∑ k = 0 ∞ A k \sum_{k=0}\limits^\infty A_k k=0∑∞Ak 收敛
-
若某个范数 ∥ A ∥ < 1 \Vert A\Vert<1 ∥A∥<1 ,则 ∑ k = 0 ∞ A k \sum_{k=0}\limits^{\infty}A^k k=0∑∞Ak 绝对收敛
证明:
∥ A ∥ < 1 ⇒ ∥ A k ∥ ≤ ∥ A ∥ k 且 ∑ k = 0 ∞ ∥ A ∥ k = ∥ I ∥ I − ∥ A ∥ ( 绝对收敛 ) \begin{aligned} &\Vert A\Vert<1\Rightarrow \Vert A^k\Vert\le \Vert A\Vert^k且 \sum_{k=0}^{\infty}\Vert A\Vert^k=\frac{\Vert I\Vert}{I-\Vert A\Vert}(绝对收敛) \end{aligned} ∥A∥<1⇒∥Ak∥≤∥A∥k且k=0∑∞∥A∥k=I−∥A∥∥I∥(绝对收敛) -
ρ ( A ) < 1 ⇒ ∑ k = 0 ∞ A k \rho(A)<1\Rightarrow\sum_{k=0}\limits^{\infty}A^k ρ(A)<1⇒k=0∑∞Ak 绝对收敛
ρ ( A ) < 1 ⇒ 某范数 ∥ A ∥ < 1 ⇒ ∑ k = 0 ∞ A k 绝对收敛 \rho(A)<1\Rightarrow 某范数 \Vert A\Vert<1\Rightarrow \sum_{k=0}^{\infty}A^k绝对收敛 ρ(A)<1⇒某范数∥A∥<1⇒k=0∑∞Ak绝对收敛
**若 ρ ( A ) < 1 \rho(A)<1 ρ(A)<1 ,则 ∑ k = 0 ∞ A k = ( I − A ) − 1 \sum_{k=0}^{\infty}\limits A^k=(I-A)^{-1} k=0∑∞Ak=(I−A)−1 **
证明:
(
I
−
A
)
(
I
+
A
+
⋯
+
A
k
+
⋯
)
=
I
(
I
+
A
+
⋯
+
A
k
+
⋯
)
−
A
(
I
+
A
+
⋯
+
A
k
+
⋯
)
=
(
I
+
A
+
⋯
+
A
k
+
⋯
)
−
(
A
+
⋯
+
A
k
+
⋯
)
=
I
∴
(
I
−
A
)
−
1
=
∑
k
=
0
∞
A
k
=
I
+
A
+
⋯
+
A
k
+
⋯
\begin{aligned} &(I-A)(I+A+\cdots+A^k+\cdots)=I(I+A+\cdots+A^k+\cdots)-A(I+A+\cdots+A^k+\cdots)\\ &=(I+A+\cdots+A^k+\cdots)-(A+\cdots+A^k+\cdots)=I\\ &\therefore (I-A)^{-1}=\sum_{k=0}^\infty A^k=I+A+\cdots+A^k+\cdots \end{aligned}
(I−A)(I+A+⋯+Ak+⋯)=I(I+A+⋯+Ak+⋯)−A(I+A+⋯+Ak+⋯)=(I+A+⋯+Ak+⋯)−(A+⋯+Ak+⋯)=I∴(I−A)−1=k=0∑∞Ak=I+A+⋯+Ak+⋯
- 若 ∥ A ∥ < 1 \Vert A\Vert<1 ∥A∥<1 ,则 ∑ k = 0 ∞ A k = ( I − A ) − 1 \sum_{k=0}^{\infty}\limits A^k=(I-A)^{-1} k=0∑∞Ak=(I−A)−1
b. 幂级数收敛
设幂级数 ∑ k = 0 ∞ c k x k \sum_{k=0}^\infty\limits c_kx^k k=0∑∞ckxk 的收敛半径为 R R R ,则
- ρ ( A ) < R ⇒ ∑ k = 0 ∞ c k A k \rho(A)<R\Rightarrow \sum_{k=0}^\infty\limits c_kA^k ρ(A)<R⇒k=0∑∞ckAk 绝对收敛
- 某一范数 ∥ A ∥ < R ⇒ ∑ k = 0 ∞ c k A k \Vert A\Vert<R\Rightarrow \sum_{k=0}^\infty\limits c_kA^k ∥A∥<R⇒k=0∑∞ckAk 绝对收敛
- 若 ρ ( A ) > R \rho(A)>R ρ(A)>R ,则 ∑ k = 0 ∞ c k A k \sum_{k=0}^\infty\limits c_kA^k k=0∑∞ckAk 发散
- ρ ( A ) = R \rho(A)=R ρ(A)=R , ∑ k = 0 ∞ c k A k \sum_{k=0}^\infty\limits c_kA^k k=0∑∞ckAk 都有可能
SP:
-
e x = ∑ k = 0 ∞ 1 k ! x k e^x=\sum_{k=0}^\infty\limits \frac{1}{k!}x^k ex=k=0∑∞k!1xk ,
s i n x = ∑ k = 0 ∞ ( − 1 ) k x 2 k + 1 ( 2 k + 1 ) ! sinx=\sum_{k=0}^\infty\limits (-1)^k\frac{x^{2k+1}}{(2k+1)!} sinx=k=0∑∞(−1)k(2k+1)!x2k+1
c o s x = ∑ k = 0 ∞ ( − 1 ) k x 2 k ( 2 k ) ! cosx=\sum_{k=0}^\infty\limits (-1)^k\frac{x^{2k}}{(2k)!} cosx=k=0∑∞(−1)k(2k)!x2k 的收敛半径都是 R = + ∞ R=+\infty R=+∞ ,故任意方阵都满足收敛条件 ρ ( A ) < R \rho(A)<R ρ(A)<R
e A = ∑ k = 0 ∞ 1 k ! A k e^A=\sum_{k=0}^\infty\limits \frac{1}{k!}A^k eA=k=0∑∞k!1Ak , s i n A = ∑ k = 0 ∞ ( − 1 ) k A 2 k + 1 ( 2 k + 1 ) ! sinA=\sum_{k=0}^\infty\limits (-1)^k\frac{A^{2k+1}}{(2k+1)!} sinA=k=0∑∞(−1)k(2k+1)!A2k+1 , c o s A = ∑ k = 0 ∞ ( − 1 ) k A 2 k ( 2 k ) ! cosA=\sum_{k=0}^\infty\limits (-1)^k\frac{A^{2k}}{(2k)!} cosA=k=0∑∞(−1)k(2k)!A2k 都绝对收敛
-
l n ( 1 + x ) = ∑ k = 1 ∞ ( − 1 ) k − 1 x k k ln(1+x)=\sum_{k=1}^\infty\limits (-1)^{k-1}\frac{x^k}{k} ln(1+x)=k=1∑∞(−1)k−1kxk 的收敛半径为 r = 1 r=1 r=1 ,
( 1 − x ) − 1 = 1 + x + ⋯ + x ⋯ k (1-x)^{-1}=1+x+\cdots+x^k_\cdots (1−x)−1=1+x+⋯+x⋯k 的收敛半径 r = 1 r=1 r=1
( 1 − x ) − 2 = 1 + x + 2 x + 3 x 2 + ⋯ + k x k − 1 + ⋯ (1-x)^{-2}=1+x+2x+3x^2+\cdots+kx^{k-1}+\cdots (1−x)−2=1+x+2x+3x2+⋯+kxk−1+⋯ 的收敛半径 r = 1 r=1 r=1
l n ( I + A ) = ∑ k = 1 ∞ ( − 1 ) k − 1 A k k ln(I+A)=\sum_{k=1}^\infty\limits (-1)^{k-1}\frac{A^k}{k} ln(I+A)=k=1∑∞(−1)k−1kAk 的绝对收敛条件为 ρ ( A ) < 1 \rho(A)<1 ρ(A)<1 或 ∥ A ∥ < 1 \Vert A\Vert<1 ∥A∥<1
( I − A ) − 1 = ∑ k = 0 ∞ A k (I-A)^{-1}=\sum_{k=0}^\infty\limits A^k (I−A)−1=k=0∑∞Ak 的绝对收敛条件为 ρ ( A ) < 1 \rho(A)<1 ρ(A)<1 或 ∥ A ∥ < 1 \Vert A\Vert<1 ∥A∥<1
( I − A ) − 2 = ∑ k = 1 ∞ k A k − 1 (I-A)^{-2}=\sum_{k=1}^\infty\limits kA^{k-1} (I−A)−2=k=1∑∞kAk−1 的绝对收敛条件是 ρ ( A ) < 1 \rho(A)<1 ρ(A)<1 或 ∥ A ∥ < 1 \Vert A\Vert<1 ∥A∥<1