7.3、向量空间的简要回顾

news2026/2/15 1:32:37

7.3、向量空间的简要回顾

在开始讨论格之前，我们先提醒读者注意线性代数中的一些重要定义和思想。向量空间的定义可以非常宽泛，但就本章而言，我们只需考虑对于某个正整数 m，包含在 $R^{m}$ 中的向量空间即可。

我们从研究向量空间必不可少的基本定义开始

向量空间。 向量空间 V 是 $R^{m}$ 的子集，其性质是：
$a_{1}v_{1}+a_{2}v_{2} \in V \qquad 对于所有的v_{1},v_{2}\in V和所有的a_{1},a_{2}\in R$
等价地，向量空间是 $R^{m}$ 的一个子集，它对R的元素的加法和标量乘法封闭。

线性组合。 设 $v_{1},v_{2},...,v_{k} \in V$ 。 $v_{1},v_{2},...,v_{k} \in V$ 的线性组合是任何形式的向量:
$w=a_{1}v_{1}+a_{2}v_{2}+...+a_{k}v_{k} \qquad with \qquad a_{1},...,a_{k} \in R$
所有这些线性组合的集合，
$\{a_{1}v_{1}+...+a_{k}v_{k}:a_{1},...,a_{k} \in R\}$
称为 {v1,…, vk} 的扩张空间(span)。补充：扩张空间：即向量张成的线性空间

无关性。 一组向量 $v_{1},v_{2},...,v_{k} \in V$ 是（线性）独立的，如果要得到
$a_{1}v_{1}+a_{2}v_{2}+...+a_{k}v_{k}=0 \qquad (7.5)$
如果我们能使 (7.5) 成真，且至少有一个 $a_{i}$ 非零，那么这个集合就是（线性）相关集合。

基。 V 的基是一组跨(span-张成空间) V 的线性无关向量 $v_{1},v_{2},...,v_{n}$ 。这等同于说，对于 α1，…，αn∈ R 的唯一选择，每个向量 w∈V 都可以写成这种形式。
$w=a_{1}v_{1}+a_{2}v_{2}+...+a_{n}v_{n}$
接下来，我们描述了不同基之间的关系和重要的维数概念。

命题 7.11. 设 V ⊂ $R^{m}$ 是一个向量空间。
（a）存在V的一组基。

（b）V的任意两个基都有相同数量的元素。V的一组基中的元素数称为V的维数。（最小线性无关组）

（c）设 v1,…, vn 是 V 的一个基，设 w1,…, wn 是 V 中的另一组 n 个向量，把每个 wj 写成 vi 的线性组合（v中所有向量都可以用基来表示）
$w_{1}=a_{11}v_{1}+a_{12}v_{2}+...+a_{1n}v_{n},\\ w_{2}=a_{21}v_{1}+a_{22}v_{2}+...+a_{2n}v_{n},\\ ...... \\ w_{n}=a_{n1}v_{1}+a_{n2}v_{2}+...+a_{nn}v_{n},\\$
然后w1，…，wn也是V的一组基当且仅当矩阵的行列式不等于0。
$\begin{pmatrix} a_{11} & a_{12} & ... & a_{1n}\\ a_{21} & a_{22} & ... & a_{2n}\\ ... & ... & ... & ...\\ a_{n1} & a_{n2} & ... & a_{nn} \end{pmatrix}$
接下来，我们将解释如何测量 $R^{n}$ 中向量的长度以及向量对之间的夹角。这些重要的概念与点积和欧几里得规范的概念息息相关。

定义。 设 v,w∈V ⊂ $R^{m}$ ，并将 v 和 w 用坐标写成
$v=(x_{1},x_{2},...,x_{m}) \qquad and \qquad w=(y_{1},y_{2},...,y_{m})$
v 和 w 的点积为
$v\cdot w=x_{1}y_{1}+x_{2}y_{2}+...+x_{m}y_{m}$
如果 $v\cdot w=0$ ，我们就说 v 和 w 互为正交。

v 的长度或欧几里得范数是指：
$\parallel v \parallel =\sqrt{x_{1}^{2}+x_{2}^{2}+...+x_{m}^{2}}$
注意点积和范数是由公式联系起来的
$\cdot v =\parallel v \parallel^{2}$
命题7.12。 设 $\in V \subset R^{m}$ 。

(a) 设 θ 为向量 v 和 w 之间的夹角，我们将 v 和 w 的起点置于原点 0，则:
$\cdot w = \parallel v \parallel \parallel w \parallel cos(θ) \qquad (7.6)$
(b) (柯西-施瓦茨不等式):
$\cdot w | \le \parallel v \parallel \parallel w \parallel$
证明。 关于 (a)，请参见任何标准线性代数教科书。我们注意到 Cauchy-Schwarz 不等式 (b) 是由 (a) 直接推出的，但我们认为它的重要性足以保证直接证明。如果 w = 0，则无须证明，我们可以假设 w = 0。我们考虑函数
$f(t)=\parallel v-tw \parallel^{2}=(v-tw) \cdot (v-tw) \\ =v \cdot v -2tv \cdot w + t^{2}w \cdot w \\ =\parallel v \parallel ^{2}-2tv \cdot w +t^{2}\parallel w \parallel ^{2}$
我们知道，对于所有t∈R, f(t)≥0，因此我们选择使f(t)最小的t值，看看它给出了什么。这个最小值是 $\cdot w / \parallel w \parallel ^{2}$ 。因此
$\le f\left ( \frac{v \cdot w}{\parallel w \parallel ^{2}} \right ) = \parallel v \parallel ^{2}-\frac{(v \cdot w)^{2}}{\parallel w \parallel ^{2}}$
对这个表达式进行简化并取平方根，就得到了想要的结果。（这一步通过化简 $\parallel v \parallel ^{2}-2tv \cdot w +t^{2}\parallel w \parallel ^{2}$ 成函数 $f(x)=(x-b)^{2}$ 的形式，由于函数图像开口朝上，所以b是最低点）

定义。 向量空间 V 的正交基是基 v1，…，vn，其性质是
$v_{i} \cdot v_{j} = 0 \qquad 对于所有的i \ne j$
翻译：对于向量空间 V 里的所有基 $v_{1},...,v_{n}$ ，两两之间都存在关系：

$v_{i} \cdot v_{j} = 0 \qquad 对于所有的i \ne j$ ，则说是正交基

如果对于所有的 $i,\parallel v_{i} \parallel = 1$ ，则说这个基是标准正交的，

使用正交或标准正交基，有许多公式会变得简单得多。特别地，如果v1，…， vn是一个正交基，同时，如果v = a1v1 +···+ anvn是基向量的线性组合，则
$\parallel v \parallel ^{2} = \parallel a_{1}v_{1}+...+a_{n}v_{n} \parallel ^{2} \\ =(a_{1}v_{1}+...+a_{n}v_{n}) \cdot (a_{1}v_{1}+...+a_{n}v_{n}) \\ =\sum_{i=1}^{n} \sum_{j=1}^{n} a_{i}a_{j}(v_{i} \cdot v_{j}) \\ =\sum_{i=1}^{n}a_{i}^{2} \parallel v_{i} \parallel ^{2} \qquad 因为当i\ne j时，v_{i} \cdot v_{j}$
如果基是标准正交的，那么这个进一步化简为 $\parallel v \parallel ^{2} =\sum a_{i}^{2}$ 。

有一种创建正交基础的标准方法，称为格拉姆-施密特算法（Gram-Schmidt algorithm）。我们将介绍通常算法的一个变种，它能得到一个正交基础，因为这个变种与我们后面的应用最为相关。

定理7.13 (Gram-Schmidt算法)。设v1，…， vn是向量空间V⊂Rm的一组基。下面的算法为 V 创建了一个正交基 $v_{1}^{*},...,v_{n}^{*}$ ：
在这里插入图片描述

这两个基的特性是：扩张空间(span)
$Span\{v_{1},...,v_{i}\}=Span\{v_{1}^{*},...,v_{i}^{*}\} \qquad 对于所有的i=1,2,...,n$
证明。正交性的证明采用归纳法，因此我们假设向量 $v_{1}^{*},...,v_{i-1}^{*}$ 是成对正交的，我们需要证明 $v_{i}^{*}$ 与前面所有的有星号的向量是正交的。为此，我们取任意 k< i 并计算
在这里插入图片描述

为了证明关于跨度的最后陈述，我们首先注意到，根据 $v_{i}^{*}$ 的定义，vi 显然在 $v_{1}^{*},...,v_{i}^{*}$ 的跨度中。我们通过归纳法证明其他包含，因此我们假设 $v_{1}^{*},...,v_{i-1}^{*}$ 在 $v_{1},...,v_{i-1}$ 的跨度中，我们需要证明 $v_{i}^{*}$ 在 $v_{1},...,v_{i-1}$ 的跨度中。但根据 $v_{i}^{*}$ 的定义，我们可以看到它在 $v_{1}^{*},...,v_{i-1}^{*},v_{i}$ 的跨中，因此我们可以通过归纳假设来证明。