3.1 PROPERTIES OF LINEAR SYSTEMS AND THE LINEARITY PRINCIPLE(线性系统问题与线性算子原理)
在第2章中,我们专注于研究微分方程组的定性和数值方法。之所以这样做,是因为我们很少能找到具有两个或更多个因变量的系统的明确解公式。唯一的例外是线性系统。在本章中,我们展示如何利用向量场的代数和几何形式来得出自治线性系统的一般解。在此过程中,我们发现理解线性系统的定性行为比找到其一般解要容易得多。对线性系统定性行为的描述引出了这些系统的分类方案,这在实际应用中特别有用。我们还继续研究线性系统的模型,特别是阻尼谐振子。
在本章中,我们将探讨最简单类型的微分方程组——自治线性系统。线性系统本身非常重要,同时也是研究非线性系统的先发工具。我们将根据其定性行为对线性系统进行分类,甚至可以给出解的公式。在本章中,我们反复使用两个模型来说明我们建立的方法。其中一个是谐振子,它是所有二阶方程中最重要的模型。我们在第2.1节和第2.3节中推导出了这个模型。现在,利用本章的方法,我们可以对所有可能的参数值给出其解的完整描述。另一个模型是一个人为设计的模型,用来说明平面线性系统中可能出现的所有情况。请仔细研究我们的分析,但不要基于此投资任何资金。
谐波振荡器
谐振子是一个模型,用于描述(除其他方面外)连接在弹簧上的质量块的运动。弹簧提供一个遵循胡克定律的恢复力,唯一考虑的其他力是阻尼力。设 y ( t ) y(t) y(t) 为质量块在时间 t t t 的位置,其中 y = 0 y = 0 y=0 对应于弹簧的静止位置。将牛顿运动定律(力 = 质量 × 加速度),应用于质量-弹簧系统时,将产生以下二阶微分方程:
− k y − b d y d t = m d 2 y d t 2 , -ky - b \frac{dy}{dt} = m \frac{d^2 y}{dt^2}, −ky−bdtdy=mdt2d2y,
其中 m m m 是质量, k k k 是弹簧常数, b b b 是阻尼系数。左侧的 − k y -ky −ky 项来自胡克定律,而 − b d y d t -b \frac{dy}{dt} −bdtdy 项则是来自阻尼的力(见第2.3节,第184页)。这个二阶方程通常写为:
m d 2 y d t 2 + b d y d t + k y = 0. m \frac{d^2 y}{dt^2} + b \frac{dy}{dt} + ky = 0. mdt2d2y+bdtdy+ky=0.
如同我们在第2.1节和第2.3节所做的那样,可令 v = d y d t v = \frac{dy}{dt} v=dtdy 为 t t t 时刻的速度,将这个方程转换为线性系统。我们得到:
{ d y d t = v , d v d t = − k m y − b m v . \left\{ \begin{align*} &\frac{dy}{dt} = v,\\ &\frac{dv}{dt} = -\frac{k}{m} y - \frac{b}{m} v. \end{align*} \right. ⎩ ⎨ ⎧dtdy=v,dtdv=−mky−mbv.
注意, d y d t \frac{dy}{dt} dtdy 和 d v d t \frac{dv}{dt} dtdv 线性地依赖于 y y y 和 v v v。正如我们将看到的,解的行为取决于参数 m m m、 k k k 和 b b b 的值。
两杯咖啡模型
谐振子并未展示出本章中我们将遇到的所有可能行为,因此我们介绍以下微观经济学中的一个传闻模型。
在撰写完微分方程教科书后,Paul 和 Bob 都决定在校园附近开设小咖啡馆。“Paul’s High Test Coffee”和“Bob’s Gourmet Tea”在同一条街上开业,很快,Paul 和 Bob 开始担心彼此的咖啡馆对对方的影响。两家饮品店如此接近,可能会使他们所在的街区成为学生们更受欢迎的去处。另一方面,这两家咖啡馆可能会为了有限的口渴顾客而竞争。Paul 和 Bob 为此争论不休,直到他们厌倦了争论,决定聘请他们以前的同事、著名的数学家 Glen 来解决这个问题。Glen 决定为两家咖啡馆的利润关系建立一个微分方程模型。回忆起他从 Paul 和 Bob 那里学到的一切,Glen 从最简单的模型开始,提出了以下系统。
设:
x ( t ) = Paul’s 咖啡馆在时间 t 的日利润 ; x(t) = \text{Paul's 咖啡馆在时间 } t \text{ 的日利润}; x(t)=Paul’s 咖啡馆在时间 t 的日利润;
y ( t ) = Bob’s 咖啡馆在时间 t 的日利润。 y(t) = \text{Bob's 咖啡馆在时间 } t \text{ 的日利润}。 y(t)=Bob’s 咖啡馆在时间 t 的日利润。
也就是说,如果 x ( t ) > 0 x(t) > 0 x(t)>0,则 Paul’s 咖啡馆在赚钱,但如果 x ( t ) < 0 x(t) < 0 x(t)<0,则 Paul’s 咖啡馆在亏钱。由于目前还没有关于每家咖啡馆的利润如何影响另一家利润变化的确凿信息,Glen 制定了允许每家咖啡馆影响另一家的最简单的模型——线性模型。系统如下:
{ d x d t = a x + b y , d y d t = c x + d y . \left\{ \begin{align*} &\frac{dx}{dt} = ax + by,\\ &\frac{dy}{dt} = cx + dy. \end{align*} \right. ⎩
⎨
⎧dtdx=ax+by,dtdy=cx+dy.
其中 a a a、 b b b、 c c c 和 d d d 是参数。Paul 的利润变化率依赖于 Paul 自身的利润和 Bob 的利润(且没有其他因素)。同样的假设适用于 Bob 的利润。在第5章中我们将看到,只要两家咖啡馆都接近盈亏平衡点,使用这种形式的模型通常是合理的。我们目前还不能使用这个模型来预测未来的利润,因为我们不知道参数 a a a、 b b b、 c c c 和 d d d 的值。然而,我们可以对参数符号和大小的意义有一个基本的理解。例如,考虑参数 a a a。它衡量 Paul 的利润对其利润变化率 d x d t \frac{dx}{dt} dtdx 的影响。假设 a a a 是正的。如果 Paul 在赚钱,则 x > 0 x > 0 x>0,因此 a x > 0 ax > 0 ax>0。 a x ax ax 项对 d x d t \frac{dx}{dt} dtdx 有正贡献,因此 Paul 在这种情况下会赚更多的钱。换句话说,Paul 希望当 x > 0 x > 0 x>0 时 a > 0 a > 0 a>0。另一方面,盈利( x > 0 x > 0 x>0)可能对 Paul 的利润有负面影响。(例如,咖啡馆可能会过于拥挤,顾客可能会去别处。)在这种情况下,利润会减少,在这种假设下,参数 a a a 在我们的模型中应该是负的。参数 b b b 衡量 Bob 的利润对 Paul 利润变化率的影响。如果 b > 0 b > 0 b>0 且 Bob 赚钱( y > 0 y > 0 y>0),则 Paul 的利润也会受益,因为 b y by by 项对 d x d t \frac{dx}{dt} dtdx 有正贡献。另一方面,如果 b < 0 b < 0 b<0,当 Bob 赚钱( y > 0 y > 0 y>0)时,Paul 的利润会受到损害。我们可以将 b < 0 b < 0 b<0 理解为 Bob 从 Paul 那里抢走顾客的衡量标准。类似地,Paul 的利润和 Bob 的利润都会影响 Bob 利润的变化率,参数 c c c 和 d d d 相对于 d y d t \frac{dy}{dt} dtdy 有类似的解释。这个模型假设只有两家咖啡馆的利润会影响各自利润的变化。这些假设显然是过于简化的。然而,这个模型为我们提供了一个简单的情况,可以用来解释各种线性系统的解。
在图3.1中,我们绘制了系统
{ d x d t = a x + b y , d y d t = c x + d y . \left\{ \begin{align*} &\frac{dx}{dt} = ax + by,\\ &\frac{dy}{dt} = cx + dy. \end{align*} \right. ⎩ ⎨ ⎧dtdx=ax+by,dtdy=cx+dy.
的相图,假设 a = d = 0 a = d = 0 a=d=0, b = 1 b = 1 b=1, c = − 1 c = -1 c=−1,结果得到的是圆形解曲线。在图3.2中,我们考虑 a = − 1 a = -1 a=−1, b = 4 b = 4 b=4, c = − 3 c = -3 c=−3, d = − 1 d = -1 d=−1 的情况。在这种情况下,解曲线螺旋向原点靠近。
图3.2表明,利润在震荡的同时趋向于点 ( 0 , 0 ) (0, 0) (0,0),即两家咖啡馆的盈亏平衡点。对应的 x ( t ) x(t) x(t) 和 y ( t ) y(t) y(t) 图形也展示了这些行为(见图3.3和图3.4)。正如我们将看到的,根据参数 a a a、 b b b、 c c c 和 d d d 的不同值,这个模型还存在许多其他可能的相图。在本章中,我们将开发处理所有可能情况的技术。
线性系统的矩阵表示
在本章中,我们主要考虑如下形式的微分方程组:
{ d x d t = a x + b y d y d t = c x + d y , \left\{ \begin{align*} &\frac{dx}{dt} = ax + by\\ &\frac{dy}{dt} = cx + dy, \end{align*} \right. ⎩ ⎨ ⎧dtdx=ax+bydtdy=cx+dy,
其中 a a a、 b b b、 c c c 和 d d d 是常数(可能为 0)。这样的系统称为常系数线性系统。常数 a a a、 b b b、 c c c 和 d d d 是这些系统的系数。无论是谐振子模型还是咖啡馆的模型,都是这种形式的系统,只是依赖变量和系数的名称不同。
最重要的形容词——“线性”——指的是 d x d t \frac{dx}{dt} dtdx 和 d y d t \frac{dy}{dt} dtdy 的方程仅涉及依赖变量的一次幂。换句话说,它们是 x x x 和 y y y 的线性函数。由于系数 a a a、 b b b、 c c c 和 d d d 是常数,这类系统也是自治的,因此我们知道相平面上的不同解曲线不会相交。这些系统有两个依赖变量,因此我们称它们为平面或二维系统。由于“二维、常系数线性系统”这个称呼过于冗长,我们通常只称这些系统为平面线性系统,甚至仅称为线性系统。请注意,这些系统是我们在第1章中讨论的齐次常系数一阶线性方程 d x d t = a x \frac{dx}{dt} = ax dtdx=ax 的两变量推广(见第6页和第112页)。
我们可以使用向量和矩阵表示法来更有效地表达这个系统。设 A A A 为“2×2”方阵(即 2×2 矩阵):
A = ( a b c d ) , A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}, A=(acbd),
设
Y = ( x y ) Y = \begin{pmatrix} x \\ y \end{pmatrix} Y=(xy)
表示依赖变量的列向量。则 2 × 2 矩阵 A A A 和列向量 Y Y Y 的乘积是列向量 A Y AY AY,表示为
A Y = ( a b c d ) ( x y ) = ( a x + b y c x + d y ) 。 AY = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix}= \begin{pmatrix} ax + by \\ cx + dy \end{pmatrix}。 AY=(acbd)(xy)=(ax+bycx+dy)。
例如:
( 5 2 − 1 3 ) ( 3 4 ) = ( 5 ⋅ 3 + 2 ⋅ 4 − 1 ⋅ 3 + 3 ⋅ 4 ) = ( 23 9 ) \begin{pmatrix} 5 & 2 \\ -1 & 3 \end{pmatrix} \begin{pmatrix} 3 \\ 4 \end{pmatrix}= \begin{pmatrix} 5 \cdot 3 + 2 \cdot 4 \\ -1 \cdot 3 + 3 \cdot 4 \end{pmatrix}= \begin{pmatrix} 23 \\ 9 \end{pmatrix} (5−123)(34)=(5⋅3+2⋅4−1⋅3+3⋅4)=(239)
以及
( ( 2 − a ) π e y ) ( y 2 v ) = ( ( 2 − a ) y + 2 π v e y + 2 y v ) 。 \begin{pmatrix} (2 - a) & \pi \\ e & y \end{pmatrix} \begin{pmatrix} y \\ 2v \end{pmatrix}= \begin{pmatrix} (2 - a)y + 2\pi v \\ ey + 2yv \end{pmatrix}。 ((2−a)eπy)(y2v)=((2−a)y+2πvey+2yv)。
如第2章所述,如果 x x x 和 y y y 是依赖变量,那么我们可以写作
Y ( t ) = ( x ( t ) y ( t ) ) Y(t) = \begin{pmatrix} x(t) \\ y(t) \end{pmatrix} Y(t)=(x(t)y(t))
和
d Y d t = ( d x d t d y d t ) \frac{dY}{dt} = \begin{pmatrix} \frac{dx}{dt} \\ \frac{dy}{dt} \end{pmatrix} dtdY=(dtdxdtdy)
使用这种矩阵表示法,我们可以将二维线性系统
{ d x d t = a x + b y d y d t = c x + d y , \left\{ \begin{align*} &\frac{dx}{dt} = ax + by\\ &\frac{dy}{dt} = cx + dy, \end{align*} \right. ⎩
⎨
⎧dtdx=ax+bydtdy=cx+dy,
写为
d Y d t = ( d x d t d y d t ) = ( a x + b y c x + d y ) = ( a b c d ) ( x y ) , \frac{dY}{dt} = \begin{pmatrix} \frac{dx}{dt} \\ \frac{dy}{dt} \end{pmatrix}= \begin{pmatrix} ax + by \\ cx + dy \end{pmatrix}= \begin{pmatrix} a & b \\ c & d \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix}, dtdY=(dtdxdtdy)=(ax+bycx+dy)=(acbd)(xy),
或更简洁地表示为
d Y d t = A Y , \frac{dY}{dt} = AY, dtdY=AY,
其中
A = ( a b c d ) A = \begin{pmatrix} a & b \\ c & d \end{pmatrix} A=(acbd)
且
Y = ( x y ) 。 Y = \begin{pmatrix} x \\ y \end{pmatrix}。 Y=(xy)。
该系统的系数矩阵 A A A 称为系数矩阵。
矩阵表示法的一个优势是它帮助我们看清一阶线性系统与一阶线性方程之间的相似性。使用矩阵也提供了一些非常有用的代数工具,我们将在本章中利用这些工具。
向量表示法可以扩展到包括任意数量 n n n 个因变量 y 1 , y 2 , … , y n y_1, y_2, \ldots, y_n y1,y2,…,yn 的系统。具有常系数的线性系统为:
d y 1 d t = a 11 y 1 + a 12 y 2 + ⋯ + a 1 n y n \frac{dy_1}{dt} = a_{11} y_1 + a_{12} y_2 + \cdots + a_{1n} y_n dtdy1=a11y1+a12y2+⋯+a1nyn
d y 2 d t = a 21 y 1 + a 22 y 2 + ⋯ + a 2 n y n \frac{dy_2}{dt} = a_{21} y_1 + a_{22} y_2 + \cdots + a_{2n} y_n dtdy2=a21y1+a22y2+⋯+a2nyn
⋮ \vdots ⋮
d y n d t = a n 1 y 1 + a n 2 y 2 + ⋯ + a n n y n \frac{dy_n}{dt} = a_{n1} y_1 + a_{n2} y_2 + \cdots + a_{nn} y_n dtdyn=an1y1+an2y2+⋯+annyn
在这种情况下,这个系统的系数是 a 11 , a 12 , … , a n n a_{11}, a_{12}, \ldots, a_{nn} a11,a12,…,ann。设
Y = ( y 1 y 2 ⋮ y n ) Y = \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{pmatrix} Y= y