MatrixTheory: 特征值、特征向量

不变子空间

V:F线性空间,TL(V)UV的子空间。若αUT(α)U,即T(U)U,则称UV的关于T的不变子空间。

平凡子空间{0}V是不变子空间。线性变换的零空间和像空间也是不变子空间。

特征值、特征向量

V=U1U2U3,其中U1...U3均为不变子空间,则以不变子空间的基为基向量的线性变换矩阵为分块对角矩阵。进一步地,若存在dimV个不变子空间且这些子空间的直和为V,则线性变换矩阵就是对角矩阵,对角线的值为特征值,不变子空间的基为特征向量。

T(αi)=λiαiλi为特征值,αi为特征向量,其中λFα0

这和Ax=λx是等价的,只不过矩阵的只能是有限维的。

不同特征值对应的特征向量线性无关。

TL(V)F=CdimV=n,则T复数域内一定有特征值。

TL(V)U是不变子空间

  1. T|UL(U),缩小算子T的定义域。
  2. T/U:V/UV/U,商空间到商空间的映射,只有在不变子空间下才合理。如(T/U)(α+U)=T(α)+U

简单的基下矩阵

TL(V)F=CdimV=n,一定存在一组基,使得基下的矩阵是上三角。

证明:即证T(αi)span[α1,...,αi]。要用到商空间和商空间的线性变换。

等价地,复数域上的任意一个方阵一定相似于一个上三角。

特征子空间

特征子空间E(T,λ)=null(TλI),内部元素为所有的特征向量+零向量。不同特征值的特征子空间的和是直和。

E(T,λ1)E(T,λ2)...E(T,λm)V

取等当且仅当存在一组基使得基下的矩阵为对角矩阵;
也当且仅当V可以分成n个一维不变子空间的直和。

内积空间

内积空间:定义了内积的线性空间。其中,内积满足:

  1. (α,β)=(β,α)
  2. (α+β,γ)=(α,γ)+(β,γ)
  3. (kα,β)=k(β,α)
  4. (α,α)0,iff α=0 取等

对复数域,坐标相乘相加的内积要对第二项取共轭,即:

(α,β)=αβ

实数域的内积空间称欧式空间,复数域上的称酉空间

内积的性质

  1. βVβ固定。定义T:VFαVT(α)=(α,β)TL(V,F)
  2. (0,β)=(β,0)=0
  3. (α,β+γ)=(α,β)+(α,γ)
  4. (α,kβ)=k(α,β)
  5. (i=1mxiαi,j=1nγjβj)=xiyj(αi,βj)

向量的长度

||α||=(α,α)

  1. ||kα||=|k|(α,α)
  2. |(α,β)|||α||||β||(柯西不等式)。当且仅当两者线性相关等号成立。
  3. ||α+β||||α||+||β||(三角不等式)。当且仅当两者共线等号成立。

正交向量组、标准正交向量组、标准正交基

正交向量组:向量间两两正交。正交向量组一定线性无关。

校准正交组:单位化的正交向量组。

标准正交基:可由一组线性无关的基经过斯密特正交化得到。

斯密特正交化前后的基张成的空间是相同的空间。所以标准正交基,使得基下的矩阵为上三角。

实数域的转置等价于复数域的共轭转置。

向量α在标准正交基下的线性表示系数为(α,γi)

正交补空间

V内积空间,U子空间,定义:

U={αV:βU,(α,β)=0}

UV的子空间,是U的正交不空间,且V=UU

度量矩阵

G=[(α1,α1)...(αn,α1)... (α1,αn)...(αn,αn)]

则任意两个向量在指定基α1,...,αn下的内积为:

(α,β)=yGx

其中yβ在基下的坐标,xα在基下的坐标。

实数域的G是个对称的正定矩阵。
复数域的G是个共轭对称的正定矩阵。(共轭转置:G=G
正定一定对称。

一个正定矩阵定义一个内积。不同基下的G矩阵合同。

投影变换

V=UU,αV,α=β+γ,βU,γU。定义PU:VV,αV,α=β+γ,PU(α)=βPU即为V中的向量αU的投影变换。投影变换有性质:

  1. nullPU=U
  2. rangePU=U
  3. PU2=PU
  4. ϵ1,...,ϵkU的一组标准正交基,则PU(α)=(α,ϵ1)ϵ1+...+(α,ϵk)ϵk

最佳近似向量

内积空间V,子空间UβVβU,若有αU,使得γU||(βα)||||βγ||,则称αβU的最佳近似向量。

即距离最小的。实际上α就是β的正交投影向量。

用途:求矛盾方程的最佳近似解(又称最小二乘解)。如Ax=b没有解,则ATAx=ATb求出来的x就是最佳近似解。因为没有解,所以b不在列空间C中,列空间的正交补空间为N(AT),设Ax0为最佳近似向量,则b在正交补空间的投影可表示为bAx0,正交补空间为N(AT),所以有AT(bAx0)=0

内积空间的线性变换

内积空间V,算子TL(V)。若α,βV,(α,β)=(T(α),T(β)),则称该变换为等积变换。对应地,有:

  • ||α||=||T(α)||,等长变换;
  • ||αβ||=||T(α)T(β)||,等距变换;
  • ϵ1,...,ϵkV的标准正交基,T(ϵ1),...,T(ϵk)也是标准正交基;
  • T(ϵ1,..,ϵn)=(ϵ1,..,ϵn)An×n,AA=AA=E,这种变换称正交变换,即保持内积的变换。

这几个都是等价的,也称正交变换。

伴随变换:(T(α),β)=(α,S(β)),其基下矩阵满足A=B

自伴随T=S,此时A=A

广义特征向量

TL(V)λ为特征值,(TλI)j(α)=0j为正整数,α0,则称α为特征值λ的广义特征向量。G(T,λ)为广义特征子空间。

  1. {0}=nullT0nullT1...nullTk
  2. nullTk+1=nullk,则nulln+k+1=nulln+k
  3. dimV=n,则nullTn=nullTn+1
  4. dimV=n,则V=nullTnrangeTn
  • G(T,λ)=null(TλI)dimVTL(V)λ1,...,λm是不同特征值,其对应的不同广义特征向量α1,...,αm线性无关。

证明:分别作用线性变换使得只有一项留下。如,定义k为使得(Tλ1I)k(α1)0的最大整数。

幂零变换

NL(V),若Nk=0,则称N为幂零变换,类似于幂零矩阵。对幂零变换,一定有NdimV=0

存在某个基,使得幂零变换在基下的上三角矩阵的对角线元素全为0,即幂零变换的特征值都是0。(因为上三角矩阵的对角线元素就是特征值)

TL(V)λ1,...,λm为不同特征值,则:

  1. V=G(T,λ1)...G(T,λm);
  2. G(T,λi)T的不变子空间;
  3. (TλiI)|G(T,λi)是幂零变换。

对2:αG(T,λi)=null(TλiI)k,有(TλiI)k(α)=0(TλiI)k(T(α))=T((TλiI)k(α))=0
对3:广义特征子空间的定义;

不变子空间的基下矩阵为分块对角阵。
特征值数、特征子空间维数:几何重数
广义特征向量、广义特征子空间维数:代数重数

V存在由广义特征向量构成的基,基下的矩阵为分块对角,块数为特征值数,块的维数该特征值下广义特征子空间的维数。进一步地,该分块对角矩阵可被优化为上三角矩阵。

T|G(T,λi)=(TλiI)|G(T,λi)+λiI|G(T,λi)

即,拆分为一个幂零变换和恒等变换的和。

Jordan标准型

基下矩阵的进一步简化:只有对角线有值,且次对角线全为1。

[λ1,1,...,...0,λ2,1,...0,0,λ3,1]

同一个特征值的Jordan块的数目取决于线性无关的特征向量的个数。

V存在由广义特征向量构成的基,基下的矩阵为Jordan标准型。

先研究幂零变换的Jordan标准型,其他可由幂零变换+恒等变换得到。

NL(V)为幂零变换,则V中存在一组向量α1,α2,...,αm,及一组非负整数k1,k2,...,,使得:

Nk1(α1),...,N(α1),α1Nk2(α2),...,N(α2),α2...Nkm(αm),...,N(αm),αmNKi+1(αi)=0

化为V的一组基。其中m为Jordan块个数。

同一个特征值的Jordan块个数等于几何重数。
相似于Jordan标准型的特征向量为广义特征向量。

Hamilton-Cayley Them

线性变换的特征多项式:

fτ(λ)=(λλ1)n1...(λλm)nm

其中ni=n,若将该线性变换带入,即将λ换为T,则fτ(T)是一个零变换。该多项式称为零化多项式。

由该定理,An以及更高次的An+1都可由An1,...,E线性表示。若A可逆,则逆也可以由An1,...,E线性表示。

最小多项式

A的零化多项式中,次数n最低的首一多项式(最高项系数为1),记作mA(λ)

  1. 最小多项式是唯一的;
  2. f(λ)A的任意零化多项式,则mA(λ)|f(λ),即f(λ)一定可以被mA(λ)整除。特别的,的任意零化多项式,则mA(λ)|fA(λ),因为特征多项式是零化多项式;
  3. P1AP=B,则mA(λ)=mB(λ)
  4. A的任一特征值为mA(λ)(对任意零化多项式也成立)的根;
  5. A是分块对角,则每个块的最小多项式mAi(λ)|f(λ),即A的最小多项式是每个块最小多项式的最小公倍式;
  6. A可对角化当且仅当mA(λ)无重根(复数域上)。

Jordan标准型的最小多项式就是最大次数的几个不同Jordan块的最小多项式的乘积。
λn=1无重根。

Jordan型求法:a. 求特征值:若特征值均不同,则对角化;否则求几何重数。对三阶矩阵,一定能求;对四阶,若所有特征值相同,几何重数为2,则可能的Jordan块组合为2+2和3+1,用最小多项式检验哪个是对的即可。(更高阶的不需要掌握)

圆盘定理

近似地计算特征值 & 确定特征值的范围:

|λaii|ijn|aij|

第一圆盘定理

A的任意一个特征值一定会落在某个圆盘内。

第二圆盘定理

几个圆盘叠在一起,那么这个叠加后的区域就有几个特征值。由此推知,若圆盘互相分离,则A一定有n个不同的特征值,A一定可以对角化,这是对复数域,若是实数域,则还可以说明特征值都是实数(因为此时圆盘是关于x轴对称的,根都是成对出现的,除了x轴上的根)。

谱 & 谱半径

谱:所有特征值构成的集合。

谱半径ρ(A):特征值模的最大值。

μ=max{j=1n|aij|}1inμ=max{i=1n|aij|}1jnρ(A)min{μ,μ}

事实上:ρ(A)||A||

||A||是矩阵范数。