线性代数

第7章 有理形式和Jordan形式

第7.1节 循环子空间和零化子

又一次, V是域F上的一个有限维向量空间, 而TV上一个固定的 (但也是任意的) 线性算子. 如果αV的任意一个向量, 那么存在一个最小的包含α且在T下不变的V的子空间. 这个子空间可以被定义为所有包含αT不变子空间之交. 然而, 现在对我们来说按照以下方式看待它是更有优势的. 如果W是任意的包含α且在T下不变的V的子空间, 那么W也必然包含向量Tα. 因此, W还必然包含T(Tα)=T2α, T(T2α)=T3α, 等等. 换言之, 对于每个域F上的多项式g, 必然有g(T)αW. 集合{g(T)α|gF[x]}显然在T下不变, 因而是包含α的最小T不变子空间.

定义.αV, α生成的T循环子空间Z(α;T)={g(T)α|gF[x]}. 如果Z(α;T)=V, 那么α被称为T的一个循环向量.

另一种描述子空间Z(α;T)的方式为Z(α;T)是由向量Tkα,k0张成的子空间, 因而αT的循环向量当且仅当这些向量可以张成V. 我们提醒读者, 一般的线性算子T可能没有循环向量.

例子1. 对于任意的T, 由零向量生成的T循环子空间是零子空间. 空间Z(α;T)是一维的当且仅当αT的特征向量. [译注: 尽管在上一章定义特征向量时没有排除零向量, 但是从现在开始本书所称特征向量均不包括零向量, 这也与其他文本保持一致.] 对于恒等算子而言, 每个非零向量都生成了一维的循环子空间. 因此, 若dimV>1, 恒等算子没有循环向量. 一个具有循环向量的线性算子的例子是F2上在标准有序基下由矩阵[0010]表示的线性算子T. 这里的一个循环向量是ε1, 因为若β=(a,b), 以g=a+bx我们有β=g(T)ε1. 对于相同的算子T, 由ε2生成的循环子空间是一维的, 因为ε2T的特征向量.

对于任意的Tα, 我们所感兴趣的是向量Tjα之间的线性关系c0α+c1Tα++ckTkα=0即我们所感兴趣的是具有性质g(T)α=0的多项式g=c0+c1x++ckxk. 集合{gF[x]|g(T)α=0}显然是F[x]中的一个理想. 并且, 它也是一个非零理想, 因为它包含T的极小多项式.

定义. 如果αV, αT零化子是F[x]中的理想M(α;T)={gF[x]|g(T)α=0}, 其唯一的首项系数为一的生成元pα也被称为αT零化子. [译注: 这个定义在第6.4节{不变子空间}已经给出过了.]

正如我们所指出的, T零化子pα整除算子T的极小多项式. 读者也应该注意到除非α是零向量, degpα>0.

定理1.αV中的非零向量, pααT零化子.
  1. pα的次数等于循环子空间Z(α;T)的维数.
  2. 如果pα的次数为k, 那么向量α,Tα,T2α,,Tk1α构成了Z(α;T)的一个基.
  3. 如果U是由TZ(α;T)上的限制导出的线性算子, 那么U的极小多项式为pα.
证明.g是域F上任意的多项式, 作带余除法g=pαq+r其中r=0degr<degpα=k. 鉴于pαqM(α;T), 于是g(T)α=r(T)α.既然r=0degr<k, 向量r(T)α是向量α,Tα,,Tk1α的线性组合. 换言之, 这k个向量可以张成Z(α;T). 它们当然也是线性无关的, 因为若这些向量之间存在非平凡的线性关系, 那么其可以导出一个非零的多项式g满足g(T)α=0degg<degpα, 但这是不可能的. 现在我们已经证明了i和ii.
UTZ(α;T)的限制. 如果gF[x], 那么pα(U)g(T)α=pα(T)g(T)α=g(T)pα(T)α=g(T)0=0因此, 算子pα(U)将每个Z(α;T)的向量都送至0, 即Z(α;T)上的零算子. 并且, 如果h是一个次数小于k的多项式, 那么我们不可能有h(U)=0, 不然的话h(U)α=h(T)α=0, 但这与pα的定义矛盾. [译注: 此即若h零化U, 则pα整除h. 换句话说, 就是pα的确生成了零化U的理想.] 这表明pαU的极小多项式.
译者注记. 实际上, 定理1对于α=0也成立, 此时pα=1, degpα=0, Z(α;T)={0}, dimZ(α;T)=0, Z(α;T)的基, Z(α;T)上导出的算子即零向量空间上的平凡线性算子, 其零化多项式构成的理想就是整个F[x], 所以极小多项式是1, 也就是pα.

该定理的一个特别推论如下: 如果α碰巧是T的一个循环向量, 那么T的极小多项式的次数必然等于空间V的维数. 因此, Cayley-Hamilton定理告诉我们T的极小多项式就是T的特征多项式. 之后我们将证明对于任意的T, 存在向量αV使得其T零化子是T的极小多项式. 然后, 这可以推出T具有循环向量当且仅当T的极小多项式和特征多项式是相同的. 但是, 还需要一些工作我们才能抵达这一步.

我们的计划是利用具有循环向量的算子研究一般的T. 因此, 让我们检视k维空间W上的一个具有循环向量α的算子U. 根据定理1, 向量α,,Uk1α构成了空间W的一个基, 并且α的零化子pαU的极小多项式 (因而也是U的特征多项式). 如果我们令αi=Ui1α,i=1,,k, 那么U于有序基𝔅={α1,,αk}上的作用为Uαi=αi+1,i=1,,k1Uαk=c0α1c1α2ck1αk其中pα=c0+c1x++ck1xk1+xk. Uαk的表达式是由pα(U)α=0的事实推得的, 即Ukα+ck1Uk1α++c1Uα+c0α=0.这表明U在有序基𝔅下的矩阵为[0000c01000c10100c20001ck1].这个矩阵被称为首项系数为一的多项式pα的同伴矩阵 (companion matrix). [译注: 读者应该将同伴矩阵的概念视为多项式上的一个映射.]

定理2. 如果U是有限维向量空间W上的一个线性算子, 那么U拥有循环向量当且仅当存在W的一个有序基使得U在其下以U的极小多项式的同伴矩阵表示.
证明. 我们刚才已经观察到若U拥有循环向量, 那么的确存在这样一个基. 反过来说, 如果我们有W的一个有序基{α1,,αk}使得U在其下由U的极小多项式的同伴矩阵表示, 那么显然α1U的一个循环向量.
推论. 如果A是一个首项系数为一的多项式p的同伴矩阵, 那么p既是A的极小多项式, 也是A的特征多项式.
证明. 一种方法是令UFk上在标准有序基下由A表示的线性算子, 然后应用定理1和Cayley-Hamilton定理. 另一种方法是使用定理1看出pA的极小多项式, 并通过直接的计算验证pA的特征多项式.
译者注记. 证明的要点在于意识到ε1U零化子pε1 (根据定理1, 其等于A的极小多项式) 何以等于p. 答案是, 根据直接的计算, 可以知道p(U)ε1=0, 因而pε1整除p, 但是它们次数相等且首项系数都为一, 所以p=pε1.

以下是本节最后的注记. 如果T是空间V上任意的线性算子, αV中任意的向量, 那么T于循环子空间Z(α;T)上的限制算子U具有一个循环向量, 即α. 因此, Z(α;T)拥有一个有序基, U在其下以pα的同伴矩阵表示, pααT零化子. [译注: 当然, pα也是U的极小多项式.]

练习1.TF2上的一个线性算子. 证明对于向量α, 若α非零且α不是T的特征向量, 那么αT的一个循环向量. 据此, 证明要么T拥有循环向量, 要么T是恒等算子的标量倍数.
练习2.T3上的线性算子, 其在标准有序基下由矩阵[200020001]表示. 证明T没有循环向量. 由向量(1,1,3)生成的T循环子空间是什么?
练习3.T3上的线性算子, 其在标准有序基下由矩阵[1i012i011]表示. 找出向量(1,0,0)T零化子. 找出(1,0,i)T零化子.
练习4. 证明如果T2拥有循环向量, 那么T拥有循环向量. 反过来正确吗?
练习5.V是域F上的一个n维向量空间, NV上的一个幂零线性算子. 设Nn10, 令αV是满足Nn1α0的一个向量. 证明αN的一个循环向量. N在有序基{α,Nα,,Nn1α}的矩阵是什么?
练习6. 给出以下事实的一个直接证明. 如果A是首项系数为一的多项式p的同伴矩阵, 那么pA的特征多项式.
练习7.V是一个n维向量空间, TV上的一个线性算子. 设T是可对角化的.
  1. 如果T拥有循环向量, 证明T拥有n个不同的特征值.
  2. 如果T拥有n个不同的特征值, 并且{α1,,αk}是由T的特征向量构成的一个基, 证明α=α1++αkT的一个循环向量.
练习8.T是有限维向量空间V上的一个线性算子. 设T拥有循环向量. 证明如果U是任意与T交换的线性算子, 那么U是应用某个多项式于T的结果.

第7.2节 循环分解和有理形式

本节的主要目的在于证明如果T是有限维向量空间V上任意的线性算子, 那么存在向量α1,,αrV满足V=Z(α1;T)Z(αr;T).换言之, 我们希望证明V是一个T循环子空间的直和. 这将表明T是有限数目的线性算子的直和, 其中每个都拥有循环向量. 其效用在于将关于一般线性算子的诸多问题规约为关于拥有循环向量的算子的类似问题. 我们将证明的定理3是线性代数中最为深刻的结果之一, 并且拥有许多有趣的推论.

循环分解定理与以下问题紧密关联. 对于什么样的T不变子空间W而言, 存在另一个T不变子空间W满足V=WW. 如果W是有限维向量空间V的任意一个子空间, 那么存在一个子空间W满足V=WW. 通常来说存在许多这样的子空间W, 其中每个都被称为与W互补. 我们问的是何时一个T不变子空间拥有一个与之互补的T不变子空间.

让我们设V=WW, 其中WW都在T下不变, 然后看看我们可以发现什么关于子空间W的性质. 每个向量βV都具有β=γ+γ的形式, 其中γWγW. 如果f是标量域上任意的多项式, 那么f(T)β=f(T)γ+f(T)γ.既然WW都是T不变的, 向量f(T)γWf(T)γW. 因此, f(T)βW当且仅当f(T)γ=0. 我们所感兴趣的正是这看似单纯的事实, 即如果f(T)βW, 那么f(T)β=f(T)γ.

定义.T是向量空间V上的线性算子, WV的一个子空间. 我们称WT可容许的 (T-admissible), 如果
  1. WT下不变;
  2. f(T)βW, 则存在向量γW满足f(T)β=f(T)γ.
[译注: admissible暂无通行翻译, 译者将其定为"可容许的".]

刚才我们已经表明了, 如果W是不变的且有一个互补的不变子空间, 那么W是可容许的. 定理3的一个推论是其逆, 于是可容许性刻画了那些拥有互补不变子空间的不变子空间.

让我们指出在获得分解V=Z(α1;T)Z(αr;T)的尝试里可容许性质的概念是如何牵涉其中的. 我们抵达这样一种分解的基本方法是归纳地挑选向量α1,,αr. 设根据某种过程我们已经挑选了向量α1,,αj, 并且子空间Wj=Z(α1;T)++Z(αj;T)是真子空间. 我们想要找到一个非零向量αj+1满足WjZ(αj+1;T)={0}因为这样的话子空间Wj+1=WjZ(αj+1;T)就离穷尽V更进至少一维. 但是, 这样的αj+1何以存在呢? 如果α1,,αj的挑选使得Wj是一个T可容许子空间, 那么很容易看出来我们可以找到一个合适的αj+1. 这是使得我们对于定理3的证明成立之所在, 即便这并非我们组织论证的方式.

W是一个T不变的真子空间. 让我们试着寻找一个非零的向量α满足WZ(α;T)={0}.我们可以选择某个向量βW, 考虑T导子S(β;W), 其由所有满足g(T)βW的多项式g构成. 回忆一下, 生成理想S(β;W)的唯一的首项系数为一的多项式f=s(β;W)也被称为从βWT导子. 向量f(T)βW之中. 现在, 如果WT可容许的, 那么存在γW满足f(T)β=f(T)γ. 令α=βγ, g是任意的多项式. 既然(βα)W, g(T)βW当且仅当g(T)αW. 换言之, S(α;W)=S(β;W). 因此, 多项式f也是从αWT导子. 但是f(T)α=0, 这告诉我们g(T)αW当且仅当g(T)α=0, 即子空间Z(α;T)W是线性无关的, 并且fαT零化子.

定理3. 循环分解定理.T是有限维向量空间V上的一个线性算子, W0是一个T可容许的V的真子空间, 存在非零向量α1,,αrV满足
  1. V=W0Z(α1;T)Z(αr;T);
  2. pk整除pk1, 其中k=2,,rpiαiT零化子.
而且, 整数r和零化子p1,,pr由i, ii以及αi0的事实唯一确定.
证明. 证明相当冗长, 故我们将其分为四个步骤. 似乎初读证明时取W0={0}会比较容易, 尽管这并不会带来任何实质性的简化. 贯穿整个证明, 我们都将f(T)β缩略为fβ.

第1步. 存在非零向量β1,,βrV满足

  1. V=W0+Z(β1;T)++Z(βr;T);
  2. 如果1kr并且Wk=W0+Z(β1;T)++Z(βk;T)那么导子pk=s(βk;Wk1)在所有到子空间Wk1T导子中拥有最大的次数, 即对于每个kdegpk=maxαVdegs(α;Wk1).
这一步只依赖于W0是不变子空间的事实. 如果W是一个T不变的真子空间, 那么0<maxαVdegs(α;W)dimV我们可以选择一个向量β使得degs(β;W)取得最大值, 然后子空间W+Z(β;T)T不变的且维数大于dimW. [译注: Cayley-Hamilton定理告诉我们特征多项式是一个零化多项式, 于是s(α;W)整除特征多项式, 因而有degs(α;W)dimV, 那么我们可以明白最大值是良定的且maxαVdegs(α;W)dimV. 考虑到W是真子空间, 若αW, 那么degs(α;W)>0, 由此可知maxαVdegs(α;W)>0. 文中β的选择必然满足βW, 因为否则的话T导子的次数为零. 那么, 子空间W+Z(β;T)的维数的确严格大于W的维数. 当然, 其在T下不变是显然的.] 应用此过程于W=W0可以得到β1. 若W1=W0+Z(β1;T)仍然是真子空间, 那么就再次应用该过程于W1以得到β2. 将过程继续施行下去, 鉴于dimWk>dimWk1, 我们必然可以在不超过dimV步的情况下抵达Wr=V.

第2步. β1,,βr是满足第1步的条件a和b的非零向量. 固定k, 其中1kr. 令βV中任意的向量, f=s(β;Wk1). 如果fβ=β0+i=1k1giβi,βiWi那么f整除每个多项式gi并且存在γ0W0满足β0=fγ0. [译注: βiWi只是约束了β0W0, 其余则是已知的.]
如果k=1, 此即陈述W0T可容许的这个条件. 为了在k>1的情形下证明断言, 应用带余除法:gi=fhi+ri,ri=0或者degri<degf.我们想要证明的是对于每个iri=0. 令γ=βi=1k1hiβi既然γβWk1, 我们有s(γ;Wk1)=s(β;Wk1)=f而且fγ=β0+i=1k1riβi.设某个ri异于0, 我们可以推导出矛盾来. 令j=max{i{1,,k1}|ri0}, 那么fγ=β0+i=1jriβi,rj0degrj<degf.p=s(γ;Wj1), 既然Wj1Wk1, 导子f=s(γ;Wk1)必然整除p:存在多项式gp=fg.应用g(T)于前式两边, 可以得到:pγ=gfγ=grjβj+gβ0+i=1j1griβi.根据p的定义, pγWj1, 而且上式最右边两项之和也在Wj1之中, 所以grjβjWj1. 现在我们使用第1步的条件b:deg(grj)degs(βj;Wj1)=degpjdegs(γ;Wj1)=degp=deg(fg)因此, degrjdegf, 但这与j的选择相矛盾. 现在我们知道f整除每个gi, 于是β0=fγ. 既然WT可容许的, 存在γ0W0使得β0=fγ0. 顺带值得一提的是, 第2步是断言W1,W2,,Wr具有T可容许性的一种增强形式.

第3步. 存在非零向量α1,,αrV满足定理3的条件i和ii.
我们自第1步的向量β1,,βr始. 固定k, 其中1kr. 我们将第2步应用于β=βk, 那么T导子f=pk, 于是可以得到pkβk=pkγ0+i=1k1pkhiβi其中γ0W0h1,,hk1是多项式. 令αk=βkγ0i=1k1hiβi鉴于βkαkWk1, 我们知道s(αk;Wk1)=s(βk;Wk1)=pk既然pkαk=0, 可以得到Wk1Z(αk;T)={0}.因为每个αk都满足以上两式, 所以Wk=W0Z(α1;T)Z(αk;T)并且pkαkT零化子. [译注: 读者需要注意到因为βkαkWk1, 所以Wk1+Z(αk;T)=Wk1+Z(βk;T).] 换言之, 向量α1,,αr和向量β1,,βr定义了相同的子空间序列W1,W2,并且T导子pk=s(αk;Wk1)自然也满足最大性质, 即第1步的条件b. 其还具有额外的性质, 就是子空间W0,Z(α1;T),Z(α2;T),是线性无关的. 由此很容易验证定理3的条件ii. 既然对于每个i都有piαi=0, 我们有着平凡的关系pkαk=0+p1α1++pk1αk1现在应用第2步, 将β1,,βk替换为α1,,αkβ=αk, 那么可以得到结论: pk整除每个pi, 其中i<k.

第4步. 数字r和多项式p1,,pk在定理3的条件下是唯一的.
设除了向量α1,,αr之外非零向量γ1,,γs也满足定理3的条件, 也就是说V=W0Z(γ1;T)Z(γs;T)并且gk整除gk1, 其中k=2,,sgiγiT零化子. 我们要证明的是r=s以及对于每个ipi=gi.
很容易看出来p1=g1. 多项式g1实际上由前述条件可以被确定为从VW0T导子. S(V;W0)被定义为集合{fF[x]|对于每个βVfβW0}, 其中F是标量域; 换言之, 多项式fS(V;W0)当且仅当f(T)的像是W0的子集. 那么, S(V;W0)是多项式代数中的一个非零理想, 而多项式g1是该理想的首项系数为一的生成元. 以下是我们的理由. 每个βV都具有形式β=β0+f1γ1++fsγs于是g1β=g1β0+i=1sg1fiγi因为每个gi都整除g1, 所以对于每个ig1γi=0, 那么g1β=g1β0W0, 于是g1S(V;W0). 既然g1是将γ1送至W0的次数最低的首项系数为一多项式, 那么g1当然也是理想S(V;W0)中次数最低的首项系数为一多项式. 根据同样的论证, p1也应该是这个理想的首项系数为一的生成元, 所以p1=g1.
如果f是一个多项式, WV的一个子空间, 那么缩写fW将表示集合{fα|αW}. 我们将以下三个事实的验证留作练习.

  1. fZ(α;T)=Z(fα;T).
  2. 如果V=V1Vk, 其中每个Vi都在T下不变, 那么fV=fV1fVk.
  3. 如果αγ有着相同的T零化子, 那么fαfγ也有着相同的T零化子, 因而有dimZ(fα;T)=dimZ(fγ;T).
现在我们通过归纳来论证r=s以及对于i=2,,rpi=gi. 论证的手法在于以恰当的方式数维数. 我们将给出r2的情况下有p2=g2的证明, 由此怎样进行归纳则是清晰的. 设r2, 那么dimW0+dimZ(α1;T)<dimV既然我们已经知道了p1=g1, 那么Z(α1;T)Z(γ1;T)有着相同的维数. 因此, 也有dimW0+dimZ(γ1;T)<dimV这说明s2. 现在问是否有p2=g2是有意义的了. 从两个对于V的分解中, 我们可以得到两种对于p2V的分解方式:p2V=p2W0Z(p2α1;T)p2V=p2W0Z(p2γ1;T)Z(p2γs;T)这里用到了事实1和2, 以及对于i2p2αi=0. 既然我们已经知道了p1=g1, 事实3告诉我们Z(p2α1;T)Z(p2γ1;T)有着相同的维数. 显然, 我们可以得到dimZ(p2γi;T)=0,i2.于是, p2γ2=0, 那么g2整除p2. 同样的论证可以反过来以得到p2整除g2. 因此, p2=g2.

推论. 如果T是有限维向量空间上的一个线性算子, 那么每个T可容许子空间都具有T下不变的补子空间.
证明.W0V的一个可容许子空间. 若W0=V, 那么我们所寻求的补就是{0}. 若W0是真子空间, 那么就应用定理3, 令W0=Z(α1;T)Z(αr;T)于是W0T下不变且V=W0W0.
推论.T是有限维向量空间V上的一个线性算子.
  1. 存在向量αV满足αT零化子是T的极小多项式.
  2. T有循环向量当且仅当T的极小多项式和特征多项式相等.
证明. 如果V={0}, 那么结果平凡地成立. 如果V{0}, 令V=Z(α1;T)Z(αr;T)α1,,αrT零化子p1,,pr满足pk+1整除pk, 其中k=1,,r1. 正如我们在定理3的证明中所注意到的那样, 很容易看出p1T的极小多项式, 即从V{0}T导子. 我们已然证明了a.
我们在第7.1节中看到, 如果T拥有循环向量, 那么T的极小多项式和特征多项式恰好是相等的. 为了证明b, 还需要证明的是其逆. 应用定理a, 选择一个满足要求的α. 如果极小多项式的次数等于dimV, 那么Z(α;T)的维数为dimV, 即V=Z(α;T).
定理4. 一般Cayley-Hamilton定理.T是有限维向量空间V上的一个线性算子, pf分别为T的极小多项式和特征多项式.
  1. p整除f;
  2. pf拥有相同的素因子, 在不计重数的情况下;
  3. 如果p=f1r1fkrkp的素因子分解, 那么f=f1d1fkdk其中difiri(T)的零化度除以fi的次数.
证明. 我们就不考虑平凡情形V={0}了. 为了证明i和ii, 考虑由定理3得到的V的一个循环分解. 正如我们在定理3的第2个推论的证明中所注意到的, p1=p. 令UiTZ(αi;T)的限制, 那么Ui当然有循环向量, 于是pi既是Ui的极小多项式, 也是其特征多项式. 因此, 特征多项式f是乘积f=p1pr. 这从T在适当的基下呈现的分块形式矩阵看是显然的. 此时p1整除f是自明的, 这就证明了i. 显然任何p的素因子也是f的素因子. 反过来, f=p1pr的素因子必须整除其中一个pi, 于是又整除p=p1.
p=f1r1fkrkp的素因子分解. 准素分解定理 (第6章的定理12) 告诉我们, 如果Vifiri(T)的零空间, 那么V=V1Vk并且firi是算子Ti的极小多项式, 其中TiT于(不变)子空间Vi上的限制. 将当前定理的i和ii应用于Ti, 既然其是素因子fi之幂, 那么Ti的特征多项式必然具有fidi的形式, 其中diri. 显然, 我们得到了di=dimVidegfi而且根据定义有dimVi=nullity(firi(T)), 于是di=nullity(firi(T))degfi.既然T是算子T1,,Tk的直和, 那么特征多项式f是乘积f=f1d1fkdk.
译者注记. 这个即是第6章所说的对于Cayley-Hamilton定理的三个证明中的最后一个. 似乎此证明所依赖的循环分解定理 (定理3) 的证明中有个估计可能需要用到Cayley-Hamilton定理, 然而这并不意味着该证明存在循环论证的嫌疑, 因为那个估计实际上并不需要那么准确, 以极小多项式的存在性划定一个有限的上界就够了.
推论. 如果Tn维向量空间上的一个幂零线性算子, 那么T的特征多项式为xn.

现在让我们检视循环分解定理的矩阵类比. 如果我们拥有线性算子T和定理3的直和分解, 令𝔅iZ(αi;T)的"循环有序基"{αi,Tαi,,Tki1αi}.这里ki表示Z(αi;T)的维数, 或者说零化子pi的次数. 在有序基𝔅i下, 导出算子Ti的矩阵是多项式pi的同伴矩阵. 因此, 若𝔅是将𝔅1,,𝔅r按照顺序合并得到的V的有序基, 那么T𝔅下的矩阵为A=[A1000A2000Ar]其中Aipi的同伴矩阵, 大小为ki×ki. 一个n×n的矩阵A, 如果其为非标量首项系数为一多项式p1,,pr的同伴矩阵的直和且对于i=1,,r1pi+1整除pi, 那么我们称A具有有理形式. 循环分解定理告诉我们了以下结果.

译者注记. 读者需要注意一下, 本书的有理形式在顺序上与通行定义正好相反. 也就是说, 其他材料将形如A=[Ar000A2000A1]的矩阵称为有理形式.
定理5.F是一个域, B是域F上的一个n×n矩阵, 那么B在域F上相似于唯一的有理形式矩阵.
证明.TFn上在标准有序基下由B表示的线性算子. 正如我们刚才所观察到的那样, 存在Fn的某个有序基使得其下的T由有理形式A表示. 那么, B相似于这个矩阵A. 设BF上相似于另一个有理形式C. 这就意味着存在Fn的某个基使得其下的TC表示. 如果C是非标量首项系数为一多项式g1,,gs的同伴矩阵的直和, 其中对于i=1,,s1gi+1整除gi [译注: 以上是在复述定义], 那么我们有非零向量β1,,βsVg1,,gsT零化子满足V=Z(β1;T)Z(βs;T).但是, 根据循环分解定理的唯一性陈述, 多项式gi和定义了矩阵A的多项式pi应该是完全等同的, 于是C=A.

多项式p1,,pr被称为矩阵B不变因子. 在第7.4节, 我们将描述一个计算给定矩阵的不变因子的算法. 可根据施行于矩阵的元素上的有限次有理操作计算得出这些多项式的事实赋予了有理形式其名.

例子2.V是域F上的一个二维向量空间, TV上的一个线性算子. T的循环子空间分解的可能性是相当受限的. 这是因为如果T的极小多项式的次数为2, 那么它等于T的特征多项式, 于是T拥有循环向量. 因此, 存在V的某个有序基使得T由其特征多项式的同伴矩阵表示. 另一方面, 如果T的极小多项式的次数为1, 那么T是恒等算子的标量倍数. 若T=cI, 那么对于任意的两个线性无关的向量α1α2, 我们有V=Z(α1;T)Z(α2;T),p1=p2=xc.对于矩阵而言, 这样的分析是说每个域F上的2×2矩阵都在F上恰相似于以下两种类型的矩阵中的一种:[c00c],[0c01c1].
例子3.T3上由矩阵A=[566142364]表示的线性算子. 我们之前已经计算过了, T的特征多项式为f=(x1)(x2)2, 极小多项式为p=(x1)(x2). 因此, 我们知道在T的循环分解中, 第一个向量α1T零化子为p. 既然我们是在三维空间中讨论, 那么只能再有一个向量α2. 其必然生成的是一维的循环子空间, 即其必是T的一个特征向量. 其T零化子p2必然是(x2), 因为pp2=f. 注意到这立即告诉我们A相似于矩阵B=[020130002]T在某个有序基下由B表示. 我们该如何寻找合适的向量α1α2呢? 嗯, 我们知道任意能够生成二维T循环子空间的向量都是合适的α1, 所以先让我们试试ε1. 我们有Tε1=(5,1,3)其并非ε1的标量倍数, 因此Z(ε1;T)的维数是2. 这个空间由所有具有形式aε1+b(Tε1)=a(1,0,0)+b(5,1,3)=(a+5b,b,3b)的向量构成, 或者说由所有满足x3=3x2的向量(x1,x2,x3)构成. 现在我们想要寻找的是一个满足Tα2=2α2Z(α2;T)Z(ε1;T)={0}的向量α2. 既然α2T的特征向量, 那么空间Z(α2;T)必然是由α2张成的一维子空间, 于是我们的要求其实是α2Z(ε1;T). 如果α=(x1,x2,x3), 那么很容易通过计算得知Tα=2α当且仅当x1=2x2+2x3. 因此, α2=(2,1,0)是满足我们要求的一个向量. 读者应该直接验证有序基{(1,0,0),(5,1,3),(2,1,0)}T的矩阵即是上面的B.
例子4.TV上的一个可对角化算子. 将T的循环分解与对角化T的基联系起来是有趣的. 令c1,,ckT不同的特征值, Vi是与特征值ci关联的特征空间, 那么V=V1Vk并且如果di=dimVi, 那么f=(xc1)d1(xck)dkT的特征多项式. 如果αV, 那么很容易将循环子空间Z(α;T)和子空间V1,,Vk联系起来. 首先我们知道存在唯一的向量β1,,βk使得α=β1++βk其中βiVi. 既然Tβi=ciβi, 那么对于每个多项式f, 我们有f(T)α=f(c1)β1++f(ck)βk.给定任意的标量t1,,tk, 存在多项式f满足f(ci)=ti,1ik. 因此, Z(α;T)就是由向量β1,,βk张成的子空间. α的零化子是什么呢? 根据前面的讨论, f(T)α=0当且仅当f(ci)βi=0,1ik. 换言之, 只需要对于那些使得βi0if(ci)=0即可推出f(T)α=0. 据此, α的零化子是积βi0(xci).现在, 令𝔅i={β1i,,βdii}Vi的一个有序基, 令r=max1ikdi.我们通过αj=dijβji,1jr定义向量α1,,αr. 循环子空间Z(αj;T)是由向量βji张成的子空间, 其中i遍历所有满足dij的那些指标. αjT零化子是pj=dij(xci).我们有V=Z(α1;T)Z(αr;T)因为每个βji属于且仅属于子空间Z(α1;T),,Z(αr;T)其中的一个并且𝔅=(𝔅1,,𝔅k)V的一个基. [译注: 直和的论证稍显意味不明, 但是事实本身是容易看出的.] 根据pj的公式, 也很容易看出pi+1整除pi, i=1,,r1. [译注: 由此看出这的确是定理3中的循环分解.]
练习1.TF2上在标准有序基下由矩阵[0010]表示的线性算子. 令α1=(0,1). 证明F2Z(α1;T)且不存在非零向量α2F2满足Z(α2;T)Z(α1;T)={0}.
练习2.T是有限维向量空间V上的一个线性算子, RT的像.
  1. 证明R拥有一个与之互补的T不变子空间当且仅当RT的零空间N线性无关.
  2. 如果RN线性无关, 证明N是唯一的与R互补的T不变子空间.
练习3.T3上在标准有序基下由矩阵[200120003]表示的线性算子. 令WT2I的零空间. 证明W没有与之互补的T不变子空间. (提示: 令β=ε1, 观察到(T2I)βW, 证明不存在αW使得(T2I)β=(T2I)α.) [译注: W存在T不变的补子空间当且仅当WT可容许的.]
练习4.TF4上的线性算子, 其在标准有序基下由矩阵[c0001c0001c0001c]表示. 令WTcI的零空间.
  1. 证明W是由ε4张成的子空间.
  2. 找出理想S(ε4;T),S(ε3;T),S(ε2;T),S(ε1;T)的首项系数为一的生成元.
练习5.T是域F上的向量空间V上的一个线性算子. 如果f是域F上的一个多项式而αV, 令fα=f(T)α. 如果V1,,VkT不变子空间而V=V1Vk, 证明fV=fV1fVk.[译注: 这个是定理3的证明中留给读者补充证明的引理.]
练习6.T是域F上的向量空间V上的一个线性算子. 如果向量α,βV有着相同的T零化子, 证明对于任意的多项式f, fαfβ也有着相同的T零化子. [译注: 这个亦是定理3的证明中留给读者补充证明的引理.]
练习7. 找出以下每个实矩阵的极小多项式和有理形式.[011100100],[c010c111c],[cosθsinθsinθcosθ]
练习8.T3上的线性算子, 其在标准有序基下由矩阵[344132243]表示. 找出满足定理3条件的非零向量α1,,αr.
练习9.A是实矩阵A=[133313335].找出一个3×3的可逆实矩阵P使得P1AP是有理形式.
练习10.F是复数域的一个子域, TF4上的线性算子, 其在标准有序基下由矩阵[200012000a2000b2]表示. 找出T的特征多项式. 考虑a=b=1; a=b=0; a=0,b=1的情形. 在这三种情形下, 找出T的极小多项式以及满足定理3条件的非零向量α1,,αr.
练习11. 证明如果AB是域F上的3×3矩阵, 那么AB在域F上相似的充要条件是它们拥有相同的特征多项式和极小多项式. 给出一个例子表明对于4×4的矩阵而言这是不对的.
练习12.F是复数域的一个子域, AB是域F上的n×n矩阵. 证明如果AB在复数域上相似, 那么它们也在F上相似. (提示: 证明A的有理形式不论A被视为F还是上的矩阵都是一样的, B当然也是如此.)
练习13.A是一个n×n复矩阵, 证明如果A的每个特征值都是实数, 那么A相似于一个实矩阵.
练习14.T是有限维向量空间V上的一个线性算子, 证明存在满足以下性质的向量αV. 如果f是一个多项式而f(T)α=0, 那么f(T)=0. (这样的向量α被称为T的多项式代数的一个分离向量.) 当T拥有循环向量时, 给出循环向量也是分离向量的直接证明.
练习15.F是复数域的一个子域, AF上的一个n×n矩阵, pA的极小多项式. 如果我们将A视为上的矩阵, 那么A上也拥有一个极小多项式f. 使用关于线性方程组的定理证明p=f. 另外, 你能看出这也可由循环分解定理推得吗?
练习16.A是一个满足A2+I=0n×n实矩阵, 证明n是偶数, 并且如果n=2k, 那么A在实数域上相似于以下分块形式的矩阵[0II0]其中Ik×k的恒等矩阵.
练习17.T是有限维向量空间V上的一个线性算子, 设
  1. T的极小多项式是素多项式之幂;
  2. T的极小多项式等于特征多项式.
证明不存在非平凡的T不变子空间拥有T不变的补子空间.
练习18. 如果T是可对角化线性算子, 那么每个T不变子空间都有与之互补的T不变子空间.
练习19.T是有限维向量空间V上的一个线性算子, 证明T拥有循环向量当且仅当每个与T交换的线性算子U都是应用某个多项式于T的结果.
练习20.V是域F上的一个有限维向量空间, TV上的一个线性算子. 我们问何时V中的每个非零向量都是T的一个循环向量, 证明其成立的充要条件为T的特征多项式在F上不可约.
练习21.A是一个n×n实矩阵, Tn上在标准有序基下由A表示的线性算子, Un上在标准有序基下由A表示的线性算子. 使用练习20的结果证明以下结论: 若T仅有平凡的不变子空间, 那么U是可对角化的.

第7.3节 Jordan形式

N是有限维向量空间V上的一个幂零算子. 让我们检视由定理3获得的N的循环分解. 我们有一个正整数rr个非零向量α1,,αrV满足V=Z(α1;N)Z(αr;N)并且若p1,,pr分别是α1,,αrN零化子, 那么对于i=1,,r1pi+1整除pi. 既然N是幂零算子, 那么其极小多项式为xk, 其中kn. [译注: 这里的n是隐式的V的维数.] 因此, 每个pi都具有xki的形式, 而整除的条件可以被表达为k1k2kr.当然了, k1=k并且kr1. xki的同伴矩阵是ki×ki的矩阵Ai=[0000100001000010].因此, 定理3为我们提供了V的一个有序基使得其下的矩阵是Ai这样的初等幂零矩阵之直和, 而且随着i的增大, Ai的大小是在减小的. 从中读者可以看出, 与一个n×n的幂零矩阵相关联着的, 是一个正整数rr个正整数k1,,kr满足k1++kr=nkiki+1. 这些正整数确定了矩阵的有理形式, 即在相似意义下确定了矩阵是什么. [译注: 相似矩阵有着相同的有理形式, 这从循环分解的唯一性来看是显然的.]

还有一点是我们想要对于上述的幂零算子N指出的. 正整数r恰是N的零化度. 实际上, r个向量Nki1αi构成了N的零空间的一个基. 这是因为, 令αN的零空间中的一个向量, 我们可以将α写成α=f1α1++frαr的形式, 其中fi是多项式, 并且不妨设对于每个ifi=0或者degfi<ki. 既然Nα=0, 那么对于每个i可知0=N(fiαi)=Nfi(N)αi=(xfi)αi因此, xfixki整除. 但是, 因为fi=0或者degfi<ki, 这意味着fi=cixki1其中ci是某个标量, 那么我们就有α=c1(xk11α1)++cr(xkr1αr)其表明这r个向量的确是N的零空间的一个基. [译注: 这些向量之所以线性无关, 是因为它们是使得幂零算子呈现有理形式的基的一部分.] 读者也应该注意到这个事实从矩阵的角度来看是相当清晰的.

现在我们想要将我们关于幂零算子或者幂零矩阵的发现和第6章的准素分解定理结合起来. 情况如下: 设TV的一个线性算子并且T的特征多项式在标量域F上可以被分解为f=(xc1)d1(xck)dk其中c1,,ckF的不同元素而di1, 那么T的极小多项式为p=(xc1)r1(xck)rk其中1ridi. 若Wi(TciI)ri的零空间, 那么准素分解定理告诉我们V=W1Wk并且由TWi上的限制导出的算子Ti的极小多项式为(xci)ri. 令Ni=TiciI, 那么Ni是幂零的并且其极小多项式为xri. 在Wi上, T就表现为Ni加上标量ci倍的恒等算子. 设我们挑选了Wi的一个有序基使得Ni呈现有理形式, 那么Ti在此有序基下的矩阵应该是形式为[c0001c00c001c]的矩阵的直和, 并且每个c=ci. 更进一步, 这些矩阵的大小自左向右递减. 我们将以上这种形式的矩阵称为与特征值c相关联的基本Jordan矩阵. 现在如果我们将每个Wi的基放在一起, 那么我们就得到了V的一个有序基. 让我们来刻画T在这个有序基下的矩阵A.

矩阵A是矩阵A1,,Ak的直和A=[A1000A2000Ak]每个Ai都具有形式Ai=[J1(i)000J2(i)000Jni(i)]其中每个Jj(i)都是与特征值ci相关联的基本Jordan矩阵. 而且, 在每个Ai内部, 矩阵Jj(i)的大小随着j的增加而递减. 一个满足本段之前所述条件的n×n矩阵A (对于不同的标量c1,,ck) 被称为是具有Jordan形式.

刚才我们已经指出, 若线性算子T的特征多项式可在标量域上被完全分解, 那么存在V的一个有序基使得T由某个Jordan形式表示. 现在我们想要说明的是, 这个矩阵在某种意义下是唯一的, 实际上最多仅取决于将T的特征值ci写下来的顺序. 换句话说, 如果两个Jordan形式是相似的, 那么它们仅可能是在标量ci的顺序上有所不同.

我们可以从以下论证中看出唯一性. 设存在V的某个有序基使得T由前述的Jordan矩阵A表示. 如果Ai是一个di×di的矩阵, 那么di显然是ci作为A (或者说T) 的特征多项式的根的重数. 换言之, T的特征多项式为f=(xc1)d1(xck)dk.这表明c1,,ckd1,,dk除开顺序应该是唯一的. A为矩阵Ai之直和的事实为我们提供了一个T不变的直和分解V=W1Wk. 我们注意到Wi必然是(TciI)n的零空间, 其中n=dimV. 这是因为, AiciI显然是幂零的, 而对于ji, AjciI又显然是非奇异的. 于是, 我们看到子空间Wi是唯一的. 如果Ti是由TWi上的限制导出的算子, 那么矩阵Ai作为(TiciI)的有理形式加上ci倍的di×di恒等矩阵是唯一的. [译注: 原文似乎忘掉还需要为幂零算子的有理形式加上ci倍的恒等矩阵才是Ai. 另外, Ai的唯一性依赖于有理形式的唯一性, 虽然实际上其间还有一点点差距, 但因为并不困难, 就留给读者思考了.]

现在我们希望更深入地观察算子T及其在某个有序基下的Jordan矩阵A, 以下所列出的是我们的发现:

  1. A的每个元素, 若是不在主对角线上或者紧挨着主对角线的下方, 必然是0. A的对角线上的元素是Tk种不同的特征值c1,,ck. 并且, ci重复di次, 而dici作为特征多项式的根的重数, 即di=dimWi.
  2. 对于每个i, 矩阵Aini个与特征值ci有关的基本Jordan矩阵Jj(i)的直和. 数字ni恰为与特征值ci相关联的特征空间的维数. 这是因为, ni(TiciI)的有理形式的基本幂零块的数目, 因而等于(TciI)的零空间的维数. [译注: Wi(TciI)ri的零空间, 其中ri是一个正整数, 于是其显然包含(TciI)的零空间.] 特别地, 我们注意到T是可对角化的当且仅当对于每个i, ni=di. [译注: ni是所谓的几何重数, di是所谓的代数重数.]
  3. 对于每个i, 矩阵Ai的第一个块J1(i)是一个ri×ri的矩阵, 其中rici作为T的极小多项式的根的重数. 这可由幂零算子(TiciI)的极小多项式为xri的事实推得.

当然, 和之前一样, 我们也有直接的矩阵形式的结果. 如果B是域F上的一个n×n矩阵并且B的特征多项式可在域F上被分解完全, 那么B在域F相似于一个n×n的Jordan矩阵A, 而A在可以重排其特征值顺序的意义下是唯一的, 我们将A称为B的Jordan形式.

F是代数闭域, 那么上述评注则可应用于所有F上的有限维向量空间上的线性算子. 因此, 例如, 每个复数域上的n×n矩阵都相似于一个基本上唯一的Jordan形式. [译注: "基本上"的意思即不计特征值的顺序.]

例子5.T2上的一个线性算子, 那么T的特征多项式要么具有(xc1)(xc2)的形式, 其中c1c2是不同的复数, 要么具有(xc)2的形式. 在前一种情况下, T必然是可对角化的且在某个有序基下由[c100c2]表示. 在后一种情况下, T的极小多项式可能是(xc), 那么T=cI, 或者是(xc)2, 那么在此情况下T在某个有序基下可由矩阵[c01c]表示. 因此, 复数域上的每个2×2矩阵, 要么相似于一个对角矩阵, 要么相似于以上这种形式的矩阵, 二者不可兼得.
例子6.A3×3的复矩阵A=[200a20bc1]A的特征多项式显然是(x2)2(x+1). 若这也是A的极小多项式, 那么A相似于[200120001]或者极小多项式为(x2)(x+1), 那么A相似于[200020001]既然(A2I)(A+I)=[0003a00ac00]因而A相似于对角矩阵当且仅当a=0.
例子7.A=[20001200002000a2]A的特征多项式为(x2)4. 既然A是两个2×2矩阵的直和, A的极小多项式显然是(x2)2. 现在如果a=0或者a=1, 那么矩阵A是Jordan形式. 注意到对于a=0a=1, 我们得到的两个矩阵有着相同的特征多项式和极小多项式, 但是它们并不相似. 这是因为, a=0时矩阵(A2I)的解空间的维数是3, 而a=1时解空间的维数则是2. [译注: 相似矩阵的解空间可以被视为对于同一个线性算子的零空间的具体刻画, 不论怎样它们的维数至少应该是相同的.]
译者注记. 在例子8之前, 译者想要写一些注记, 尽管这只是第6章的例子14的译者注记的老调重弹而已. 微分运算D实际上并非n次连续可微函数空间Cn上的线性算子, 因为它甚至不是算子. 实际上, n次连续可微函数的导数并不一定仍然是n次连续可微的. 换言之, Cn压根就不对运算D封闭. 原文看似完美无瑕的论证势必要打上一点补丁才行, 而改动最小的方式就是将Cn改成C, 即仅考虑无穷可微函数空间中满足微分方程的解. 这里的例子8甚至考虑的仅是n次可微而不是n次连续可微, 但是我们译注的基点没有发生变化.
例子8. 常系数齐次线性微分方程 (第6章的例子14) 提供了对于Jordan形式的一种很好的刻画. 令a0,,an1是复数而V是定义在实轴的某个固定区间上满足微分方程dnfdxn+an1dn1fdxn1++a1dfdx+a0f=0的所有n次可微函数f构成的空间. 令D是微分算子, 那么VD下不变, 因为Vp(D)的零空间, 其中p=xn++a1x+a0.那么V上的微分算子的Jordan形式是什么样的呢?
c1,,ckp不同的复根, 那么p=(xc1)r1(xck)rkVi(DciI)ri的零空间, 即微分方程(DciI)rif=0的解集, 那么根据第6章例子14的观察, 准素分解定理告诉我们V=V1Vk.NiDciIVi上的限制算子, 那么(V上的)算子D的Jordan形式由分别位于空间V1,,Vk上的幂零算子N1,,Nk的有理形式决定.
所以说, 我们必须要知道的是(在各种各样的c下)空间Vc上的算子N=DcI的有理形式, 其中Vc是微分方程(DcI)rf=0的解集. [译注: 这里的r实际上是某个任意的正整数, 并且根据第6章的微分方程的例子, Vc的维数就是r. 当然, NVc上是幂零算子的事实是显然的.] N在有理形式下有多少基本幂零块呢? 这个数字是N的零化度, 即与特征值c相关联的特征空间的维数. [译注: 这里说的特征值指的是Vc上的微分算子D的特征值, 而且其特征值就是唯一的, 即c, 这可以从之前的观察中看出来.] 然而, 此维数必然是1, 因为任意满足微分方程Df=cf的函数都是指数函数h(x)=ecx的某个标量倍数. 因此, (空间Vc上的)算子N具有循环向量, 其一个比较好的选择是g=xr1h:g(x)=xr1ecx.那么这就给出Ng=(r1)xr2hNr1g=(r1)!h[译注: 这里的符号运用稍微值得解释一下. 在xr1h中, x代表将每个值映射至自身的函数, xr1表示这个函数的r1次幂, 但是这里的乘法是定义在函数上的, 即(fg)(x)=f(x)g(x), 那当然xr1h也应该这么解释. 对于其余类似的表达式, 我们还应该注意到诸如(r1)这样的常数被解释为常值函数.] 现在我们知道D(在空间V)上的Jordan形式是k个基本Jordan矩阵的直和, 其中每个都对应于一个根ci, 且大小为ri×ri.
练习1.N1N2是域F上的3×3幂零矩阵, 证明N1N2相似当且仅当它们拥有相同的极小多项式.
练习2. 使用练习1和Jordan形式的结果证明以下事实: 如果域F上的n×n矩阵AB有着相同的特征多项式f=(xc1)d1(xck)dk和相同的极小多项式, 并且没有di大于3, 那么AB是相似的.
练习3. 如果A是一个5×5的复矩阵, 其特征多项式为f=(x2)3(x+7)2而极小多项式为p=(x2)2(x+7)那么A的Jordan形式是什么呢?
练习4. 6×6的复矩阵, 若其特征多项式为(x+2)4(x1)2, 那么其Jordan形式有多少种可能呢?
练习5. 次数小于等于3的多项式构成的向量空间 [译注: 当然包括不能定义次数的零多项式] 上的微分算子, 其在"自然"有序基下由矩阵[0100002000030000]表示. 这个矩阵的Jordan形式是什么? (F是复数域的一个子域.)
练习6.A是复矩阵[200000120000102000010200111120000011]找出A的Jordan形式.
练习7. 如果域F上的n×n矩阵Af=(xc1)d1(xck)dk为特征多项式, 请问A的迹是多少?
练习8. 按照相似对于满足A3=I3×3复矩阵A进行分类.
练习9. 按照相似对于满足An=In×n复矩阵A进行分类.
练习10.n是大于1的整数, N是域F上一个满足Nn=0但是Nn10n×n矩阵, 证明N没有平方根, 即不存在n×n的矩阵A使得A2=N.
练习11.N1N2是域F上的6×6幂零矩阵, 设其拥有相同的极小多项式和相同的零化度, 证明N1N2是相似的. 说明为何这对于7×7的情况并不成立.
练习12. 使用练习11和Jordan形式的结果证明以下事实: 令AB是域F有着相同特征多项式f=(xc1)d1(xck)dk和相同极小多项式的n×n矩阵, 并且设对于每个i, (AciI)(BciI)的解空间有着相同的维数, 如果没有di大于6, 那么AB是相似的.
练习13. 如果N是一个k×k的基本幂零矩阵, 即Nk=0但是Nk10, 证明Nt相似于N. 现在使用Jordan形式来证明每个复矩阵都相似于其转置.
练习14. 以下证明有何错误? 如果A是一个n×n的复矩阵满足At=A, 那么A=0. (证明: 令JA的Jordan形式, 因为At=A, 所以Jt=J. 但是, 鉴于J是下三角矩阵, Jt=J可以推出J的每个元素都是0. 既然J=0A相似于J, 那么A=0.) (给出非零矩阵A满足At=A的例子.)
练习15. 如果N上的一个3×3的幂零矩阵, 证明A=I+12N18N2满足A2=I+N, 即AI+N的一个平方根. 使用(1+t)1/2的二项级数展开以得到类似的I+N的平方根公式, 其中N上任意的n×n的幂零矩阵.
练习16. 使用练习15的结果证明如果c是一个非零复数而N是一个幂零的复矩阵, 那么(cI+N)拥有平方根. 现在使用Jordan形式来证明每个非奇异的n×n复矩阵都拥有平方根.

第7.4节 不变因子的计算

A是域F上的一个n×n矩阵, 我们希望找到一种能够计算确定了A的有理形式的不变因子p1,,pr的方法. 让我们从简单的情况着手, 即A是首项系数为一多项式p=xn+cn1xn1++c1x+c0的同伴矩阵. 在第7.1节我们已经看到p既是A的极小多项式也是A的特征多项式, 但是现在我们希望直接给出计算以表明pA的特征多项式. 在此情况下, 特征矩阵为xIA=[x000c01x00c101x0c2000xcn20001x+cn1].将第n行乘上x加到第(n1)行上去, 这将移除第(n1)(n1)列的x, 但是不会改变其行列式的值. 接着, 将新的第(n1)行乘上x加到第(n2)行上去. 如此反复直至所有主对角线上的x都被移除. 这个过程的最终结果是矩阵[0000xn++c1x+c01000xn1++c2x+c10100xn2++c3x+c20000x2+cn1x+cn20001x+cn1]其与xIA有着相同的行列式, 而右上角是p. 通过列变换我们可以清理一下最后一列:[0000p10000010000000000010]将前(n1)列每个都乘上1, 然后通过(n1)次相邻的对换将当前的最后一列移到第一列的位置. 因其(对于行列式而言)总的效果就是2n2次的符号反转, 所以行列式仍然不变. 我们得到了矩阵[p000010000100001]此时p=det(xIA)这个事实是显然的.

现在我们将要表明, 对于任意的n×n矩阵A, 存在一系列行和列变换将xIA转换为上面这种形式的矩阵, 即A的不变因子沿着主对角线依次出现. 先让我们完全明了我们将要(对于行和列)施行的操作.

我们关心的是F[x]m×n, 即由所有以域F上的多项式为元素的m×n矩阵构成的集合. 如果M是这样的一个矩阵, 那么M上的一个初等行变换是以下三种操作中的一种:

  1. M的一行乘上F中的一个非零标量;
  2. M的第r行替换为第r行加上f倍的第s行, 其中f是域F上任意的多项式并且rs;
  3. 交换M的两行.
一个初等行变换的逆仍然是相同类型的初等行变换. [译注: 其实所谓类型不是良定的, 但是不要紧, 因为压根不会利用这个事实.] 注意到在1中, 我们要求的是非零标量而不是非零多项式, 因为非标量的多项式并非可逆, 若是如此则会导致不能作出初等行变换可逆的断言. 一个m×m初等矩阵, 即一个F[x]m×m中的初等矩阵, 是可由m×m的恒等矩阵通过单独一个初等行变换得到的矩阵. 显然对于M施行一个初等行变换可以等效为给M左乘一个相应的m×m的初等矩阵; 实际上, 如果e是这样的一个初等行变换, 那么e(M)=e(I)M.

M,NF[x]m×n, 我们称M行等价于N, 如果N可由M经过有限的一系列初等行变换得到:M=M0M1Mk=N.显然N行等价于M当且仅当M行等价于N, 所以我们可以使用术语"MN是行等价的". 如果N行等价于M, 那么N=PM其中m×m的矩阵P是初等矩阵之积:P=E1Ek.特别地, P是一个可逆矩阵, 其逆为P1=Ek1E11.当然, Ej的逆来源于初等行变换的逆. [译注: 多项式上的矩阵乘法也满足结合律, 所以逆矩阵自然是唯一的.]

刚才的这些内容就和域上的矩阵是一样的, 其平行于第1章的那些基本结果. 因此, 其所暗示的接下来的问题应该是如何引入多项式矩阵的行简化阶梯形式. 这里我们遇到了新的障碍. 之前我们是怎么对于矩阵进行行规约的呢? 第一步是选出第1行的首非零元, 然后将第1行的每个元素都除以那个元素. 对于元素为多项式的矩阵, 我们必然不能在一般情况下完成这个操作. 在接下来的定理中我们可以看到, 特定情形下我们可以绕开这个困难. 然而, 对于F[x]m×n而言, 并不存在适用于所有情况的行简化形式. 若是我们也引入列变换, 并研究兼用行列变换得到的等价关系, 那么对于每个矩阵我们可以得到一种相当有用的标准形式. 以下是我们的基本工具.

引理.MF[x]m×n, 设其第一列不全为零, 并令pM的第一列各元素的最大公因子, 那么M行等价于一个矩阵N, 其中N的第一列为[p00].
证明. 我们将要证明的东西比我们刚才所陈述的要强一点. 实际上, 我们表明了存在一个找到N的算法, 即一个可供机器执行以在有限步骤内计算N的描述. 首先, 我们需要一些记号.
MF[x]m×n具有非零的首列M1=[f1fm]定义l(M1)=minfi0degfip(M1)=gcd(f1,,fm)j是某个满足degfj=l(M1)的下标. 为了明确起见, 令j是满足要求的下标中最小的那个, 即j=min{i{1,,m}|degfi=l(M1)}. 我们尝试用fj去除每个fi:fi=fjgi+ri,ri=0或者degri<degfj.对于每个异于ji, 将M的第i行替换为第i行减去gi乘上第j行. 将第j行乘上首项系数的倒数以将fj化为首项系数为一的多项式, 然后交换第j行和第1行. 通过所有这些操作, 我们得到了一个矩阵M, 其第一列为M1=[fjr2rj1r1rj+1rm].我们已经给出了一个良定义的过程以将每个M转化为一个具有以下这些性质的M:
  1. M行等价于M;
  2. p(M1)=p(M1);
  3. 要么l(M1)<l(M1), 要么M1=[p(M1)00].
性质b和c是容易验证的. [译注: 为了验证性质b, 读者最好回顾一下第4章, 那里将f1,,fmgcd定义为由这些多项式生成的理想的首项系数为一的生成元. 并且, 第4章给出了gcd的一个等价定义, 其更符合我们的直觉, 即若首项系数为一的多项式d满足其整除f1,,fm且每个整除f1,,fm的多项式都整除d, 那么df1,,fmgcd. 或许, 利用等价定义说明性质b是更简单的, 但其实两种定义都差不多.] 实际上, 性质c只是在重述, 要么存在某个i使得ri0degri<degfj, 要么对于每个i都有ri=0, 于是fj成为f1,,fm的最大公因子.
现在要证明引理就相当简单了. 我们从矩阵M开始, 应用上述过程以得到M. 性质c告诉我们要么矩阵M就是引理所需要的N, 要么l(M1)<l(M1). 对于后一种情况, 我们再次应用该过程于M以得到矩阵M(2)=(M). 要是M(2)也不合适, 我们就构造M(3)=(M(2)), 如此进行下去. 证明的要义在于严格的不等式l(M1)>l(M1)>l(M1(2))>不可能无限延伸下去. 至多只需要l(M1)次过程迭代, 我们必定能够抵达具有我们所寻求性质的矩阵M(k). [译注: 这里其实存在一个无关紧要的细节问题, 就是迭代次数的上界严格说来是l(M1)+1, 原因如下. 首先, 除非一开始矩阵的第一列就是符合条件的, 否则都需要进行至少一次迭代. 其次, 迭代终止的条件为l应用于矩阵第一列的值不变. 也就是说, 尽管前面的迭代步骤都会导致l应用于矩阵第一列的值严格减小, 但是最后一步时总是不变的.]
译者注记. 将引理的背景去掉, 其实这就是求多个多项式的最大公因子的辗转相除法.
定理6.PF[x]m×m, 以下条件是等价的:
  1. P是可逆的;
  2. P的行列式是非零的标量多项式;
  3. P行等价于m×m的恒等矩阵;
  4. P是初等矩阵之积.
证明. 由i推出ii是显然的, 这是因为行列式函数是乘性的, 而F[x]中的可逆元素仅是非零的标量多项式. 实际上, 第5章我们已经通过古典伴随说明了i和ii是等价的. 这里我们的论证提供了由ii推出i的一个不同证明. 我们将坐一圈旋转木马 (merry-go-round)iiiiviii其实并不显然的命题只有从ii推出iii而已.
假定ii成立, 我们考虑P的第一列. 其包含特定的多项式p1,,pm而我们知道必然有gcd(p1,,pm)=1因为每个p1,,pm的公因子都必然整除det(P), 其为非零的标量多项式. 应用前述引理于P, 我们可以得到一个矩阵Q=[1a2am0B0]其行等价于P. 鉴于一次初等行变换至多只会改变矩阵的行列式以一个非零的标量因子, det(Q)也是一个非零的标量多项式. 显然, (m1)×(m1)的矩阵BQ有着相同的行列式. 因此, 我们可以继续将前述引理应用于B. 若是重复此步骤m次, 就可以得到一个上三角矩阵R=[1a2am01bm001]其行等价于P. 并且, R又显然等价于m×m的恒等矩阵.
推论.M,NF[x]m×n, 那么N行等价于M当且仅当N=PM其中PF[x]m×m是一个可逆矩阵.

现在我们以类比于初等行变换和行等价的方式来定义初等列变换列等价. 我们并不需要新的初等矩阵的概念, 因为施行一次初等列变换于恒等矩阵得到的矩阵类和施行一次初等行变换得到的是一样的.

定义. 矩阵N等价于矩阵M, 如果我们可以通过一系列变换从M得到N:M=M0M1Mk=N其中每一步都是一次初等行变换或者初等列变换.
定理7.M,NF[x]m×n, N等价于M当且仅当N=PMQ其中PF[x]m×mQF[x]n×n都是可逆矩阵.
定理8.AFn×n, p1,,prA的不变因子, 那么矩阵xIA等价于一个n×n的对角矩阵, 其对角线上的元素依次为p1,,pr,1,1,,1.
证明. 存在可逆矩阵PFn×n使得P1AP成为有理形式, 即具有分块形式P1AP=[A1000A2000Ar]其中Ai是多项式pi的同伴矩阵. 根据定理7, 矩阵P1(xIA)P=xIP1AP等价于xIA. 现在我们有xIP1AP=[xIA1000xIA2000xIAr]其中的各个I是具有适当大小的恒等矩阵. 根据本节开头的讨论, 我们表明了xIAi等价于矩阵[pi00010001].将以上得到的结果组合一下, 显然xIA等价于这样的对角矩阵, 其主对角线上具有多项式pi(nr)1. 通过交换行和列, 可以将对角线元素按照我们想要的顺序排列, 即: p1,,pr,1,,1.

定理8的证明并未给出计算不变因子p1,,pr的有效方法, 因为其依赖于循环分解定理. 现在我们将给出一个规约行列式矩阵为对角形式的显式算法. 定理8的证明暗示了我们也可以将主对角线上的相继元素安排成前一个整除后一个的样子. [译注: 也就是说, 反转整个主对角线上的元素的顺序.]

定义.NF[x]m×n, 我们称N具有(Smith)规范形式, 如果
  1. N的每个偏离主对角线的元素都是0;
  2. N的主对角线上的元素依次是f1,,fl, 其满足fk整除fk+1, 1kl1.
在以上定义中, 数字l=min(m,n), 而主对角线元素是fk=Nk,k,k=1,,l.
译者注记. 作者在定义里遗漏了一个细节, 其后果是规范形式并非唯一. 实际上, 这里还需要添加额外的限制条件, 即主对角线上的非零元素的首项系数均为一.
定理9.MF[x]m×n, 那么M等价于一个具有规范形式的矩阵N.
证明. 鉴于原文的证明存在一些基本问题, 又很难通过直接打上补丁修复完善, 因此译者自行编制了一个证明, 其已经尽量在精神上与原文保持一致.
如果M=0, 那么M本身就具有规范形式, 无需证明. 如果M0, 我们想要(通过初等行变换和初等列变换)将其化为与之等价的形式M=[f1000R0]其中首项系数为一的多项式f1整除矩阵R的每个元素. 若我们的确能够施行此项操作, 实际上证明就结束了. 这是因为我们可以再次将该过程应用于R以得到多项式f2, 并且我们知道f1整除f2. 不断迭代下去, 我们最终将抵达所需的规范形式.
l(M)=minMi,j0degMi,j. 为了简单起见, 我们将以归纳法叙述证明. 如果l(M)=0, 这是显然的, 因为此时M具有某个标量元素, 只需将其化为1然后移动到左上角, 最后消去第一列和第一行的其他元素即可. 对于l(M)>0, 我们令k=l(M), 并作归纳假设: 对于任意的矩阵NF[x]m×n, 如果l(N)<k, 那么我们可以运用初等行变换和初等列变换将其化为我们想要的形式. 现在我们找出矩阵M中一个具有最低次数的元素, 然后将其移动到左上角来. 我们可以通过初等行变换将第一列除第一行以外的元素化为其除以第一行元素的余式. 若余式不均为零, 那么整个矩阵的元素的最低次数就减小了, 运用归纳假设即可. 否则的话, 我们将注意力放到第一行上来. 如法炮制, 我们可以通过初等列变换将第一行除了第一列以外的元素化为其除以第一列元素的余式. 若存在不为零的余式, 则又可使用归纳假设. 如果上面两个手段失效了, 此时第一行和第一列除左上角元素外均已化为零. 那么, 左上角的元素是否整除右下角的(m1)×(n1)分块矩阵的每个元素呢? 如果是, 那么就结束了. 否则的话, 即存在某个元素不能被左上角整除, 我们将包含该元素的列加到第一列上去. 明显地, 我们再次将第一列除了第一行之外的元素化为其除以第一行元素的余式. 此时可以肯定某个余式不为零, 即我们创造了利用归纳假设的条件. 至此证明全然结束了.
最后我们还想顺便说一句, 尽管这个以归纳法进行的证明似乎是声明性的, 但是实际上其已足够指导我们施行一个过程算法来将矩阵化为我们所需要的形式, 或者说其可以导出一个这样的过程. 或许, 这是因为归纳和递归天然就是类似的.

我们想要表明与一个矩阵M相关联的规范形式是唯一的. 我们已经见过的两件事实提供了定理9中的多项式f1,,fl何以被M唯一确定的线索. 首先, 初等行变换和初等列变换至多改变一个方阵的行列式以非零的标量因子. 其次, 初等行变换和初等列变换不会改变矩阵的元素的最大公因子. [译注: 实际上, 这两个事实之间的关系是递进的, 而后者才是真正的线索. 以下我们将证明, 确定了矩阵的Smith规范形式的不变因子 (即规范形式的主对角线上的元素) 可由所谓的行列式因子决定.]

定义.MF[x]m×n, 如果1kmin(m,n), 我们将δk(M)定义为M的所有k×k子矩阵的行列式的最大公因子. [译注: 在许多中文教材中, k×k的子矩阵的行列式常被称为k阶子式, 而δk(M)常被称为Mk阶行列式因子. 值得注意的是, 某一阶的子式可能全部为零, 此时的行列式因子要么设为未定义的, 要么就定义为零.]

回忆一下, M的一个k×k子矩阵是将M的某mk行和某nk列删去得到的东西. 换言之, 我们挑选了两个特定的k元组I=(i1,,ik),1i1<<ikmJ=(j1,,jk),1j1<<jkn然后由M的这些行和列构造了矩阵. 我们感兴趣的是行列式DI,J(M)=det[Mi1,j1Mi1,jkMik,j1Mik,jk].多项式δk(M)是诸多项式DI,J(M)的最大公因子, 其中IJ遍历所有可能的前述k元组.

定理10. 如果M,NF[x]m×n是等价的矩阵, 那么δk(M)=δk(N),1kmin(m,n).
证明. 实际上证明单次初等行变换e不会改变δk就够了, 而又因为e是可逆的, 所以我们只需要证明: 对于每个k而言, 如果多项式f整除所有DI,J(M), 那么f整除所有DI,J(e(M)), 其中I,J是一切可能的前述k元组.
既然我们在考虑行变换, 令α1,,αmM的行, 并且我们采用记号DJ(αi1,,αik)=DI,J(M).[译注: 严格说来, 这个定义方式稍有问题, 但是记号的含义还算是明确, 即以这些行构造矩阵, 取J指定的列来构造子矩阵, 最后计算其行列式.] 给定IJ, DI,J(M)DI,J(e(M))之间有什么关系呢? 考虑变换e的三种类型:
  1. 给第r行乘上一个非零标量c;
  2. 将第r行替换为第r行加上g倍的第s行, 其中rs;
  3. 交换第r行和第s行, 其中rs.
暂时忘掉类型c的操作, 让我们专注于类型a和b, 其仅改变第r行. 如果r不在下标i1,,ik之中, 那么显然DI,J(e(M))=DI,J(M).如果r在下标i1,,ik之中, 那么对于这两种类型的操作我们有
  1. DI,J(e(M))=DJ(αi1,,cαr,,αik)=cDJ(αi1,,αr,,αik)=cDI,J(M)
  2. DI,J(e(M))=DJ(αi1,,αr+gαs,,αik)=DI,J(M)+gDJ(αi1,,αs,,αik)
对于类型a的操作, 显然任意整除DI,J(M)的多项式f也整除DI,J(e(M)). 对于类型c的操作的情况, 注意到
  1. 如果存在j使得s=ij, 那么DJ(αi1,,αs,,αik)=0;
  2. 否则的话, 即对于所有j都是sij, 那么DJ(αi1,,αs,,αik)=±DI,J(M).
这个I是将k元组(i1,,s,,ik)按照升序重新排列得到的. 应该很明了的是, 如果f整除每个DI,J(M), 那么f整除每个DI,J(e(M)). [译注: 这里的I,J就不是给定的两个k元组了, 而是所有可能的情况.]
对于类型c操作的情况, 大致上也可遵循相同的论证手段, 或者说实际上其可以被实现为类型a和b操作的组合.
推论. 每个矩阵MF[x]m×n都恰等价于一个具有规范形式的N. 出现在N的主对角线上的多项式f1,,flfk=δk(M)δk1(M),1kmin(m,n)其中为了方便起见, 我们定义δ0(M)=1.
证明. 如果规范形式Nf1,,fl为对角线元素, 那么很容易看出来δk(N)=f1f2fk.
译者注记. 这个推论及其证明大体上是正确的, 就是有点粗糙. 问题在于, 可能存在某个k使得所有k阶子式都为零. (当然, 对于每个kk, k阶子式也都为零.) 至于如何细致地解决这个问题, 也就是说将推论及其证明陈述得圆满, 那就留给读者了.

当然了, 我们将推论中的矩阵N称为M规范形式. 多项式f1,,fl常被称为M不变因子.

AFn×n而令p1,,prA的不变因子. 现在我们可以看出矩阵xIA的规范形式的对角线元素依次是1,1,,1,pr,,p1. 前面的推论告诉我们如何基于xIA的子矩阵 [译注: 其实就是各阶行列式因子] 来表达p1,,pr. 数字nrmax{k{1,,n}|δk(xIA)=1}. A的极小多项式p1A的特征多项式除以xIA的所有(n1)×(n1)的子矩阵的最大公因子 [译注: 也就是(n1)阶行列式因子], 诸如此类.

练习1. 对还是错? 每个F[x]m×n中的矩阵都行等价于一个上三角矩阵.
练习2.T是有限维向量空间上的一个线性算子, AT在某个有序基下的矩阵, 那么T拥有循环向量当且仅当(xIA)的各(n1)×(n1)子矩阵的行列式互素.
练习3.AFn×n, 设f1,,fnxIA的规范形式的对角线元素. 对于什么样的矩阵Af11呢?
练习4. 构造一个以x2(x1)2为极小多项式且以x3(x1)4为特征多项式的线性算子T. 描述T下对于向量空间的准素分解, 并找出投影至这些不变子空间的算子. 找到一个基使得T的表示矩阵呈现Jordan形式. 最后, 显式给出定理3中的循环分解 (其将向量空间分解为T循环子空间的直和), 并求出不变因子.
练习5.T8上的线性算子, 其在标准有序基下由矩阵A=[1111111100000001000000010110000100011000011111010111101100000000]表示.
  1. 找出特征多项式和不变因子.
  2. 找出8T下的准素分解以及相应的那些投影. 对于准素分解的每个直和分量, 找出如定理3那样的循环分解.
  3. 找出A的Jordan形式.
  4. 如定理3那样, 将8分解为T循环子空间的直和. (提示: 一种做法是使用b的结果并对于例子4中所讨论的想法进行适当泛化.)

第7.5节 总结; 半单算子

在前一章和本章中, 我们一直在处理有限维向量空间V上的单独一个线性算子T. 既定的流程在于将T分解为比较简单的线性算子的直和, 这是为了获得T是如何在空间V上进行"操作"的详细信息. 让我们简要回顾一下现在我们所立之地.

最初我们使用特征值和特征向量来研究T. 我们引入了可对角化算子的概念, 其可以基于特征值和特征向量被完全刻画. 接着, 我们观察到T可能连一个特征向量都没有. 即便是标量域为代数闭域的情形, 此时每个线性算子都至少拥有一个特征向量, 我们注意到这些T的特征向量也未必能够张成整个空间.

于是, 我们证明了循环分解定理, 将任意的线性算子表达为拥有循环向量的算子的直和, 这无需对于标量域进行任何假定. 如果U是拥有循环向量的一个线性算子, 那么存在一个基{α1,,αn}满足Uαj=αj+1,j=1,,n1Uαn=c0α1c1α2cn1αnU在这个基上的作用为将每个αj偏移为下一个向量αj+1, 除了Uαn是基中这些向量的某个线性组合. 既然一般的线性算子T都是有限数目的这样的线性算子U的直和, 我们可以得到对于T的作用的一种显式而又相当简单的描述.

接下来我们将循环分解定理应用于幂零算子. 在标量域为代数闭域的情形下, 我们将其与准素分解定理相结合, 可以得到所谓的Jordan形式. Jordan形式给出了空间V的一个基{α1,,αn}, 其使得对于每个j, 要么Tαjαj的标量倍数, 要么Tαj=cαj+αj+1. 这样的一个基当然以一种显式而又简单的方式刻画了T的作用.

有理形式 (或者Jordan形式) 的重要性在于其存在性, 而非其在特定情形下可以被计算出来. 当然了, 如果给定一个线性算子并可计算其循环形式 [译注: 也就是有理形式] 或者Jordan形式, 那就是应该要做的事情. 这是因为, 若是我们拥有如此形式, 则可一口气报出大量关于T的信息. 标准形式的计算之中会出现两种不同类型的困难. 一种困难当然是计算可能会过于冗长. 另一种困难在于即便拥有必要的时间和耐心, 可能也没有任何方法能够施行意图的计算. 比如说, 第二种类型的困难出现于尝试计算一个复矩阵的Jordan形式时. 鉴于分解特征多项式并无良定的方法, 因而读者可能在问题的外围就卡住了. 不过, 我们的确在第7.4节表明了存在一个找出给定n×n矩阵的有理形式的算法. 然而, 这样的计算通常都是极其繁琐的. [译注: 当然, 就译者所处的时代而言, 读者完全可以使用计算机来施行这种计算.]

在以上我们对于本章和前一章的总结中, 我们尚未提及一个我们已经证明了的定理. 这个定理是说, 如果T是某个代数闭域上的向量空间上的线性算子, 那么其可以被唯一地分解为相互交换的一个可对角化算子和一个幂零算子之和. 这个结果是由准素分解定理和关于可对角化算子的特定信息推得的. 它不像循环分解定理或者Jordan形式的存在性那样深刻, 但是它的确在特定的数学部分里有着重要的用途. 为了给本章作结, 我们将证明了一个类似的定理, 但不假定标量域为代数闭域. 我们先来定义一种算子, 其将扮演着与可对角化算子类似的角色.

定义.V是域F上的一个有限维向量空间, TV上的一个线性算子. 我们称T半单 (semi-simple) 的, 如果每个T不变的子空间都拥有一个与之互补的T不变的子空间.

我们要证明的是, 只需要对于域F作出一些限制, 那么每个线性算子T都可以被唯一地表示为T=S+N的形式, 其中S是半单的, N是幂零的, 而且SN=NS. 首先, 我们将要通过极小多项式来刻画半单算子, 而这种刻画将表明, 当F是代数闭域时, 一个线性算子是半单的当且仅当其是可对角化的.

引理.T是有限维向量空间V上的一个线性算子, 令V=W1WkT的准素分解. 换言之, 如果pT的极小多项式而p=p1r1pkrkp的素因子分解, 那么Wjpjrj(T)的零空间. 令WV的任意在T下不变的子空间, 那么W=(WW1)(WWk).
证明. 为了证明这个引理, 我们需要回忆一下第6.8节中我们对于准素分解定理的证明的一个推论. 如果E1,,Ek是与分解V=W1Wk对应的投影, 那么每个Ej都是应用某个多项式于T的结果. 也就是说, 存在多项式h1,,hk使得Ej=hj(T).
现在令W是在T下不变的一个子空间. 如果αW, 那么α=α1++αk, 其中αjWj. 既然αj=Ej(α)=hj(T)α并且WT下不变, 每个αj也在W之中. 因此, 每个αW都具有α=α1++αk的形式, 其中αjWWj. 这个表达方式当然是唯一的, 鉴于V=W1Wk. 也就是说, 我们得到了W=(WW1)(WWk).
引理.T是有限维向量空间V上的一个线性算子, 设T的极小多项式在标量域F上不可约, 那么T是半单的.
证明.WV的一个在T下不变的子空间, 我们必须要证明W拥有一个与之互补的T不变子空间. 根据定理3的一个推论, 实际上证明{如果多项式f和向量βV满足f(T)βW, 那么存在αW使得f(T)β=f(T)α}就足够了. 于是, 设βV和多项式f满足f(T)βW. 若f(T)β=0, 令α=0, 那么αW并且f(T)β=f(T)α. 若f(T)β0, 那么f不被T的极小多项式p整除. 既然p是素多项式, 那么fp是互素的. 也就是说, 存在多项式gh使得fg+ph=1. 因为p(T)=0, 我们就有f(T)g(T)=I, 而这又能推出β必然在子空间W之中, 鉴于β=g(T)f(T)β=g(T)(f(T)β)其中f(T)βWWT下不变. 取α=β即可.
定理11.T是有限维向量空间V上的一个线性算子, 那么T为半单算子的充要条件是T的极小多项式p具有p=p1pk的形式, 其中p1,,pk是互异的标量域F上的不可约多项式. [译注: 虽然没有显式说明, 但是p1,,pk当然默认是非标量且首项系数为一的了.]
证明.T是半单算子, 我们将证明在对于极小多项式p的素因子分解中, 没有不可约多项式会重复出现. 假设其否定成立, 那么存在某个非标量的首项系数为一多项式g满足g2整除p. 令W是算子g(T)的零空间, 那么WT下不变. 现在对于某个多项式hp=g2h, 既然g并非标量多项式, 那么算子g(T)h(T)并非零算子. 于是, 存在βV使得g(T)h(T)β0, 即(gh)β0. 虽然(gh)βW, 鉴于g(ghβ)=g2hβ=pβ=0, 但是并无αW能够使得ghβ=ghα. 这是因为, 如果αW, 那么(gh)α=(hg)α=h(gα)=h(0)=0.也就是说, W没有与之互补的T不变子空间, 这与T是半单算子的假设矛盾.
现在设p的素因子分解为p=p1pk, 其中p1,,pk是互异的不可约(非标量)首项系数为一的多项式. [译注: 作者似乎终于回想起来第4章里不可约多项式和素多项式是两个不同的概念.] 令WV的一个在T下不变的子空间, 我们将证明W拥有一个与之互补的T不变的子空间. 令V=W1WkT的准素分解, 即令Wjpj(T)的零空间. 令TjTWj上由限制导出的算子, 于是Tj的极小多项式为素多项式pj. 现在WWjWj的一个在Tj下 (或者说在T下) 不变的子空间. 根据前面的第二条引理, 存在Wj的一个在Tj下不变的子空间Vj使得Wj=(WWj)Vj. 当然, 既然VjTj下不变, 其肯定也在T下不变. 那么, 我们有V=W1Wk=(WW1)V1(WWk)Vk=[(WW1)(WWk)]V1Vk根据之前的第一条引理, 我们知道W=(WW1)(WWk). 于是, 若令W=V1Vk, 那么V=WWWT下不变.
推论. 如果T是某个代数闭域上的有限维向量空间上的线性算子, 那么T是半单的当且仅当T是可对角化的.
证明. 如果标量域F是代数闭域, 那么F上的首项系数为一的素多项式都具有xc的形式. 在这种情况下, T是半单算子当且仅当T的极小多项式为p=(xc1)(xck), 其中c1,,ckF的不同元素, 而这恰恰就是我们在第6章建立的刻画T为可对角化算子的准则.

我们应该指出, T是半单算子当且仅当存在某个多项式f, 其是不同的素多项式之积, 使得f(T)=0. 这仅是与极小多项式为不同的素多项式之积的条件在表面上有所区别. [译注: 这里说的不同, 更准确地说, 实际上是互素, 因为我们不计标量缩放的差异.]

现在我们将注意力转移到将线性算子表示为交换的半单算子与幂零算子之和的问题上来. 在这里, 我们要限制标量域为复数域的一个子域. 机敏的读者可能会看出来要义在于域F应该是一个特征为零的域. 也就是说, 对于每个正整数n, F中的和1++1 (n1相加) 不应该为0. 对于域F上的多项式f, 我们用f(k)代表fk阶形式导数. 换一种记号的话, 就是f(k)=Dkf, 其中D是多项式空间上的形式微分算子. 如果g是另一个域F的多项式, 那么我们用f(g)代表应用fg的结果, 即由应用多项式f于线性代数F[x]中的元素g得到的多项式. [译注: 应用域F上的多项式于域F上的含幺元的线性代数的元素的操作在第4章中被定义, 当然这里的域不需要什么额外的限制.]

引理. Taylor公式.F是一个特征为零的域, gh是域F上的多项式. 如果f也是域F上的多项式并且degfn, 那么f(g)=k=0n1k!f(k)(h)(gh)k.[译注: 这个实际上是第4章最后一节的某个练习.]
证明. 我们要证明的是一般化了的Taylor公式. 若令h=cg=x, 我们则可得到原本的公式, 即f=f(x)=f(c)+f(1)(c)(xc)+f(2)(c)2!(xc)2++f(n)(c)n!(xc)n.对于这一般公式的证明实际上只是二项式定理(a+b)k=ak+kak1b+k(k1)2!ak2b2++bk的一个应用. 读者应该看出来, 既然替换和微分是线性过程, 那么只需要对于f=xk的情况证明公式成立就足够了, 因为f=k=0nckxk的一般情形可再由线性组合推得. 若f=xk, 其中kn, 那么Taylor公式是在说gk=hk+khk1(gh)+k(k1)2!hk2(gh)2++(gh)k这不过就是gk=[h+(gh)]k的二项式展开而已. [译注: 对于j>k, f(j)=0.]
译者注记. "替换和微分是线性过程"是说对于任意的标量ab, 对于任意的多项式fg, 对于任意的非负整数k, 我们有(af+bg)(h)=a[f(h)]+b[g(h)]以及(af+bg)(k)=af(k)+bg(k)于是最终得到a[f(k)(h)]+b[g(k)(h)]=[af(k)+bg(k)](h)=(af+bg)(k)(h)
引理.F是复数域的一个子域, f是域F上的一个首项系数为一的多项式, ff的形式导数, 那么以下陈述是等价的:
  1. f的素因子分解中各项互异;
  2. ff互素;
  3. 若将f视为域上的多项式, f没有重复的根.
证明. 陈述a和b的等价性实际上就是第4章的定理11 (而且那里的域可以是任意的), 所以不再赘述. 为了看出陈述c与a和b的等价性, 我们只需观察到以下事实. 对于域F上的多项式fg, 它们作为域F上的多项式而互素等价于其作为域上的多项式而互素. 我们将这个的证明留作练习. 取g=f, 注意到在f被视为上的多项式时, c就是a, 因而b和c是等价的.
译者注记. 这个观察到的事实可以通过带余除法的唯一性和辗转相除法说明.

现在我们可以证明一个定理, 其使得半单算子和可对角化算子之间的关系更加明晰.

定理12.F是复数域的一个子域, V是域F上的一个有限维向量空间, TV上的一个线性算子, AT在某个有序基下的表示矩阵, 那么T是半单算子当且仅当A在复数域上相似于一个对角矩阵.
证明.pT的极小多项式. 根据定理11, T为半单算子当且仅当p在域F上的素因子分解p=p1pkp1,,pk互异. 根据前述引理, T是半单算子当且仅当p在复数域上没有重复的根.
当然, p也是矩阵A的极小多项式. [译注: 读者或许可以回忆一下, 极小多项式并不会因为域的扩张而改变.] 我们知道A在复数域上相似于一个对角矩阵当且仅当极小多项式没有重复的复根. 这就证明了定理12.
定理13.F是复数域的一个子域, V是域F上的一个有限维向量空间, TV上的一个线性算子, 那么存在V上的半单算子S和幂零算子N使得
  1. T=S+N;
  2. SN=NS.
而且, 半单算子S和幂零算子N可由i和ii唯一确定, 它们都是应用某个多项式于T得到的结果.
证明.p1r1pkrkT的极小多项式的素因子分解, f=p1pk, r=max(r1,,rk), 那么f是互异的首项系数为一的素多项式之积, 且frT的极小多项式整除, 于是fr(T)=0.我们将要构造一个多项式序列g0,g1,g2,使得对于每个自然数n=0,1,2,, 有f(xj=0ngjfj)fn+1整除. 我们取g0=0, 那么f(xg0f0)=f(x)=ff整除. 设我们已经选定了g0,,gn1, 令h=xj=0n1gjfj根据假设, f(h)fn整除. 我们想要找出一个gn使得f(hgnfn)fn+1整除. 我们应用一般Taylor公式, 然后可以得到f(hgnfn)=k=0degf1k!f(k)(h)(gnfn)k=f(h)gnfnf(h)+fn+1b其中b是某个多项式. [译注: 如果注意一下细节的话, 这里degf1n1.] 根据假设, 存在多项式q满足f(h)=qfn. 因此, 为了使得f(hgnfn)fn+1整除, 只需要选择令[qgnf(h)]f整除的gn就可以了, 这的确是可以做到的. 鉴于p1,,pk互异, 所以ff互素. 也就是说, 存在多项式ae满足af+ef=1. 将其应用于h, 我们就得到a(h)f(h)+e(h)f(h)=1.gn=q[e(h)], 那么qgnf(h)=qq[e(h)]f(h)=q[a(h)]f(h)=q2[a(h)]fn[qgnf(h)]f整除. [译注: 这里的方括号仅是为了明示运算的顺序, 而非应用多项式之意.]
现在我们已经有了一个序列g0,g1,使得fn+1整除f(xj=0ngjfj)并且g0=0. 让我们取n=r1, 既然fr(T)=0, 我们有f(Tj=0r1gj(T)fj(T))=0.[译注: 这里用到了[f(g)](T)=f(g(T))的事实.] 令N=j=1r1gj(T)fj(T)=j=0r1gj(T)fj(T)既然j=1ngjfjf整除, 我们看出来Nr=0, 即N是一个幂零算子. 令S=TN, 那么f(S)=f(TN)=0. 鉴于f是不同的首项系数为一的素多项式之积, 那么S的极小多项式的素因子分解中也不可能出现重复的因子, 所以S是半单的.
现在我们有T=S+N, 其中S是一个半单算子, N是一个幂零算子, 并且它们都是应用某个多项式于T的结果, 因而是交换的. 为了证明唯一性的陈述, 让我们从标量域F转移到复数域上来考虑问题. 令𝔅是空间V的某个有序基, 那么我们有[T]𝔅=[S]𝔅+[N]𝔅其中[S]𝔅在复数域上是可对角化的, 而[N]𝔅是一个幂零矩阵, 并且它们还是交换的. 根据第6章中我们已经证明了的结果, 这样的两个矩阵是唯一确定的.
译者注记. 实际上第6章只表述了线性算子的版本, 若将其写成矩阵的形式, 则是以下定理.
定理. 对于域F上的n×n矩阵A, 若A的极小多项式可以在域F上被分解为一次因子之积, 那么存在可对角化矩阵DFn×n和幂零矩阵NFn×n满足
  1. A=D+N;
  2. DN=ND.
其中可对角化矩阵D和幂零矩阵N由条件i和ii唯一确定, 并且它们都是应用某个多项式于A得到的结果.
练习1. 对于标量域为复数域的一个子域的有限维向量空间V, 如果NV上的一个幂零线性算子, 那么对于任意的多项式f, f(N)的半单部分是恒等算子的一个标量倍数.
练习2.F是复数域的一个子域, VF上的一个有限维向量空间, TV上的一个半单线性算子. 如果f是域F上任意的一个多项式, 那么f(T)也是半单的.
练习3. 设标量域为复数域的一个子域, 对于向量空间上的一个线性算子T, 证明T是半单算子当且仅当对于任意的多项式f, f(T)是幂零算子可以推出f(T)=0.