线性代数

第9章 内积空间上的算子

第9.1节 引论

我们将第8章所处理的大部分议题视为基础的, 即每个人都应该知道的材料. 本章是面向更加优秀的学生以及那些迫不及待想要扩展自己关于内积空间上的算子的知识的读者的. 这里呈现的材料更加复杂, 一般牵涉更多的技术, 除了主轴定理, 其基本上就是重述定理18关于自伴算子的酉/正交对角化的结果, 以及第9.2节中关于形式的其他结果. 我们要求读者更加成熟, 就像第5章和第7章的后半部分那样. 论证和证明以更加凝缩的风格编写, 并且几乎没有多少用以润滑的例子. 然而, 我们已经预见到了这种困难, 所以为读者提供了大量的练习.

起初的三节致力于关于内积空间上的形式以及形式与线性算子之间的关系的结果. 接下来的一节处理谱论, 即第8章牵涉自伴算子和正规算子的对角化的定理18和22的推论. 最后一节里, 我们研究实内积空间上的正规算子, 由此我们检视了第6章的准素分解定理之于正规算子的意蕴.

第9.2节 内积空间上的形式

如果T是域F上的有限维内积空间V上的一个线性算子, 那么由f(α,β)=Tα|β定义的函数f:V×VF可以被视为T的一种替代物. 诸多关于T的问题都等价于关于f的问题. 实际上, 很容易看出来f可以确定T. 这是因为, 如果𝔅={α1,,αn}V的一个规范正交基, 那么T𝔅下的矩阵AAj,k=f(αk,αj)给出. 从更加抽象的角度理解为什么f可以确定T是重要的. f的重要性质在以下定义中得以描述.

定义. 一个域F (F是实数域或复数域) 上的向量空间V上的(半双线性)形式是一个函数f:V×VF满足对于任意的α,β,γV和任意的标量c
  1. f(cα+β,γ)=cf(α,γ)+f(β,γ);
  2. f(α,cβ+γ)=cf(α,β)+f(α,γ).

因此, 半双线性形式f使得f(α,β)在固定的β下是α的线性函数, 而在固定的α下是β的共轭线性函数. 在实情形下, f(α,β)对于每个参数都是线性的. 换言之, f是一个双线性形式. 在复情形下, 除非f=0, 否则半双线性形式f不会是双线性形式. 在本章的剩余部分里, 除非确有必要, 否则形容词"半双线性"一律省略.

如果fgV上的形式而c是任意的标量, 那么很容易验证cf+g也是一个形式. 换言之, 任意的形式的线性组合仍然是一个形式. 因此, V上的所有形式构成的集合是向量空间FV×V的一个子空间, 其中F是向量空间V的标量域.

定理1.V是一个有限维内积空间, fV上的一个形式, 那么存在唯一的V上的线性算子T满足对于任意的α,βV都有f(α,β)=Tα|β.并且, 由此定义的映射fT是从形式的空间到L(V,V)的一个同构.
证明. 固定一个向量βV, 那么αf(α,β)V上的一个线性泛函. 根据第8章的定理6, 存在唯一的向量βV使得对于每个α, 我们有f(α,β)=α|β. 定义函数U:VV,ββ, 那么f(α,cβ+γ)=α|U(cβ+γ)=cf(α,β)+f(α,γ)=cα|Uβ+α|Uγ=α|cUβ+Uγ对于任意的α,β,γV和任意的标量c成立. 因此, UV上的一个线性算子. 令T=U, 则有对于所有的α,βV, f(α,β)=Tα|β. 如果我们也有线性算子T使得f(α,β)=Tα|β, 那么TαTα|β=0.于是, 对于每个αV, Tα=Tα. 换言之, 对于每个形式f, 存在唯一的线性算子Tf使得对于每个α,βV, 我们有f(α,β)=Tfα|β.如果fg是形式而c是标量, 那么(cf+g)(α,β)=Tcf+gα|β=cf(α,β)+g(α,β)=cTfα|β+Tgα|β=(cTf+Tg)α|β对于任意的α,βV成立, 因而Tcf+g=cTf+Tg.换言之, fTf是一个线性映射. 对于每个fL(V,V), 等式f(α,β)=Tα|β定义了一个形式f使得Tf=T. 并且, 如果Tf=0, 那么f=0. 因此, fTf的确是一个同构.
推论. 等式f|g=tr(TfTg)定义了形式的空间上的一个内积, 并且对于每个V的规范正交基{α1,,αn}, 我们有f|g=j=1nk=1nf(αk,αj)g(αk,αj).
证明. 根据第8章的例子3, 很容易推出(T,U)tr(TU)L(V,V)上的一个内积. 既然fTf是一个同构, 第8章的例子6表明f|g=tr(TfTg)也是一个内积. [译注: 实际上, 前一个内积也是通过第8章的例子6得到的.] 现在设AB分别是TfTg在规范正交基𝔅={α1,,αn}下的矩阵, 那么Aj,k=Tfαk|αj=f(αk,αj)Bj,k=Tgαk|αj=g(αk,αj).这可以推出f|g=tr(TfTg)=tr(AB)=j=1nk=1nAj,kBj,k=j=1nk=1nf(αk,αj)g(αk,αj)
定义. 如果fV上的一个形式而𝔅={α1,,αn}V的一个有序基, 那么由Aj,k=f(αk,αj)定义的矩阵A被称为f在有序基𝔅下的矩阵.

𝔅是一个规范正交基时, f𝔅下的矩阵也是线性变换Tf𝔅下的矩阵, 但是在一般情况下并非如此.

如果Af在有序基𝔅={α1,,αn}下的矩阵, 那么f(s=1nxsαs,r=1nyrαr)=r=1ns=1nyrAr,sxs对于任意的标量xsyr成立. 换言之, 矩阵A具有f(α,β)=YAX的性质, 其中XY分别是αβ在有序基𝔅下的坐标矩阵.

f在另外一个基αj=i=1nPi,jαi,1jn下的矩阵由式子A=PAP给出, 这是因为Aj,k=f(αk,αj)=f(s=1nPs,kαs,r=1nPr,jαr)=r=1ns=1nPr,jAr,sPs,k=(PAP)j,k既然对于酉矩阵而言, 我们有P=P1, 因而与酉等价相关的结果也可应用于对形式的研究.

定理2.f是有限维复内积空间V上的一个形式, 那么存在V的一个规范正交基使得其下的f的矩阵是上三角的.
证明.TV上的线性算子, 其满足对于任意的α,βVf(α,β)=Tα|β. 根据第8章的定理21, 存在V的一个规范正交基𝔅={α1,,αn}使得T在其下的矩阵是上三角的. 根据之前的观察, 我们知道此时f的矩阵和T的矩阵是相同的. 换言之, f在规范正交基𝔅下的矩阵是上三角的.
定义. 实或复向量空间V上的形式f被称为Hermite的, 如果对于每个α,βVf(α,β)=f(β,α).

如果T是有限维内积空间V上的线性算子, 而f是由f(α,β)=Tα|β定义的形式, 那么f(β,α)=α|Tβ=Tα|β换言之, f是Hermite的当且仅当T是自伴的.

译者注记. 上述观察, 即便没有有限维的条件, 也同样成立.

f是一个Hermite形式, 那么对于每个向量α, f(α,α)是实数. 在复向量空间上, 这个性质就刻画了Hermite形式.

定理3.V是一个复向量空间而fV上的一个形式, 如果对于每个向量αVf(α,α)为实数, 那么f是一个Hermite形式.
证明.αβV中的向量, 我们必须证明f(α,β)=f(β,α). 现在我们有f(α+β,α+β)=f(α,α)+f(α,β)+f(β,α)+f(β,β).既然f(α+β,α+β), f(α,α), f(β,β)都是实数, f(α,β)+f(β,α)也应该是实数. 对于α+iβ施行相同的论证, 我们又可以得到if(α,β)+if(β,α)是实数. 我们知道实数的共轭等于其本身, 于是f(α,β)+f(β,α)=f(α,β)+f(β,α)if(α,β)+if(β,α)=if(α,β)if(β,α)给第二个等式乘上i, 然后再加上第一个等式, 我们就得到2f(α,β)=2f(β,α)f(α,β)=f(β,α).
推论.T是有限维复内积空间V上的一个线性算子, 那么T是自伴算子当且仅当对于每个αV, Tα|α是实数.
译者注记. 实际上, 即便没有有限维的条件, 以上推论仍然成立.
定理4. 主轴定理. 对于有限维内积空间V上的每个Hermite形式f, 存在V的一个规范正交基使得f在其下由一个实对角矩阵表示.
证明. 根据定理1, 存在唯一的线性算子T使得f(α,β)=Tα|β. 根据之前的观察, 既然f是Hermite形式, 那么T是自伴算子. 根据第8章的定理18, 我们知道存在V的一个规范正交基𝔅使得T由对角矩阵表示. 当然, 根据第8章的定理15, 这个对角矩阵的元素均为实数. 我们知道, f在规范正交基𝔅下的矩阵即T𝔅下的表示, 所以f𝔅下也由实对角矩阵表示.
推论. 对于有限维内积空间V上的Hermite形式f, 存在一个规范正交基𝔅使得对于每个α,βV, 若(x1,,xn)(y1,,yn)分别是αβ𝔅下的坐标, 那么f(α,β)=j=1ncjxjyj其中c1,,cn是固定的实数.
练习1. 请问下列函数f:2×2中哪些是2上的(半双线性)形式, 其中我们设α=(x1,x2), β=(y1,y2)?
  1. f(α,β)=1.
  2. f(α,β)=(x1y1)2+x2y2.
  3. f(α,β)=(x1+y1)2(x1y1)2.
  4. f(α,β)=x1y2x2y1.
练习2.f((x1,x2),(y1,y2))=x1y1+x2y22上的形式, 找出f在以下的每个基下的矩阵:{(1,0),(0,1)},{(1,1),(1,1)},{(1,2),(3,4)}.
练习3.A=[1ii2]g(X,Y)=YAX2×1上的形式, 那么g是一个内积吗?
练习4.V是一个复向量空间而fV上的一个对称的(半双线性)形式, 即f(α,β)=f(β,α), 那么f是什么呢?
练习5.f((x1,x2),(y1,y2))=x1y1+4x2y2+2x1y2+2x2y12上的形式, 找到一个有序基使得f由一个对角矩阵表示.
练习6. 称形式f为(左)非退化的, 如果对于每个向量βf(α,β)=0可以推出α=0. 令f是有限维内积空间V上的一个形式, 证明f是非退化的当且仅当其对应的线性算子Tf (定理1) 是非奇异的.
练习7.f是有限维向量空间V上的一个形式. 参考练习6给出的左非退化的概念, 定义右非退化, 并证明f是左非退化的当且仅当f是右非退化的.
练习8.f是有限维向量空间V上的一个非退化形式 (练习6和7), LV上的一个线性泛函, 证明存在唯一的βV使得对于每个αVL(α)=f(α,β).
练习9.f是有限维向量空间V上的一个非退化形式, 证明每个线性算子S都有一个"相对于f的伴随", 即一个线性算子S满足对于每个α,βVf(Sα,β)=f(α,Sβ).

第9.3节 正定形式

本节我们将讨论非负(半双线性)形式以及其与向量空间上的给定内积之间的关系.

定义. 给定实或复向量空间V, 其上的形式f被称为非负的, 如果f是Hermite的并且对于每个αVf(α,α)0; 其上的形式f被称为正定的, 如果f是Hermite的并且对于每个非零向量αVf(α,α)>0.
译者注记. "非负"这个术语现在一般被"半正定"所代替.

V上的正定形式实际上就是V上的内积. 非负形式几乎就是内积了, 除了某些非零向量可能"正交"于自身.

f是有限维向量空间V上的一个形式, 𝔅={α1,,αn}V的一个有序基, Af在基𝔅下的矩阵, 即Aj,k=f(αk,αj). 如果α=x1α1++xnαn, 那么f(α,α)=f(j=1nxjαj,k=1nxkαk)=j=1nk=1nxjxkf(αj,αk)=j=1nk=1nxkAk,jxj于是, 我们看出来f是非负形式当且仅当A=A[译注: 这是f为Hermite形式的充要条件] 且j=1nk=1nxkAk,jxj0对于任意的标量x1,,xn成立.为了使得f成为正定形式, 以上的不等式必须对于每个(x1,,xn)0严格成立. 刚才我们推导出的条件说明fV上的一个正定形式当且仅当函数g(X,Y)=YAX是列矩阵空间Fn×1上的正定形式, 其中F是向量空间V的标量域.

定理5.F是实数域或者复数域, A是域F上的一个n×n矩阵, 那么由g(X,Y)=YAX定义的函数gFn×1上的正定形式当且仅当存在一个可逆矩阵PFn×n满足A=PP.
证明. 对于任意的n×n矩阵A, 函数g都是列矩阵空间上的(半双线性)形式. 我们想要证明的是, g为正定的当且仅当A=PP. 首先, 设A=PP, 那么g是Hermite的, 并且g(X,X)=XPPX=(PX)PX0P是可逆的, 那么X0PX0, 于是(PX)PX>0.
现在, 设g是列矩阵空间上的正定形式, 那么g就是一个内积, 因而存在列矩阵Q1,,Qn使得δj,k=g(Qj,Qk)=QkAQj但是, 这不过就是在说, 如果Q是以Q1,,Qn为列的矩阵, 那么QAQ=I. 既然{Q1,,Qn}相对于内积g是一个规范正交基, 所以Q是可逆的. 令P=Q1, 我们就得到A=PP.

在实践中, 验证一个给定的矩阵A满足我们到目前为止给出的正定判则并非易事. 定理5的一个推论是, 若g为正定形式, 那么det(A)>0, 因为det(A)=det(PP)=(detP)(detP)=|det(P)|2.然而, det(A)>0并不足以保证g是正定形式. 不过, 存在与A相关联的n个行列式具有此性质: 如果A=A且这些行列式均为正数, 那么g是一个正定形式.

定义.A是域F上的一个n×n矩阵, 那么A顺序主子式 (principal minor)是由Δk(A)=det[A1,1A1,kAk,1Ak,k],1kn定义的n个标量Δ1(A),,Δn(A).
引理.A是域F上的一个n×n的可逆矩阵, 那么以下陈述是等价的.
  1. 存在一个主对角线元素全为1的上三角矩阵P使得B=AP是下三角矩阵.
  2. A的顺序主子式均异于0.
证明.P是任意的n×n矩阵, 置B=AP, 那么Bj,k=r=1nAj,rPr,k.如果P是一个主对角线均为1的上三角矩阵, 那么r=1k1Aj,rPr,k=Bj,kAj,k.既然B为下三角矩阵等价于j<k时有Bj,k=0, 因而B为下三角矩阵当且仅当r=1k1Aj,rPr,k=Aj,k,j<k.我们可以将以上式子看成是关于Pr,k的线性方程组, 那么陈述a就等价于该方程组有解.
实际上, 我们最好将这个大的线性方程组按照k拆分. 对于每个k=2,,n, 我们有一个关于未知元P1,k,,Pk1,k的具k1个方程的线性方程组, 其系数矩阵为[A1,1A1,k1Ak1,1Ak1,k1]这个矩阵的行列式即顺序主子式Δk1(A). 若陈述b成立, 那么这些线性方程组都有唯一解. 也就是说, 大的线性方程组也有唯一解. 于是, 陈述a成立, 并且矩阵P实际上是唯一的. 因此, 陈述b可以推出陈述a.
现在设a成立, 那么Δk(B)=Δk(AP)=Δk(A)Δk(P)=Δk(A)=B1,1Bk,k其中Δk(AP)=Δk(A)Δk(P)利用了P是上三角矩阵的事实. 既然AP均可逆, 那么B也可逆. 鉴于下三角矩阵B可逆等价于Bk,k0,k=1,,n, 于是Δk(A)0,k=1,,n.
定理6.f是有限维向量空间V上的一个形式, AfV的某个有序基𝔅下的矩阵, 那么f是正定形式当且仅当A=A并且A的顺序主子式均为正数.
证明. 让我们先来证明这个定理有趣的一半. 设A=A, 并且Δk(A)>0,1kn. 根据引理, 存在(唯一的)主对角线均为1的上三角矩阵P使得B=AP是下三角矩阵. 矩阵P当然是一个下三角矩阵, 于是PB=PAP也是下三角的. 既然A是自伴的, 那么D=PAP也是自伴的. 显然, 自伴的下三角矩阵必然是一个对角矩阵. 按照前面引理的证明里的类似手法, 我们可以推出Δk(D)=Δk(PB)=Δk(P)Δk(B)=Δk(B)=Δk(A)鉴于D是一个对角矩阵, 其顺序主子式为Δk(D)=D1,1Dk,k.因为A的顺序主子式均为正数, 所以D的顺序主子式也均为正数, 那么我们可以推出Dk,k>0,1kn.如果A是形式f在有序基𝔅={α1,,αn}下的矩阵, 那么D=PAP是形式f在有序基{α1,,αn}下的矩阵, 其中αj=i=1nPi,jαi.既然D是主对角线元素均为正数的对角矩阵, 那么显然有XDX>0,X0.这就说明f是一个正定形式.
现在反过来设f是正定形式. 我们知道A=A, 但是该怎么说明Δk(A)>0,1kn呢? 令Vk是由α1,,αk张成的子空间, 而fkfVk×Vk上的限制, 那么显然fkVk上的正定形式, 且fk在有序基{α1,,αk}下的表示为Ak=[A1,1A1,kAk,1Ak,k].作为定理5的推论, 我们注意到每个正定形式fk的矩阵表示Ak的行列式都应该是正数, 即A的每个顺序主子式Δk(A)均为正数.

这里有一些我们应该作出的评注, 以完成我们对于正定形式和正定矩阵之间的关系的讨论. 什么刻画了表示正定形式的矩阵? 如果f是有限维复向量空间上的一个形式, Af在某个有序基下的矩阵, 那么f是正定的当且仅当A=AXAX>0,X0.根据定理3, A=A的条件是多余的, 因为XAX>0,X0可以推出A=A. 另一方面, 如果f是有限维实向量空间上的形式而Af在某个有序基下的矩阵, 那么f是正定的当且仅当A=AtXtAX>0,X0.我们想要强调的是, 实情形下XtAX>0,X0无法推出A=At. 然而, 值得注意的是, 如果实矩阵A满足A=AtXtAX>0,X0, 那么即便对于每个复的列矩阵X, 我们也有XAX>0,X0.这是因为, 若X=Y+iZ, 其中Y,Zn×1, 那么(Y+iZ)A(Y+iZ)=(YtiZt)A(Y+iZ)=YtAY+ZtAZ+i(YtAZZtAY)而在A=At的情况下, 有YtAZ=ZtAY.

如果A是一个n×n的复矩阵并且满足XAX>0,X0那么我们就称A是一个正定矩阵. 我们已经知道, 有限维复向量空间上的形式是正定的当且仅当其在某个有序基下的矩阵是正定矩阵. (这里的"某个"也可以被替换为"每个".) 但是, 刚才的评注告诉我们, 即便是在实情形下, 我们还是可以断言形式正定的充要条件为其在某个有序基下的矩阵正定. 当然, 我们这里将实矩阵也视为复矩阵. 不过, 读者需要注意的是, 即便是实矩阵, 其正定的条件亦是相对于每个非零的复列矩阵而言的.

现在设V是一个有限维内积空间而fV上的一个非负形式, 那么存在唯一的V上的一个自伴算子T满足f(α,β)=Tα|β并且T还具有Tα|α0的额外性质.

定义.V是一个有限维内积空间. V上的一个线性算子T非负的, 如果T=T且对于每个αVTα|α0. V上的一个线性算子T正定的, 如果T=T且对于每个α0Tα|α>0.

如果V是一个有限维的(实或复)向量空间而|V上的一个内积, 那么V上有个与之相关联的正定算子类. 通过定理1所描述的映射, V上所有正定形式构成的集合与所有正定算子构成的集合之间存在一个双射. 我们将以本节的练习来强调正定算子, 正定形式, 正定矩阵之间的关系. 以下的总结或许是有用的.

如果A是一个复数域上的n×n矩阵, 那么以下陈述是等价的.

  1. A是正定矩阵, 即对于不全为零的复数x1,,xn, 我们有j=1nk=1nxkAk,jxj>0.
  2. X|Y=YAXn×1的复矩阵空间上的一个内积.
  3. 相对于n×1的复矩阵空间上的标准内积X|Y=YX, 线性算子XAX是正定的.
  4. 存在某个可逆的Pn×n满足A=PP.
  5. A=AA的顺序主子式均为正数.
A的每个元素均为实数, 那么以上这些又等价于
  1. A=At且对于不全为零的实数x1,,xn, 我们有j=1nk=1nxkAk,jxj>0.
  2. X|Y=YtAXn×1的实矩阵空间上的一个内积.
  3. 相对于n×1的实矩阵空间上的标准内积X|Y=YtX, 线性算子XAX是正定的.
  4. 存在某个可逆的Pn×n满足A=PtP.

练习1.V是带有标准内积的2, 对于什么样的向量αV, 存在一个正定算子T使得α=Tε1呢?
练习2.V是带有标准内积的2, 如果θ是一个实数, 令Tθ是逆时针旋转θ的线性算子, 即Tθ(x1,x2)=(x1cosθx2sinθ,x1sinθ+x2cosθ)θ为何值时Tθ是正定算子呢?
练习3.Vn×1, 而其上的内积为X|Y=YGX, 这里的Gn×n要使得该公式的确定义了一个内积. 令A是一个n×n的矩阵而线性算子T(X)=AX. 找出T. 如果YV的一个固定元素, 找出确定了线性泛函XYX的元素ZV. 换言之, 对于每个XVYX=X|Z.
练习4.V是一个有限维内积空间. 如果TUV上的正定算子, 证明(T+U)也是正定算子. 给出一个例子表明TU不必是正定的.
练习5.A=[1121213].
  1. 证明A是正定的.
  2. V2×1, 而其上的内积为X|Y=YtAX. 现在定义X1=[10],X2=[01]请应用Gram-Schmidt过程以找出V的一个规范正交基.
  3. 找出一个2×2的可逆实矩阵P使得A=PtP.
练习6. 以下哪些矩阵是正定的?[1234],[11+i1i3],[111211311],[11213121314131415]
练习7. 给出一个n×n矩阵的例子, 其所有顺序主子式均为正数, 但是并非正定矩阵.
练习8. (x1,x2)|(y1,y2)=x1y1+2x2y1+2x1y2+x2y2定义了2上的一个内积吗?
练习9. 证明正定矩阵的每个主对角线元素均为正数.
练习10.V是一个有限维内积空间. 如果TUV上的线性算子, 当UT为正定算子时我们记T<U. 证明以下断言:
  1. T<UU<T不能同时成立.
  2. 如果T<UU<S, 那么T<S.
  3. 如果T<U0<S, ST<SU不必成立.
练习11.V是一个有限维内积空间而EV在其某个子空间上的正交投影.
  1. 证明对于任意的正数c, 算子cI+E是正定的.
  2. E表达满足T2=I+E自伴线性算子T.
练习12.n是一个正整数而A=[112131n1213141n+11n1n+11n+212n1].证明A是正定的.
练习13.A是一个自伴的n×n矩阵, 证明存在正数c使得矩阵cI+A是正定的.
练习14. 证明两个正定线性算子之积是正定的当且仅当它们交换.
练习15.ST是正定算子, 证明ST的每个特征值都是正数.

第9.4节 更多关于形式的结果

本节包含两个结果, 其给出了关于(半双线性)形式的更加详细的信息.

定理7.V是一个实或复向量空间, WV的一个有限维子空间并且{α1,,αr}是其一个有序基. 令fV上的一个形式而M是由Mj,k=f(αk,αj)定义的r×r矩阵. 如果W={βV|对于任意的αWf(α,β)=0}那么WV的一个子空间, 并且WW={0}当且仅当M可逆. 当的确如此时, V=WW.
证明. 如果β,γWc是一个标量, 那么对于每个αW, 我们可以推出f(α,cβ+γ)=cf(α,β)+f(α,γ)=0.因此, W的确是V的一个子空间.
现在设α=k=1rxkαkβ=j=1ryjαj那么f(α,β)=k=1rj=1ryjMj,kxk=k=1r(j=1ryjMj,k)xk由此可知βW当且仅当方程组j=1ryjMj,k=0,1kr成立, 因而WW{0}当且仅当齐次线性方程组j=1rMj,kyj=0,1kr具有非平凡解. 换言之, WW={0}等价于M可逆, 但M可逆当且仅当M可逆.
M可逆并令A=(M)1=(M1)我们定义V上的函数gjgj(β)=k=1rAj,kf(αk,β)那么gj(cβ+γ)=k=1rAj,kf(αk,cβ+γ)=ck=1rAj,kf(αk,β)+k=1rAj,kf(αk,γ)=cgj(β)+gj(γ)也就是说, 每个gj的确都是V上的线性泛函. 因此, 我们可以定义V上的一个线性算子EEβ=j=1rgj(β)αj既然gj(αn)=k=1rAj,kf(αk,αn)=k=1rAj,kMk,n=(AM)j,n=δj,n我们可以推出E(αn)=αn,1nr换言之, 对于每个αW, Eα=α. 现在我们知道E的像是W并且E2=E, 即E是从VW上的投影. 若βV中任意的一个向量, 那么f(αn,Eβ)=f(αn,j=1rgj(β)αj)=j=1rgj(β)f(αn,αj)=j=1r(k=1rAj,kf(αk,β))f(αn,αj)既然A=M1, 我们可以推出f(αn,Eβ)=k=1r(j=1rAk,jf(αn,αj))f(αk,β)=k=1r(j=1rMk,j1Mj,n)f(αk,β)=k=1rδk,nf(αk,β)=f(αn,β)换言之, 对于每个αW, 我们有f(α,β)=f(α,Eβ), 于是f(α,βEβ)=0对于所有αWβV成立. 那么, (IE)βW, 根据等式β=Eβ+(IE)β我们可以断言V=W+W. 当然, 依照前面的论证, 这个和是一个直和, 即V=WW. 证明的最后, 还有一点值得提及的是, IE实际上是从VW的投影. 若βW, 那么Eβ=0, 因此(IE)β=β, 即WIE的像. 另外, 根据第6章的推理, IE的确是一个幂等线性算子.

证明中构造的投影E可由以下性质刻画: Eβ=α当且仅当αWβαW. 因此, E独立于其构造过程中用到的W的基. 因此, 我们可以称E是由直和分解V=WW确定的从VW上的投影. 注意到E是一个正交投影当且仅当W=W.

译者注记. 对于以上这段话, 读者应该回忆一下第6章和投影相关的内容. 另外, 译者觉得这最后一句话有点问题, 因为这个定理的条件并没有说V是一个内积空间, 所以这个空间里还没有正交的概念. 但是, 在一般的内积空间中, 这个论断的确是正确的, 并且W无需是有限维的.
定理8.V是一个有限维的实或复向量空间, fV上的一个形式而AfV的某个有序基{α1,,αn}下的矩阵. 如果A的顺序主子式均异于零, 那么存在唯一的主对角线元素全为1的上三角矩阵P使得PAP是一个上三角矩阵.
证明. 既然Δk(A)=Δk(A), A的顺序主子式也都异于零. 因此, 根据定理6的引理, 存在一个主对角线元素全为1的上三角矩阵P满足AP是一个下三角矩阵. 于是, PA=(AP)是一个上三角矩阵. 既然两个上三角矩阵之积仍然是上三角矩阵, PAP是一个上三角矩阵. 这表明了P的存在性, 但没有说明P的唯一性. 然而, 其实有一个更加几何的论证方法可以同时说明P的存在性和唯一性.
Wk是由α1,,αk张成的子空间, 而Wk={βV|对于任意的αWkf(α,β)=0}既然Δk(A)0, 那么由Mi,j=f(αj,αi)=Ai,j定义的k×k矩阵M是可逆的. 根据定理7, 我们有V=WkWk.Ek是由这个直和分解决定的从VWk上的投影, 并置E0=0, 设βk=αkEk1αk,1kn那么β1=α1, 而k>1时有Ek1αkWk1. 于是, 对于k>1, 存在唯一的标量Pj,k使得Ek1αk=j=1k1Pj,kαj.再置Pk,k=1以及j>kPj,k=0, 我们就得到了一个n×n的上三角矩阵P, 其主对角线元素均为1, 并且对于k=1,,n, 我们有βk=j=1kPj,kαj.1ii<k, 那么βiWiWiWk1. 既然βkWk1, 可以推出f(βi,βk)=0.Bf在有序基{β1,,βn}下的矩阵表示, 那么Bk,i=f(βi,βk).于是, k>iBk,i=0, 因而B是一个上三角矩阵. 另一方面, 根据关于形式的基变换的讨论, 我们有B=PAP.反过来, 设P是一个满足我们要求的矩阵, 即P是一个主对角线元素均为1的上三角矩阵使得PAP也是上三角的, 置βk=j=1nPj,kαj=j=1kPj,kαj,1kn那么{β1,,βk}显然是Wk的一个基. 对于k>1, {β1,,βk1}Wk1的一个基, 而且当i<k时有f(βi,βk)=0 [译注: 这是因为f(βi,βk)=(PAP)k,iPAP是一个上三角矩阵], 由此我们可以看出βkWk1. 定义βk的公式告诉我们αk=(j=1k1Pj,kαj)+βk.既然(j=1k1Pj,kαj)Wk1βkWk1又鉴于V=Wk1Wk1Ek1αk=(j=1k1Pj,kαj)这实际上就完全确定了P1,k,,Pk1,k的可能性, 进而完全确定了矩阵P. 当然, 我们可以很容易看出这个P正是我们之前说明存在性时所构造出来的矩阵.

第9.5节 谱论

本节我们探求牵涉自伴算子和正规算子的对角化的第8章的定理18和22的推论.

定理9. 谱定理.T是有限维复内积空间V上的一个正规算子, 或者是有限维实内积空间V上的一个自伴算子, 设c1,,ckT的不同的特征值, 令Wj是特征值cj所对应的特征空间, EjVWj上的正交投影, 那么不同的WiWj相互正交, VW1,,Wk的直和, 并且T=c1E1++ckEk.
证明.αWj, βWi, 并设ij, 那么cjα|β=Tα|β=α|Tβ=α|ciβ=ciα|β鉴于cicj, 可以推出α|β=0, 即不同的WiWj是相互正交的.
根据V拥有全由T的特征向量构成的规范正交基这一事实 (见第8章的定理18和22), 立即可以得到V=W1Wk.因此, E1++Ek=I并且T=TI=T(E1++Ek)=TE1++TEk=c1E1++ckEk
译者注记. 以上证明中使用了第8章的定理19. 另外, 这个证明对于E1++Ek=I没有任何解释, 其实并非那么平凡. 实际上, 如果α=α1++αk,αiWi当然这种分解是唯一的, 那么我们可以证明Eiα=αi这是因为, 当ij时, Eiαj=0, 鉴于αj正交于WiEiVWi上的正交投影.

这个定理中出现的分解, 我们将其称为T谱分解 (spectral resolution). 某些物理应用导致了有限维向量空间上的线性算子的谱 (spectrum)被定义为线性算子的特征值的集合, 而这是我们使用谱分解这一术语的部分缘由. 另外, 注意到正交投影E1,,EkT唯一确定也是重要的; 实际上, 它们是应用多项式于T得到的结果. [译注: 也请读者参考第6章的定理11.]

推论. 如果ej=ij(xcicjci)那么Ej=ej(T),1jk.
证明. 译者就不翻译这里的证明了, 因为它实际上只是第6章的定理11的证明之后的讨论的重复.

因为E1,,EkT唯一确定并且I=E1++Ek投影族{E1,,Ek}被称为T定义的单位分解 (resolution of the identity defined by T).

关于谱定理的证明我们有需要作出的评注. 我们运用关于自伴算子和正规算子对角化的第8章的定理18和22推导出了这个定理. 实际上还有一个更加代数的证明方法, 其需要先证明正规算子的极小多项式是不同的素因子之积. 然后, 我们以类似于证明准素分解定理 (第6章的定理12) 的方式进行处理. 下一节我们将会给出这种证明.

在各种应用中, 有时知道我们能否计算关于算子或者矩阵的特定函数 (例如平方根) 是必要的, 而这对于可对角化的正规算子而言是简单的.

定义.T是有限维内积空间上的一个可对角化正规算子, 并且T=j=1kcjEj是其谱分解. 如果函数f的定义域包括T的谱而取值于标量域, 那么我们定义线性算子f(T)f(T)=j=1kf(cj)Ej.
定理10.T是有限维内积空间V上的一个谱为S的可对角化正规算子, 设f是一个定义域包含S而值取于标量域的函数, 那么f(T)是一个谱为f(S)的可对角化正规算子. 如果V也是一个有限维内积空间而U是一个从VV的酉映射, 并且T=UTU1, 那么S也是T的谱而f(T)=Uf(T)U1.
证明. f(T)的正规性可以根据定义和f(T)=j=1kf(cj)Ej这一事实通过简单的计算推得. 而且, 显然对于每个αEj(V), 我们有f(T)α=f(cj)α.因此, 集合f(S)f(T)的谱的子集. 反过来, 设α0并且f(T)α=bα那么根据α=j=1kEjα由此可以推出f(T)α=j=1kf(T)Ejα=j=1kf(cj)Ejα=j=1kbEjα因而j=1k(f(cj)b)Ejα=j=1k|f(cj)b|2Ejα2=0所以, 我们可以断言f(cj)=b或者Ejα=0. 根据假设, α0, 故存在一个下标i使得Eiα0. 然后我们就可以推出f(ci)=b, 也就是说f(S)的确是f(T)的谱. 实际上, 设f(S)={b1,,br}其中当mnbmbn, 也就是互异, 令Xm={i|1ikf(ci)=bm}, 置Pm=iXmEi那么Pm是从Vf(T)与特征值bm相关联的特征空间的正交投影, 而且f(T)=m=1rbmPmf(T)的谱分解.
现在设U是从VV的酉变换, 并且T=UTU1, 那么等式Tα=cα成立当且仅当TUα=cUα因此ST的谱, 并且UT的每个特征空间映射成相对应的T的特征空间. 实际上, 根据定义, 我们可以看出T=j=1kcjEj,Ej=UEjU1T的谱分解. 因此, 我们又可以推出f(T)=j=1kf(cj)Ej=j=1kf(cj)UEjU1=U(j=1kf(cj)Ej)U1=Uf(T)U1
译者注记. 以上存在一些需要澄清的地方. 首先, 酉映射其实指的就是内积空间的同构. 其次, 事实f(T)=j=1kf(cj)Ej的推出需要伴随的基本性质, Ej是正交投影, 还有正交投影是自伴算子. 之所以Ej是正交投影, 实际上是因为我们发现可对角化正规算子的条件就足够推出定理9的那些结论了, 当然或许读者还需要结合第6章的定理11的讨论看看. 至于证明正交投影是自伴算子, 第8章的例子17实际上已经提供了一个证明. 接着, 为了推出f(cj)=b或者Ejα=0, 其实不一定要用勾股定理, 也可以根据直和的性质得到. 最后, 这个证明没有提及T=UTU1的正规性, 但是我们可以发现(T)=UTU1, 鉴于Tα|β=UTU1α|β=TU1α|U1β=U1α|TU1β=α|UTU1β其中α,βV, 并且我们用到了酉变换的保持内积的特性.

在思考前述的讨论时, 我们一定要记得正规算子T的谱是集合S={c1,,ck}而且这些cj是互异的. 当T在某个由特征向量构成的基下由一个对角矩阵表示时, 每个cj都需要重复相对应的特征空间的维数次. 这是我们在以下结果中改换记号的原因.

推论. 在定理10的假设下, 设T在某个有序基𝔅={α1,,αn}下由对角矩阵D表示, 并且D的对角线为d1,,dn, 那么在有序基𝔅下, f(T)由对角矩阵f(D)表示, 其对角线为f(d1),,f(dn). 如果𝔅={α1,,αn}是任意的有序基并且P是从𝔅𝔅的基变换矩阵, 即αj=i=1nPi,jαi那么P1f(D)Pf(T)在基𝔅下的矩阵.
证明. 对于每个下标i, 存在唯一的j (1jk) 使得αiEj(V)di=ci. 因此, 对于每个i, f(T)αi=f(di)αi, 并且f(T)αj=i=1nPi,jf(T)αi=i=1ndiPi,jαi=i=1n(DP)i,jαi=i=1n(DP)i,j(k=1nPk,i1αk)=k=1ni=1nPk,i1(DP)i,jαk=k=1n(P1DP)k,jαk

由这个结果我们可以构造正规矩阵的特定函数, 以下是论证. 设A是一个正规矩阵, 那么存在一个可逆的矩阵P (实际上是一个酉矩阵P) 使得PAP1是一个对角矩阵, 设其为D而对角线元素分别为d1,,dn. 令f是一个可以应用到d1,,dn上的复值函数, 令f(D)是以f(d1),,f(dn)为对角线元素的对角矩阵, 那么P1f(D)P独立于D, 在以下意义上只是A的一个函数. 如果Q是另一个可逆矩阵并且D=QAQ1是一个对角矩阵, 那么f可以被应用到D的对角线元素上且P1f(D)P=Q1f(D)Q.

译者注记. 以上说的矩阵均是复矩阵. 另外, 我们最好解释一下以上这段话的进路. 设𝔅={α1,,αn}是一个有序规范正交基, 并且T是在𝔅下由A确定的线性算子. 因为A是正规的且𝔅是规范正交的, 所以T也是正规的. 考虑由𝔅和基变换矩阵P1确定的有序基𝔅={α1,,αn}, 即由αj=i=1nPi,j1αi确定的有序基, 那么T𝔅下的矩阵即对角矩阵D=PAP1. 我们知道f(T)𝔅下由f(D)表示. 而且, 由于从𝔅𝔅的基变换矩阵是P=(P1)1, 所以f(T)𝔅下的矩阵是P1f(D)P. 同理可得, f(T)𝔅下的矩阵也是Q1f(D)Q. 因此, 这两个矩阵是相等的.
定义. 在以上条件下, f(A)被定义为P1f(D)P.
译者注记. f(A)可以理解成是选定一个任意的规范正交基𝔅得到一个正规算子T, 然后f(A)就是f(T)𝔅下的矩阵. 根据之前的讨论, 我们知道这个矩阵独立于规范正交基的选择.

矩阵f(A)也可以用一种不同的方式刻画.

第9.6节 正规算子的更深刻性质