线性代数

第8章 内积空间

第8.1节 内积

整章我们只考虑实或复向量空间, 即实数域或复数域上的向量空间. 我们的主要目的在于研究可以讨论向量长度和夹角的向量空间. 我们将研究一类特定的标量值函数, 其定义于向量的序对之上, 被称为内积. 内积的一个例子是3中的标量积或者说点积. 3中的向量α=(x1,x2,x3)β=(y1,y2,y3)的标量积是实数α|β=x1y1+x2y2+x3y3.从几何上说, 这个点积是α的长度, β的长度, 以及αβ的夹角的余弦之积. 因此, 藉由代数地定义的标量积来定义3中的长度和夹角这样的几何概念完全是可能的.

向量空间上的内积是性质与3中的点积类似的函数, 而基于这样的内积我们又可以定义长度和角度. 我们关于角度的一般概念的注记将仅限于向量的垂直性 (或者说正交性). 第一节我们将定义何谓内积, 考虑一些实际的例子, 并建立内积的一些基本性质. 之后, 我们将回到讨论长度和正交性的任务上来.

定义.F是实数域或复数域, V是域F上的一个向量空间. V上的一个内积是一个函数V×VF,(α,β)α|β满足对于任意的α,β,γV和任意的标量cF
  1. α+β|γ=α|γ+β|γ;
  2. cα|β=cα|β;
  3. β|α=α|β, 一横代表复共轭;
  4. 如果α0, 那么α|α>0.

读者应该注意到条件a, b, c可以推出条件e:α|cβ+γ=cα|β+α|γ.另一点值得说明的是, 当F是实数域时, 条件c和e中的复共轭是多余的. 然而, 在复数域的情况下, 为了条件的一致性, 复共轭则是必要的. 若是没有这些复共轭, 我们就会得到以下矛盾:α|α>0iα|iα=1α|α>0.

在本章的剩余部分里, F要么代表实数域, 要么代表复数域.

例子1. Fn上存在一个内积, 我们称之为标准内积. 对于向量α=(x1,,xn)β=(y1,,yn), 其标准内积被定义为α|β=j=1nxjyj.F=时, 这也可以记成α|β=j=1nxjyj.在实数域的情形下, 标准内积常被称为点积或者标量积, 并记为αβ.
例子2. 对于2中的向量α=(x1,x2)β=(y1,y2), 令α|β=x1y1x2y1x1y2+4x2y2.既然α|α=(x1x2)2+3x22, 可直接推得α0时有α|α>0. 内积定义中的条件a, b, c则是容易验证的.
例子3.VFn×n, 那么V以自然的方式同构于Fn2, 因而由例子1可知A|B=j=1nk=1nAj,kBj,k定义了V上的一个内积. 而且, 如果我们引入共轭转置矩阵B, 其由Bk,j=Bj,k定义, 那么我们可以基于迹函数来表达内积:A|B=tr(AB)=tr(BA).这是因为tr(AB)=j=1n(AB)j,j=j=1nk=1nAj,kBk,j=j=1nk=1nAj,kBj,k
例子4.QFn×n是一个可逆矩阵, 对于X,YFn×1, 置X|Y=YQQX.注意到我们这里将右边的1×1矩阵与其唯一的元素等同起来了. 当Q为恒等矩阵时, 这个内积本质上和例子1是相同的, 我们将其称为Fn×1上的标准内积. 读者应该注意到术语"标准内积"在两种特定的上下文中使用. 对于一般的域F上的有限维向量空间, 并不存在显然可称之为标准的内积.
例子5.V是所有类型为[0,1]的连续函数构成的向量空间, 那么f|g=01f(t)g(t)dtV上的一个内积. 可能读者更熟悉单位区间上的实值连续函数构成的向量空间, 此时g(t)上的复共轭是可以省略的.
例子6. 这实际上是一类例子. 读者可以通过以下方法根据已有的内积构造出新的内积来. 令VW是域F上的向量空间, 设|W上的一个内积. 如果T是一个从VW的非奇异线性变换, 那么pT(α,β)=Tα|Tβ定义了V上的一个内积pT. 例子4中的内积可以被视为这个的一种特殊情形, 以下同样也是特殊情形.
  1. V是一个有限维向量空间, 令𝔅={α1,,αn}V的一个有序基. 令ε1,,εnFn的标准有序基, 令T是由Tαj=εj,j=1,,n定义的从VFn的线性变换. 换言之, 令T是由𝔅确定的从VFn的"自然"同构. 如果我们取Fn上的标准内积, 那么pT(j=1nxjαj,k=1nykαk)=j=1nxjyj.因此, 对于V的任意的有序基, 都存在一个具有性质αj|αk=δj,k的内积. 实际上, 很容易表明恰存在一个这样的内积. 之后我们将证明V上的每个内积都可根据某个有序基𝔅按照以上方式确定.
  2. 让我们再次检视例子5, 令V是单位区间上的所有连续函数构成的空间, 取W=V. 令T是"乘上t"的线性算子, 即(Tf)(t)=tf(t),0t1. 容易验证T是线性的. 而且, T也是非奇异的. 这是因为, 设Tf=0, 那么对于0t1tf(t)=0, 因而t>0f(t)=0. 鉴于f是连续的, 我们也有f(0)=0, 于是f=0. 现在使用例子5的内积, 我们可以构造V上的一个新的内积pT(f,g)=01(Tf)(t)(Tg)(t)dt=01f(t)g(t)t2dt

我们现在开始检视内积的一些一般性质. 设V是一个带有内积的复向量空间, 那么对于α,βV, 我们有α|β=Reα|β+iImα|β其中Reα|βImα|β分别是复数α|β的实部和虚部. 如果z是一个复数, 那么Imz=Re(iz), 这可以推出Imα|β=Re[iα|β]=Reα|iβ.因此, 按照α|β=Reα|β+iReα|iβ内积完全可由其"实部"确定.

偶尔知道实或复向量空间上的内积可由另一种函数确定是很有用的, 这种函数即所谓的二次形式. 为了定义二次形式, 我们首先以α代表α|α的正平方根; α被称为α相对于内积的范数. 通过考察1,,2,3上由标准内积导出的范数, 读者应该说服自己将α的范数想成是α的长度是很贴切的. 由内积决定的二次形式是函数αα2. 根据内积的性质, 我们可以推出, 对于任意的向量αβα±β2=α2±2Reα|β+β2.因此, 在实数域的情形下, 我们有α|β=14α+β214αβ2.在复数域的情形下, 我们得到的是更复杂的表达式α|β=14α+β214αβ2+i4α+iβ2i4αiβ2.这两个公式都被称为极化恒等式, 我们也应该注意到在复数域的情形下其也可以写成以下形式:α|β=14n=14inα+inβ2.

刚才我们所得到的性质对于任意的实或复向量空间上的内积均成立, 不论其维数如何. 现在我们转向V是有限维向量空间的情形. 正如读者可能会猜到的, 有限维向量空间上的内积总是可以基于一个有序基由矩阵刻画.

V是有限维的, 令𝔅={α1,,αn}V的一个有序基, 并且给定V上的一个特定的内积. 我们将表明, 这个内积完全由以下的这些值Gj,k=αk|αj决定. 如果α=k=1nxkαkβ=j=1nyjαj, 那么α|β=k=1nxkαk|β=k=1nxkαk|β=k=1nxkj=1nyjαk|αj=j=1nk=1nyjGj,kxk=YGX其中XY分别是αβ在有序基𝔅下的坐标矩阵, 而G是以Gj,k=αk|αj为元素的矩阵. 我们称G内积在有序基𝔅下的矩阵. 根据定义, G是一个Hermite矩阵, 即G=G. 然而, G是一种相当特殊的Hermite矩阵, 因为其必须满足附加的条件XGX>0,X0.特别地, G必须是可逆的. 否则的话, 存在一个X0使得GX=0, 那么对于这样的X就不能满足以上要求了. 更显式地说, 以上的条件即对于任意不全为零的标量x1,,xnj=1nk=1nxjGj,kxk>0.从中我们立即可以看出G的每个对角线元素都必然是正数. [译注: 提及正数, 一定是实数.] 然而, 这个施加于对角线元素上的条件并不足以保证XGX>0,X0, 之后我们将给出使其成立的充分条件. [译注: 这个施加于Hermite矩阵上的条件一般被称为"正定"条件.]

以上这样的过程是可逆的, 即若任意的Hermite矩阵GFn×n满足XGX>0,X0, 那么GV上的一个内积在有序基𝔅下的矩阵. 这个内积是由公式α|β=YGX给定的, 其中XY分别是αβ在有序基𝔅下的坐标矩阵.

练习1.V是一个向量空间而|V上的一个内积.
  1. 证明对于任意的βV0|β=0.
  2. 证明若对于任意的βVα|β=0, 那么α=0.
练习2.V是域F上的一个向量空间. 证明V上的两个内积之和仍然是V上的一个内积. 两个内积之差是内积吗? 证明一个内积的正倍数仍然是一个内积.
练习3. 显式描述11上的所有内积.
练习4. 验证Fn上的标准内积的确是一个内积.
练习5.|2上的标准内积.
  1. α=(1,2),β=(1,1), 如果向量γ满足α|γ=1β|γ=3, 求出γ.
  2. 证明对于任意的α2, 我们有α=α|ε1ε1+α|ε2ε2.
练习6.|2上的标准内积, 而T(x1,x2)=(x2,x1)2上的线性算子. 现在T是"逆时针旋转90度"的变换, 并且对于所有的α2, 都有α|Tα=0. 找出所有这样的2上的内积[|], 其对于每个向量α[α|Tα]=0.
练习7.|2上的标准内积, 证明不存在非零的2上的线性算子T使得对于每个α2α|Tα=0. 推广这个结果.
练习8.A2×2, 定义映射fA:2×1×2×1fA(X,Y)=YtAX.证明fA2×1上的一个内积当且仅当A=At,A1,1>0,A2,2>0,det(A)>0.
练习9.V是一个带有的内积的实或复向量空间, 证明由内积确定的范数满足平行四边形定律α+β2+αβ2=2α2+2β2.
练习10. 找出例子2中的内积在2的标准有序基下的矩阵.
练习11. 证明公式j=0lajxj|k=0mbkxk=j=0lk=0majbkj+k+1定义了[x]上的一个内积. 令W是次数小于等于n的多项式构成的子空间. 限制以上内积于W, 找出其相对于有序基{1,x,x2,,xn}的矩阵. (提示: 为了表明这个公式的确定义了一个内积, 观察到f|g=01f(t)g(t)dt然后处理这个积分表达式.)
练习12.V是一个有限维向量空间, 𝔅={α1,,αn}V的一个有序基, |V上的一个内积. 如果c1,,cn是任意的n个标量, 那么恰存在一个向量αV使得α|αj=cj,j=1,,n.
练习13.V是一个复向量空间. 一个函数J:VV被称为一个共轭 (conjugation), 如果J(α+β)=J(α)+J(β),J(cα)=cJ(α),J(J(α))=α, 其中c是任意的标量而α,βV. 如果J是一个共轭, 证明:
  1. W={αV|Jα=α}相对于V中所定义的运算可以被视为域上的一个向量空间.
  2. 对于每个αV, 存在唯一的向量β,γW使得α=β+iγ.
练习14.V是一个复向量空间, W是一个满足以下性质的V的子集:
  1. 相对于V中所定义的运算, W可以被视为一个实向量空间.
  2. 对于每个αV, 存在唯一的向量β,γW满足α=β+iγ.
证明Jα=βiγ定义了V上的一个共轭, 其满足Jα=α当且仅当αW. 另外, 证明JV上唯一带有此性质的共轭.
练习15. 找出12上的所有共轭.
练习16.W是复向量空间V的一个有限维实子空间. 证明W满足练习14的条件b当且仅当W的每个基也是V的一个基.
练习17.V是一个复向量空间, JV上的一个共轭, W={αV|Jα=α}V的一个实子空间, fW上的一个内积, 证明:
  1. 存在唯一的V上的内积g使得对于任意的α,βWg(α,β)=f(α,β).
  2. 对于所有的α,βV, g(Jα,Jβ)=g(β,α).
以上的部分a是在说11 (或者nn) 上的标准内积之间的什么关系?

第8.2节 内积空间

既然现在我们已经对于内积有所了解, 那么我们将注意力转移到向量空间与其上的某个特定内积结合产生的代数结构上来. 具体来说, 我们将建立由内积赋予向量空间的"长度"和"正交性"的概念的基本性质.

定义. 一个内积空间是一个其上带有特定内积的实或复向量空间.

一个有限维的实内积空间常被称为一个Euclid空间. 一个复内积空间经常被称为一个酉空间.

定理1. 如果V是一个内积空间, 那么对于任意的向量α,βV和标量c, 我们有
  1. cα=|c|α;
  2. 对于α0, α>0;
  3. |α|β|αβ;
  4. α+βα+β.
证明. 陈述i和ii几乎可由定义直接推出. iii中的不等式在α=0时是显然成立的. 若α0, 置γ=ββ|αα2α那么γ|α=0, 然后0γ2=ββ|αα2α|ββ|αα2α=β|ββ|αα|βα2=β|β|α|β|2α2因此, |α|β|2α2β2, 再开根即可. 现在使用iii, 我们可以推出α+β2=α2+2Reα|β+β2α2+2|α|β|+β2α2+2αβ+β2=(α+β)2于是, α+βα+β.

iii被称为Cauchy-Schwarz不等式, 其有着各种各样的应用. 根据刚才我们的证明, 如果α0, 那么除非β=β|αα2α该不等式严格成立. 也就是说, Cauchy-Schwarz不等式取等号当且仅当αβ线性相关.

译者注记. 以上对于Cauchy-Schwarz不等式的证明看似复杂, 实则在某种意义上有着简单的几何解释. 例如, 在2及其上的标准内积下, 很容易看出来β|αα2αβα上的垂直投影, γ|α=0就是对于垂直的表述, 而γ2=β|β|α|β|2α2差不多就是勾股定理/Pythagoras定理的一个应用.
例子7. 如果我们将Cauchy-Schwarz不等式应用于例子1, 2, 3, 5中给出的内积, 那么我们就会得到以下结果:
  1. |k=1nxkyk|(k=1n|xk|2)12(k=1n|yk|2)12
  2. |x1y1x2y1x1y2+4x2y2|((x1x2)2+3x22)1/2((y1y2)2+3y22)1/2
  3. |tr(AB)|(tr(AA))1/2(tr(BB))1/2
  4. |01f(t)g(t)dt|(01|f(t)|2dt)12(01|g(t)|2dt)12
定义.αβ是内积空间V中的向量, 那么α正交β, 如果α|β=0. 既然这能推出β正交于α, 我们常就简单说αβ是正交的. 对于V的一个子集S, 我们称S是一个正交集合, 若其中不同向量之间均是正交的. 如果对于正交集合S的每个向量αα=1, 那么我们就称S是一个规范正交集合.

零向量正交于V中的每个向量, 而且是唯一具有此性质的向量. 另外, 读者应该将规范正交集合想成是由长度为1且相互垂直的向量构成的集合.

例子8. n的标准基相对于其上的标准内积是一个规范正交集合, n也是如此.
例子9. 2中的向量(x,y)相对于标准内积与(y,x)正交, 因为(x,y)|(y,x)=xy+yx=0.然而, 如果2装备的是例子2中的内积, 那么(x,y)(y,x)正交当且仅当y=3±132x.
例子10.Vn×n, Ep,q是仅第pq列为1其余均为0的矩阵, 那么所有这样的矩阵Ep,q构成的集合相对于例子3中给出的内积是规范正交的, 因为Ep,q|Er,s=tr(Ep,qEs,r)=δq,str(Ep,r)=δq,sδp,r.
例子11.V是区间[0,1]上的连续复值 (或者实值) 函数构成的向量空间, 并定义其上的内积为f|g=01f(t)g(t)dt.fn(x)=2cos2πnxgn(x)=2sin2πnx, 那么{1,f1,g1,f2,g2,}构成了一个无穷的规范正交集合. 在复情形下, 我们也可以构造以下线性组合12(fn±ign),n=1,2,以这种方式, 我们构造了一个新的规范正交集合S, 其由所有具有形式hn(x)=e2πinx,n=±1,±2,的函数构成. 将常函数1加入S得到的集合S也是规范正交的. 我们假定读者熟悉以上内容所牵涉的积分计算.

以上例子给出的规范正交集合均是线性无关的, 现在我们将表明诚然如此.

定理2. 由非零向量构成的正交集合是线性无关的.
证明.S是某给定内积空间中由非零向量构成的有限或无限的正交集合, 设α1,α2,,αmS中的不同向量, 并且β=c1α1+c2α2++cmαm那么β|αk=j=1mcjαj|αk=j=1mcjαj|αk=ckαk|αk既然αk|αk0, 这可以推出ck=β|αkαk2,1km.因此, 当β=0时, 每个ck=0, 即S是线性无关的集合.
推论. 如果一个向量β是由非零向量α1,,αm构成的一个正交序列的线性组合, 那么β必然是以下特定的线性组合β=k=1mβ|αkαk2αk.

以上的推论是定理的证明的直接结果. 另外, 还有一个应该提及的显然推论. 如果{α1,,αm}是某个有限维内积空间V中由非零向量构成的正交集合, 那么mdimV. 这是在说V中相互正交的方向的数目不可能超过V的由代数定义的维数. V中相互正交的方向的最大数目可以被理解为V的几何维数, 并且我们刚才看到其不会大于代数维数. 这两种维数相等的事实是以下结果的一个特定推论.

定理3.V是一个内积空间, 而β1,,βnV中线性无关的向量, 那么我们可以构造V中相互正交的向量α1,,αn使得对于每个k=1,2,,n, 集合{α1,,αk}是由β1,,βk张成的子空间的一个基.
证明. 向量α1,,αn可由一种被称为Gram-Schmidt正交化过程的构造方式得到. 首先, 令α1=β1, 而其他向量则按以下方法由归纳给定: 设已经挑选了α1,,αm使得对于每个k{α1,,αk},1km是由β1,,βk张成的V的子空间的一个正交基, 其中1m<n. 为了构造下一个向量αm+1, 令αm+1=βm+1k=1mβm+1|αkαk2αk那么αm+10, 因为否则的话βm+1就是α1,,αm的线性组合了, 也就是β1,,βm的线性组合. 而且, 如果1jm, 那么αm+1|αj=βm+1|αjk=1mβm+1|αkαk2αk|αj=βm+1|αjβm+1|αj=0因此, {α1,,αm+1}是由m+1个非零向量构成的正交集合, 并且它们都在由β1,,βm+1张成的子空间之中. 根据定理2, 其的确是该子空间的一个基. 换言之, 向量α1,,αn可按以上公式一个接着一个地构造出来. 特别地, 当n=4时, 我们有α1=β1α2=β2β2|α1α12α1α3=β3β3|α1α12α1β3|α2α22α2α4=β4β4|α1α12α1β4|α2α22α2β4|α3α32α3
推论. 每个有限维内积空间都拥有一个规范正交基.
证明.V是一个有限维内积空间, 而{β1,,βn}V的一个基. 应用Gram-Schmidt过程, 我们可以构造一个正交基{α1,,αn}. 那么, 为了获得一个规范正交基, 我们仅需将每个向量αk替换以αk/αk就够了.

规范正交基相较于其他任意的基的一个主要优势在于牵涉坐标的计算会更加简单. 为了澄清这个断言, 设V是一个有限维内积空间. 那么, 根据上一节的讨论, 我们可以构造这个内积相对于V的某个有序基𝔅={α1,,αn}的矩阵G, 其由Gj,k=αk|αj定义, 然后便可基于坐标来计算内积. 若𝔅是一个规范正交基, 那么G就是恒等矩阵, 而对于任意的标量xjyk, 我们有j=1nxjαj|k=1nykαk=j=1nxjyj因此, 基于规范正交基, V中的内积看起来就像是Fn中的标准内积.

尽管实际计算上的用途有限, 但有趣的是, Gram-Schmidt过程也可以用来判定是否线性相关. 设β1,,βnV中线性相关的向量, 排除β1=0的平凡情况. [译注: 其实不排除也可以, 只是对于极端情况需要一些说明.] 令m是使得β1,,βm能够线性无关的最大整数, 那么1m<n. 若α1,,αm是施行正交化过程于β1,,βm得到的向量, 那么αm+1=βm+1k=1mβm+1|αkαk2αk必然为0. 这是因为, αm+1在由α1,,αm张成的子空间之中并且正交于这些向量, 因而根据定理2的推论可知αm+1=0. 也就是说, βm+1α1,,αm的线性组合, 即β1,,βm的线性组合, 那么β1,,βm+1是线性相关的.

译者注记. 上一段的内容告诉我们, 即便为了施行Gram-Schmidt正交化过程, 也无需提前判断出β1,,βn是线性无关的. 这是因为, 在正交化的过程中, 一旦遇到某个αk=0, 那么便可知β1,,βk线性相关. 而若正交化过程结束也没有出现哪个αk=0, 就可以断言β1,,βn线性无关.
例子12. 对于装备有标准内积的3, 考虑向量β1=(3,0,4),β2=(1,0,7),β3=(2,9,11)施行Gram-Schmidt过程于β1,β2,β3, 我们就得到了以下向量.α1=(3,0,4)α2=(1,0,7)(1,0,7)|(3,0,4)25(3,0,4)=(1,0,7)(3,0,4)=(4,0,3)α3=(2,9,11)(2,9,11)|(3,0,4)25(3,0,4)(2,9,11)|(4,0,3)25(4,0,3)=(2,9,11)2(3,0,4)(4,0,3)=(0,9,0)这些向量显然是非零的且相互正交, 因而{α1,α2,α3}3的一个正交基. 为了将3中任意的向量(x1,x2,x3)表达为α1,α2,α3的线性组合, 我们无需求解任何线性方程组, 运用定理2的推论即可. 因此, 我们就有(x1,x2,x3)=3x1+4x325α1+4x1+3x325α2+x29α3.例如, (1,2,3)可以被表示为线性组合(1,2,3)=35(3,0,4)+15(4,0,3)+29(0,9,0).实际上, 我们可以换个角度陈述以上的结果: 对偶于基{α1,α2,α3}(3)的基{f1,f2,f3}可由以下公式所显式定义f1(x1,x2,x3)=3x1+4x325f2(x1,x2,x3)=4x1+3x325f3(x1,x2,x3)=x29当然, 这些公式可以写成以下更为一般的形式fj(x1,x2,x3)=(x1,x2,x3)|αjαj2.最后一点, 注意到从α1,α2,α3中我们可以得到规范正交基15(3,0,4),15(4,0,3),(0,1,0).
例子13.A=[abcd]是一个复矩阵, 置β1=(a,b)β2=(c,d), 并设β10. 如果我们使用2上的标准内积对于β1,β2施行正交化过程, 就会得到以下向量:α1=(a,b)α2=(c,d)(c,d)|(a,b)|a|2+|b|2(a,b)=(c,d)ca+db|a|2+|b|2(a,b)=(cbbdba|a|2+|b|2,daacab|a|2+|b|2)=detA|a|2+|b|2(b,a)之前的一般理论告诉我们α20当且仅当β1,β2线性无关. 另一方面, α2的公式告诉我们α20当且仅当detA0.

从本质上说, Gram-Schmidt过程就是不断重复应用一种被称为正交投影的基本几何操作. 并且, 从这一角度理解正交化过程最为恰当. 在解决近似问题时, 正交投影也会自然出现.

W是内积空间V的一个子空间, 令βV中的任意一个向量. 我们的问题在于找出W中对于β的最佳的可能近似. 这意味着在向量α属于W的限制下寻找使得βα尽可能小的向量α. 让我们用更加精确的语言来陈述这件事情.

W中的向量对于β进行的最佳近似是这样一个向量αW, 其满足对于每个向量γW, 我们都有βαβγ.

通过检视这个问题在2或者3中的情况, 读者从直觉上可以感受到以W的向量对于β的最佳近似应该是使得βα垂直 (或者说正交) 于W的向量α. 而且, 这样的α应该恰只有一个. 这些直觉性的想法对于有限维子空间是正确的, 而仅对于部分而不是全部的无限维子空间成立. 鉴于精确的情况太过复杂而难以在这里处理, 我们将只证明以下的结果.

定理4.W是内积空间V的一个子空间, 并设βV中的一个向量.
  1. 向量αW是以W中的向量对于β进行的最佳近似当且仅当βα正交于W中的每个向量.
  2. 如果以W的向量对于β进行的最佳近似存在, 那么其是唯一的.
  3. 如果W是有限维的并且{α1,,αn}W的任意的正交基, 那么向量α=k=1nβ|αkαk2αk是以W的向量对于β的(唯一的)最佳近似.
证明. 首先, 注意到如果γV中的任意向量, 那么βγ=(βα)+(αγ), 而且βγ2=βα2+2Reβα|αγ+αγ2.现在设βα正交于W中的每个向量, 如果γWγα, 那么既然αγW, 我们可以推出βγ2=βα2+αγ2>βα2反过来, 设对于每个γWβγβα, 那么根据上面的第一个等式, 这可以推出2Reβα|αγ+αγ20对于每个γW成立. 鉴于{αγ|γW}=W, 实际上其等价于2Reβα|τ+τ20对于每个τW成立. 对于非零的τW, 我们可以构造向量φ=βα|ττ2τW代入即得2Reβα|φ+φ2=2Reβα|βα|ττ2τ+βα|ττ2τ2=2|βα|τ|2τ2+|βα|τ|2τ2=|βα|τ|2τ20于是, βα|τ=0. 换言之, βα正交于W中的每个向量. 到目前为止, 我们完成了对于i的证明. 不过, 根据上面的讨论, 若存在W中的向量满足最佳近似的条件, 那么显然至多只有一个这样的向量. 也就是说, ii的确成立.
现在设WV的一个有限维子空间, 那么我们知道, 根据定理3, W的确拥有正交基. 令{α1,,αn}W的任意的正交基, 按照iii的方式定义α. 然后, 根据定理3的证明中的计算, 我们知道βα正交于每个αk. 换言之, βα正交于W中的每个向量. 根据已经证明了的i, 我们可以断言α是以W中的向量对于β的最佳近似.
定义.V是一个内积空间, SV的一个子集, 那么S正交补被定义为S={βV|对于每个αSβ|α=0}.

V的正交补是零子空间. 反过来, {0}=V. 如果SV的任意子集, 那么其正交补S总是V的子空间. 这是因为, 首先S是非空的, 鉴于其总是包含0; 其次, 每当α,βSc是任意的标量, 对于每个γS, 我们有cα+β|γ=cα|γ+β|γ=c0+0=0因而cα+βS. 在定理4中, 最佳近似α的特征性质在于其是W中唯一使得βαW的向量.

定义. 每当定理4中的向量α存在, 其被称为βW上的正交投影. 如果V中的每个向量都在W上具有正交投影, 那么赋V的向量以其在W上的正交投影的确是一个映射, 这被称为VW上的正交投影.

根据定理4, 内积空间在有限维子空间上的正交投影总是存在的. 但是, 定理4也能推出以下结果.

推论.V是一个内积空间, W是其一个有限维子空间, EVW上的正交投影, 那么映射ββEβVW上的正交投影.
证明. 对于任意的向量βV, 根据E的定义和定理4, 我们知道βEβW. 然后, 既然β(βEβ)=EβW而又根据W的定义, W中的向量总是正交于W的每个向量, 于是β(βEβ)也正交于W的每个向量. 换言之, ββEβVW上的正交投影.
例子14. 给定装备有标准内积的3, 那么(10,2,8)在由(3,12,1)张成的子空间W上的正交投影为α=(10,2,8)|(3,12,1)(3,12,1)2(3,12,1)=14154(3,12,1)3W上的正交投影E(x1,x2,x3)3x1+12x2x3154(3,12,1).E的秩显然为1, 因而E的零化度为2. 另一方面,E(x1,x2,x3)=(0,0,0)当且仅当3x1+12x2x3=0, 而这等价于(x1,x2,x3)W. 因此, WE的零空间, 而dimW=2. 通过计算(x1,x2,x3)3x1+12x2x3154(3,12,1)我们知道3W上的正交投影IE(x1,x2,x3)1154(145x136x2+3x3,36x1+10x2+12x3,3x1+12x2+153x3)

例子14中的观察将以如下形式得到泛化.

定理5.W是内积空间V的一个有限维子空间, 设EVW上的正交投影, 那么EV上的一个幂等线性算子. 而且, WE的像, WE的零空间, 于是V=WW.
证明. 对于每个βV, 既然EβW, 那么E(Eβ)=Eβ是显然的. 换言之, E2=E, 即E是幂等的. 现在我们需要证明E是线性的. 对于α,βV, 我们知道αEα,βEβW. 设c是任意的标量, 那么c(αEα)+(βEβ)=(cα+β)(cEα+Eβ)W其中cEα+EβW. 换言之, 即E(cα+β)=cEα+Eβ, 由此E是线性算子.
只需稍微检视一下正交投影的定义, 便可知E的像是W. 另外, 根据定理4的推论, IEVW上的正交投影. 而且, IE的像是W. 现在让我们回忆一下第6章的定理9及其之前的讨论, 就知道E的零空间是W, 于是V=WW.
推论. 在定理5的条件下, IEVW上的正交投影. 而且, IEV上的幂等线性算子, 其以W为像而W为零空间.
译者注记. 对于定理4的推论还有定理5及其推论而言, W是有限维子空间的条件并不是必要的, 只是为了确保正交投影的存在性. 实际上, 若VW上的正交投影的确存在, 那么这些命题依旧成立.

现在我们可以按照如下方式几何地陈述Gram-Schmidt过程了. 给定内积空间V和线性无关的向量β1,,βn, 令Pk,k>1V在由β1,,βk1张成的子空间的正交补上的正交投影, 并设P1=I, 那么应用正交化过程于β1,,βn得到的向量α1,,αn可由αk=Pkβk,1kn定义.

定理5也可以推出所谓的Bessel不等式.

推论.{α1,,αn}是内积空间V中由非零向量构成的正交集合, 如果βV, 那么k=1n|β|αk|2αk2β2.并且, 此不等式取得等号当且仅当β=k=1nβ|αkαk2αk.
证明.W是由α1,,αn张成的子空间, 那么γ=k=1nβ|αkαk2αkW是以W中的向量对于β的最佳近似. 并且, 若令δ=βγ, 则δW, 因而γ|δ=0, 故β2=γ2+δ2=k=1nβ|αkαk2αk|k=1nβ|αkαk2αk+δ2=(k=1n|β|αk|2αk2)+δ2k=1n|β|αk|2αk2显然, 此不等式取得等号当且仅当δ2=0, 即β=γ. 证明就结束了.
译者注记. Bessel不等式取得等号的一个等价条件为β在由α1,,αn张成的子空间之中.

{α1,,αn}为规范正交集的特殊情况下, Bessel不等式就变成了k=1n|β|αk|2β2.当然, 若{α1,,αn}V的一个规范正交基, 那么Bessel不等式总是取等号, 而此时β在有序基{α1,,αn}下的坐标的第k个分量为β|αk.

例子15. 若我们将上述推论应用于例子11中所描述的规范正交集合, 就会发现
  1. k=nn|01f(t)e2πiktdt|201|f(t)|2dt
  2. 01|k=nncke2πikt|2dt=k=nn|ck|2
  3. 01(2cos2πt+2sin4πt)2dt=1+1=2
练习1. 考虑装备了标准内积的4, 令子空间W={γ4|γ|α=0γ|β=0}其中α=(1,0,1,1)β=(2,3,1,2), 找出W的一个基.
练习2. 应用Gram-Schmidt过程于向量β1=(1,0,1), β2=(1,0,1), β3=(0,3,4)以得到装备有标准内积的3的一个规范正交基.
练习3. 考虑装备有标准内积的3, 找出由β1=(1,0,i)β2=(2,1,1+i)张成的子空间的一个规范正交基.
练习4.V是一个内积空间, 两个向量αβ之间的距离d(α,β)=αβ定义, 证明
  1. d(α,β)0;
  2. d(α,β)=0当且仅当α=β;
  3. d(α,β)=d(β,α);
  4. d(α,β)d(α,γ)+d(γ,β).
练习5.V是一个内积空间而α,βV, 那么α=β当且仅当对于每个γVα|γ=β|γ.
练习6. 给定装备有标准内积的2, 令W是由(3,4)张成的子空间, E2W上的正交投影, 找出
  1. E(x1,x2)的公式;
  2. 标准有序基下E的矩阵;
  3. W;
  4. 使得E由矩阵[1000]表示的一个规范正交基.
练习7.V是一个内积空间, 其向量空间为2, 而其内积的二次形式由(x1,x2)2=(x1x2)2+3x22定义. 令EV在由(3,4)张成的子空间W上的正交投影, 现在回答练习6的四个问题.
练习8. 找出2上的一个内积使得ε1|ε2=2.
练习9.V[x]的次数至多为3的多项式构成的子空间, 其上装备的内积为f|g=01f(t)g(t)dt.
  1. 找出由所有标量多项式构成的子空间的正交补.
  2. 应用Gram-Schmidt过程于基{1,x,x2,x3}.
练习10.V是向量空间n×n, 设其上的内积为A|B=tr(AB), 找出由所有对角矩阵构成的子空间的正交补.
练习11.V是一个有限维内积空间, {α1,,αn}V的一个规范正交基, 证明对于任意的α,βV, 我们都有α|β=k=1nα|αkβ|αk.
练习12.W是内积空间V的一个有限维子空间, EVW上的正交投影, 证明对于所有α,βV, Eα|β=α|Eβ.
练习13.S是内积空间V的一个子集. 证明(S)包含由S张成的子空间. 当V是有限维的时候, 证明(S)就是由S张成的子空间.
练习14.V是一个有限维内积空间而𝔅={α1,,αn}V的一个规范正交基. 令TV上的一个线性算子而A是在有序基𝔅下的矩阵. 证明Ai,j=Tαj|αi.
练习15.V=W1W2f1f2分别是W1W2上的内积. 证明存在唯一的V上的内积f使得
  1. W2=W1;
  2. 对于α,βWk,k=1,2, 有f(α,β)=fk(α,β).
练习16.V是一个内积空间而WV的一个有限维子空间, 一般存在许多以W为像的投影. 其中一种当然是W上的正交投影, 它具有对于每个αV, Eαα的性质. 证明如果E是一个以W为像的投影且对于每个αVEαα, 那么EW上的正交投影. [译注: 这个不等式和Bessel不等式差不多.]
练习17.V是一个实内积空间, 其由区间[1,1]上的所有连续实值函数构成, 而内积为f|g=11f(t)g(t)dt.W是所有奇函数构成子空间, 找出W的正交补.

第8.3节 线性泛函和伴随

本节的第一部分处理内积空间上的线性泛函以及其与内积的关系. 基本的结果在于有限维内积空间上任意的线性泛函f就是"固定一个向量的内积", 即对于某个固定的βV, f具有f(α)=α|β的形式. 我们使用这个结果证明了V上的线性算子T的"伴随"的存在性, 其是一个对于每个α,βVTα|β=α|Tβ的线性算子T. 通过规范正交基的使用, 线性算子上的伴随操作 (从TT) 就相当于构造一个矩阵的共轭转置. 我们稍微探索了一下伴随操作和复数的共轭之间的类似之处.

V是任意的内积空间, βV是一个固定的向量, 我们定义从V到标量域的函数fβfβ(α)=α|β.函数fβV上的一个线性泛函, 这是因为根据内积的定义, α|β作为α的函数是线性的. 如果V是有限维的, 那么V上的每个线性泛函都可由某个β以这种方式产生.

定理6.V是一个有限维内积空间, 而fV上的一个线性泛函, 那么存在唯一的向量βV使得对于每个αVf(α)=α|β.
证明.{α1,α2,,αn}V的一个规范正交基, 置β=j=1nf(αj)αjfβ是由fβ(α)=α|β定义的线性泛函, 那么fβ(αk)=αk|j=1nf(αj)αj=f(αk).既然这对于每个基向量αk成立, 于是f=fβ. 现在设γV满足fγ=f, 那么fγ(γβ)fβ(γβ)=γβ|γγβ|β=γβ|γβ=0换言之, γβ=0, 即γ=β. 因此, 恰存在一个向量β按照以上陈述的方式确定了线性泛函f.

这个证明可以使用基下的线性泛函的表示的语言稍微重述一下. 如果我们选定了V的一个规范正交基{α1,,αn}, 那么α=x1α1++xnαnβ=y1α1++ynαn的内积为α|β=x1y1++xnyn.如果fV上任意的线性泛函, 那么f具有f(α)=c1x1++cnxn的形式, 其中c1,,cn是由基确定的一些固定标量. 当然, cj=f(αj). 如果我们希望找到一个向量βV使得对于每个αα|β=f(α), 那么显然β的坐标分量yj必须满足yj=cj, 或者说yj=f(αj). 据此, 可知β=f(α1)α1++f(αn)αn就是我们所要的向量.

现在应该作出一些更加深刻的评注. 刚才我们所给出的对于定理6的证明相当简短, 然而它却没能强调一个基本的几何事实, 即β位于f的零空间的正交补之中. 令Wf的零空间, 那么V=WW, 并且f完全由其在W上的值所确定. 实际上, 如果PVW上的正交投影, 那么f(α)=f(Pα)对于每个αV成立. 设f0, 那么f的秩为1dimW=1. 如果γW中任意的非零向量, 那么Pα=α|γγ2γ对于所有αV成立, 因此f(α)=f(Pα)=f(α|γγ2γ)=α|γf(γ)γ2=α|f(γ)γ2γ换言之, β=[f(γ)/γ2]γ.

译者注记. 前一段的一些基本事实(对于像我这样不够聪明的读者)值得澄清. 首先, 之所以β位于f的零空间的正交补之中, 是因为若f(α)=0, 那么α|β=0, 即β正交于f的零空间的每个向量. 其次, 之所以f(α)=f(Pα), 是因为根据P的定义, αPα正交于W的每个向量, 而我们知道βW, 于是就有αPα|β=α|βPα|β=f(α)f(Pα)=0f(α)=f(Pα).
例子16. 我们应该给出一个例子以表明定理6若缺少V是有限维空间的条件则并不成立. 令V是复数域上的多项式的向量空间, 而内积为f|g=01f(t)g(t)dt.这个内积也可以被代数地定义. 如果f=j=0lajxjg=k=0mbkxk, 那么f|g=j=0lk=0majbkj+k+1.z是一个固定的复数, L是"在z处求值"的线性泛函:L(f)=f(z).存在一个多项式g使得对于每个ff|g=L(f)吗? 答案是否定的, 以下是我们的推理. 设存在多项式g满足f(z)=01f(t)g(t)dt对于每个多项式f成立. 令h=xz, 那么对于任意的f我们有(hf)(z)=0, 于是0=01h(t)f(t)g(t)dt特别地, 这个等式在f=hg时也成立, 以至于01h(t)(hg)(t)g(t)dt=01|h(t)|2|g(t)|2dt=01|(hg)(t)|2dt=hg|hg=0这可以推出hg=0. 鉴于h0, 必然有g=0. 可是, L并非零线性泛函, 即这样的g不存在.
译者注记. 以上的h是对于h的每个系数作复共轭得到的多项式. 在t为实数的情况下, h(t)=h(t).

读者可以稍微推广一下这个例子. 设我们选定了标量c1,,cn和不同的复数z1,,zn, 令L(f)=c1f(z1)++cnf(zn)那么LV上的一个线性泛函, 但是除非c1=c2==cn=0, 并不存在多项式g使得L(f)=f|g. 读者只需重复上述的论证以h=(xz1)(xzn).

现在我们将注意力转到线性算子的伴随的概念上来.

定理7. 对于有限维内积空间V上任意的线性算子T, 存在唯一的V上的线性算子T使得对于每个α,βVTα|β=α|Tβ.
证明.βV中任意的一个向量, 那么αTα|βV上的一个线性泛函. 根据定理6, 存在唯一的βV使得对于每个αVTα|β=α|β. 令T是映射ββ, 我们知道Tα|β=α|Tβ对于所有α,βV成立, 那么剩下来的工作就是要验证T的确是一个线性算子. 令β,γVc是一个标量, 对于任意的α, 我们有α|T(cβ+γ)=Tα|cβ+γ=cTα|β+Tα|γ=cα|Tβ+α|Tγ=α|cTβ+Tγ因此, T(cβ+γ)=cTβ+Tγ, 即T是线性的.
T的唯一性是显然的. 对于任意的向量βV, 向量Tβ由以下条件所唯一刻画:对于每个αVTα|β=α|Tβ.
译者注记. 以上证明的写法在某种意义上有些颠倒. 实际上, 根据定理6, 满足条件的T至多只有一个. 接着, 我们仅需要验证这个由定理6确定的映射的确是我们所要的线性算子即可.
定理8.V是一个有限维内积空间而𝔅={α1,,αn}V的一个(有序)规范正交基, 令TV上的一个线性算子而A是在有序基𝔅下的矩阵, 那么Ak,j=Tαj|αk.
证明. 既然𝔅是一个规范正交基, 我们有α=k=1nα|αkαk.鉴于矩阵ATαj=k=1nAk,jαk定义, 而Tαj=k=1nTαj|αkαk我们有Ak,j=Tαj|αk.
推论.V是一个有限维内积空间而TV上的一个线性算子, 那么在V的任意的规范正交基下, T的矩阵是T的矩阵的共轭转置.
证明.𝔅={α1,,αn}V的一个规范正交基, 设A=[T]𝔅B=[T]𝔅. 根据定理6, 我们有Ak,j=Tαj|αkBk,j=Tαj|αk.根据T的定义, 可以推出Bk,j=Tαj|αk=αk|Tαj=Tαk|αj=Aj,k
例子17.V是一个有限维内积空间, EV在其一个子空间W上的正交投影, 那么对于任意的α,βV, 我们可以推出Eα|β=Eα|Eβ+(IE)β=Eα|Eβ=Eα+(IE)α|Eβ=α|Eβ根据算子E的唯一性, 我们知道E=E. 现在考虑例子14所描述的投影, 那么A=1154[936336144123121]E在标准规范正交基下的矩阵. 根据之前的推论, 应该有A=A, 的确如此. 另一方面, 设α1=(154,0,0)α2=(145,36,3)α3=(36,10,12)那么{α1,α2,α3}是一个基, 并且Eα1=(9,36,3)Eα2=(0,0,0)Eα3=(0,0,0)既然(9,36,3)=(154,0,0)(145,36,3), E在基{α1,α2,α3}下的矩阵为B=[100100000].在这种情况下, BB, 而且B也不是E在基{α1,α2,α3}下的矩阵. 应用以上推论, 我们可以得出{α1,α2,α3}不是规范正交基. 当然, 这不论如何都是很显然的.
定义.T是内积空间V上的一个线性算子, 那么我们称TV上具有一个伴随, 如果存在V上的一个线性算子T使得Tα|β=α|Tβ对于所有α,βV成立.

根据定理7, 有限维内积空间V上的每个线性算子T都在V上具有伴随. 在无限维的情形下, 并不总是如此. 但是, 不论如何, 至多只有一个这样的算子T. 当它存在时, 我们将其称为T伴随.

关于有限维的情形, 有两点评注值得一说.

  1. T的伴随不仅依赖于T, 也依赖于内积的定义.
  2. 正如例子17所显示的那样, 对于任意而非规范正交的有序基𝔅, [T]𝔅[T]𝔅之间的关系要比以上推论所描述的更加复杂.

例子18.Vn×1而内积为X|Y=YX. 如果An×n, 那么线性算子XAX的伴随是线性算子XAX, 因为AX|Y=YAX=(AY)X=X|AY.读者应该发现这是前述推论的一个特殊情形.
例子19. 这个例子类似于例子18. 令Vn×n而内积为A|B=tr(AB). 令Mn×n, 那么左乘M的伴随是左乘M. 当然, 左乘M指的是线性算子LM(A)=MA.LM(A)|B=tr(MAB)=tr(ABM)=tr(A(MB))=A|LM(B)因此, (LM)=LM. 以上计算中, 我们用到了迹函数的一个特有性质: tr(AB)=tr(BA).
译者注记. 本书还没有证明过tr(AB)=tr(BA), 现在我们来证明一下:tr(AB)=j=1n(AB)j,j=j=1nk=1nAj,kBk,j=k=1nj=1nBk,jAj,k=k=1n(BA)k,k=tr(BA)
例子20.V是复数域上的多项式的向量空间, 而其上的内积为f|g=01f(t)g(t)dt.考虑线性算子"乘以f", 即Mf(g)=fg, 那么这个算子具有一个伴随, 即乘以f, 这是因为Mf(g)|h=fg|h=01f(t)g(t)h(t)dt=01g(t)[f(t)h(t)]dt=01g(t)(fh)(t)dt=g|fh=g|Mf(h)于是(Mf)=Mf.
例子21. 在例子20里, 我们看到某些无限维向量空间上的线性算子的确也有伴随. 正如之前所说, 这种线性算子并不总是具有伴随. 令V是例子20中的内积空间, 而D[x]上的形式微分算子, 那么分部积分表明Df|g=f(1)g(1)f(0)g(0)f|Dg.让我们固定g, 并检视何时存在一个多项式Dg使得对于所有的f都有Df|g=f|Dg. 如果这样的一个Dg存在的话, 我们有f|Dg=f(1)g(1)f(0)g(0)f|Dg或者f|Dg+Dg=f(1)g(1)f(0)g(0).g固定的情况下, L(f)=f(1)g(1)f(0)g(0)就成为例子16中所考虑的那种类型的线性泛函. 除非L=0, 其就不可能具有L(f)=f|h的形式. 如果Dg存在, 那么令h=Dg+Dg, 我们就有L(f)=f|h, 于是g(0)=g(1)=0. 也就是说, 适合的Dg的存在可以推出g(0)=g(1)=0. 反过来, 若g(0)=g(1)=0, 多项式Dg=Dg满足对于所有的f, Df|g=f|Dg. 如果我们选择了任意的g使得g(0)0g(1)0, 那么就不可能定义合适的Dg. 我们总结一下, 即D没有伴随.

我们希望这些例子能够加深读者对于线性算子的伴随的理解. 我们看到, 从TT的伴随操作表现得有些类似于复数上的共轭. 以下的定理强调了这种类比.

定理9.V是一个有限维内积空间, TUV上的线性算子, c是任意的标量, 那么
  1. (T+U)=T+U;
  2. (cT)=cT;
  3. (TU)=UT;
  4. (T)=T.
证明. 为了证明i, 令α,βV, 那么(T+U)α|β=Tα+Uα|β=Tα|β+Uα|β=α|Tβ+α|Uβ=α|Tβ+Uβ=α|(T+U)β根据伴随的唯一性, 我们得到了(T+U)=T+U. 我们将ii的证明留给读者. 我们从以下关系TUα|β=Uα|Tβ=α|UTβTα|β=β|Tα=Tβ|α=α|Tβ可以得到iii和iv.

定理9经常被重述为伴随是一个周期为2的共轭线性的反同构. 我们上面提及的伴随与复共轭的类似之处当然是复共轭具有z1+z2=z1+z2, z1z2=z1z2, z=z的性质. 对于乘积的伴随, 读者必须小心顺序是相反的: (TU)=UT. 当我们继续研究内积空间上的线性算子时, 我们将提及以上类比的一些扩展. 现在, 我们就要沿着之前的路线提及一点. 一个复数z是实数当且仅当z=z. 读者可能会设想满足T=T的线性算子T在某种意义上表现得与实数类似, 实际上的确如此. 例如, 若T是有限维内积空间上的一个线性算子, 那么T=U1+iU2其中U1=U1U2=U2. 因此, T也拥有某种"实部"和"虚部". 这样的算子U1U2是唯一的, 由U1=12(T+T)U2=12i(TT)给定.

满足T=T的线性算子T被称为是自伴的, 或者Hermite的. 若𝔅V的一个规范正交基, 那么[T]𝔅=[T]𝔅.于是, T是自伴算子当且仅当其在每个规范正交基下的矩阵表示都是自伴的. 自伴算子是重要的, 不仅在于其提供了一般线性算子在某种意义下的实部和虚部, 还出于以下原因:

  1. 自伴算子具有许多特殊的性质. 例如, 对于这样的一种线性算子, 存在一个由其特征向量构成的规范正交基.
  2. 许多实践中出现的线性算子都是自伴的.
之后我们将考虑自伴算子的特殊性质.

练习1.V是带有标准内积的向量空间2, T是由Tε1=(1,2)Tε2=(i,1)定义的线性算子. 如果α=(x1,x2), 找出Tα.
练习2.T2上的线性算子, 由Tε1=(1+i,2)Tε2=(i,i)定义. 使用标准内积, 找出T在标准有序基下的矩阵. TT交换吗?
练习3.V是带有标准内积的3, TV上的线性算子, 其在标准有序基下的矩阵由Aj,k=ij+k定义, 其中i是虚数单位. 找出T的零空间的一个基.
练习4.V是一个有限维内积空间, TV上的一个线性算子, 证明T的像是T的零空间的正交补.
练习5.V是一个有限维内积空间, TV上的一个线性算子. 如果T是可逆的, 证明T也是可逆的, 并且(T)1=(T1).
练习6.V是一个内积空间, 而βγV中固定的向量. 证明Tα=α|βγ定义了V上的一个线性算子. 证明T具有伴随, 并显式描述T.
现在设V是带有标准内积的n, β=(y1,,yn)γ=(x1,,xn). T在标准有序基下的矩阵的第jk列的元素是什么? 这个矩阵的秩是多少?
练习7. 证明两个自伴算子之积是自伴的当且仅当这两个算子交换.
练习8.V上次数小于等于3的多项式构成的向量空间, 而内积为f|g=01f(t)g(t)dt.如果t是一个实数, 找出多项式gtV使得对于每个fV都有f|gt=f(t).
练习9.V是练习8的内积空间, DV上的形式微分算子, 找出D.
练习10.Vn×n, 其上的内积为A|B=tr(AB). 令PV是一个固定的可逆矩阵, 而TP(A)=P1APV上的线性算子. 找出TP的伴随.
练习11.V是一个有限维内积空间, EV上的一个幂等线性算子, 证明E是自伴的当且仅当EE=EE.
练习12.V是一个有限维内积空间, TV上的一个线性算子, 证明T是自伴的当且仅当对于每个αV, Tα|α是实数.

第8.4节 酉算子

在本节中, 我们将考虑两个内积空间之间的同构的概念. 如果VW是向量空间, 那么从VW的同构是一个从VW的双射的线性变换, 即"保持"向量空间运算的从VW的一一对应. 既然内积空间不仅包含包含向量空间, 还具有一个给定的内积, 那么当VW是内积空间时, 我们要求从VW的内积不仅保持线性运算, 还应该保持内积. 内积空间上的自同构被称为"酉算子". 我们将考虑酉算子的各种例子并建立其基本性质.

定义.VW是相同的域上的内积空间, T是从VW的线性变换, 那么我们称T保持内积, 如果对于每个α,βV都有Tα|Tβ=α|β. 从VW同构是保持内积的从VW的向量空间的同构.

如果T保持内积, 那么Tα=α, 于是T必然是非奇异的. 因此, 从VW的同构也可以被定义为保持内积的从VW的满射的线性变换. 若T是从VW的同构, 那么T1是从WV的同构. 当这样的一个T存在时, 我们就称VW同构的. 当然, 内积空间之间的同构是一个等价关系.

定理10.VW是相同的域上的n维内积空间, 如果T是从VW的线性变换, 那么以下条件是等价的.
  1. T保持内积.
  2. T是一个(内积空间的)同构.
  3. TV的每个规范正交基映射为W的规范正交基.
  4. TV的某个规范正交基映射为W的规范正交基.
证明. 由i推出ii: 如果T保持内积, 那么对于每个αV, Tα=α. 因此, T是非奇异的. 既然dimV=dimW, 我们知道T是一个向量空间的同构.
由ii推出iii: 设T是一个同构. 令{α1,,αn}V的一个规范正交基. 既然T是一个向量空间的同构, 那么{Tα1,,Tαn}W的一个基. 鉴于T也保持内积, Tαj|Tαk=αj|αk=δj,k.
由iii推出iv: 不言自明.
由iv推出i: 令{α1,,αn}V的一个规范正交基, 其使得{Tα1,,Tαn}W的一个规范正交基, 那么Tαj|Tαk=δj,k=αj|αk.对于V中任意的向量α=x1α1++xnαnβ=y1α1++ynαn, 我们有α|β=j=1nxjyjTα|Tβ=j=1nxjTαj|k=1nykTαk=j=1nk=1nxjykTαj|Tαk=j=1nxjyj于是, T保持内积.
译者注记. 以上证明用到了第3章的定理9的注记.
推论.VW是相同的域上的有限维内积空间, 那么VW同构当且仅当它们具有相等的维数.
证明. 如果{α1,,αn}V的一个规范正交基而{β1,,βn}W的一个规范正交基, 令T是由Tαj=βj定义的从VW的线性变换, 那么T是从VW的同构.
例子22. 如果V是一个n维内积空间, 那么每个有序规范正交基𝔅={α1,,αn}都确定了一个从V到带有标准内积的Fn的同构, 这个同构即T(x1α1++xnαn)=(x1,,xn).还有一个由𝔅确定的从V到带有标准内积的Fn×1的同构, 其仅与前述例子在表面上有所不同, 此即α[α]𝔅也就是将α送至其在有序基𝔅下的坐标矩阵的变换. 对于任意的有序基𝔅而言, 这都是一个向量空间的同构. 然而, 这是两个内积空间之间的同构当且仅当𝔅是一个规范正交基.
例子23. 现在我们给出一个不那么浮浅的例子. 令W上的所有3×3的斜对称矩阵A (即At=A) 构成的向量空间. 我们装备W以内积A|B=12tr(ABt), 这里的12只是为了方便而插入的. 令V是带有标准内积的3. 令T是从VW的线性变换, 由T(x1,x2,x3)=[0x3x2x30x1x2x10].定义, 那么T是一个满射. 置A=[0x3x2x30x1x2x10],B=[0y3y2y30y1y2y10]我们有tr(ABt)=x3y3+x2y2+x3y3+x2y2+x1y1=2(x1y1+x2y2+x3y3)因此, α|β=Tα|TβT是一个内积空间之间的同构. 注意到T将标准基ε1,ε2,ε3送至规范正交基[000001010],[001000100],[010100000].
例子24. 基于规范正交基描述同构实际上并不总是最方便. 例如, 设G=PP, 其中P是一个n×n的可逆复矩阵. 令V是向量空间n×1, 带有内积[X|Y]=YGX. 令W是相同的向量空间, 但是带有标准内积X|Y=YX. 我们知道VW是同构的内积空间. 似乎刻画一个VW之间的同构的最简单方式如下: 令从VW的线性变换T(X)=PX, 那么TX|TY=PX|PY=(PY)(PX)=YPPX=YGX=[X|Y]因而T是一个同构.
例子25.V是单位区间上的实值连续函数的空间, 带有内积[f|g]=01f(t)g(t)t2dt.W是相同的向量空间, 带有内积f|g=01f(t)g(t)dt.T是从VW的线性变换, 由(Tf)(t)=tf(t)给定, 那么Tf|Tg=[f|g], 于是T保持内积. 然而, T并非从VW的同构, 因为T不是满射. 当然, 这会发生仅是因为作为基础的向量空间不是有限维的.
定理11.VW是相同的域上的内积空间, T是从VW的线性变换, 那么T保持内积当且仅当对于每个αV, Tα=α.
证明. 如果T保持内积, 那么当然T"保持范数". 设对于每个αVTα=α, 那么Tα2=α2. 现在根据实或复选择相应的极化恒等式, 再加上T具有线性性质的事实, 很容易得到对于每个α,βV, 我们有α|β=Tα|Tβ.
译者注记. 以复内积空间为例, 我们补充一下这里的推理:Tα|Tβ=14(Tα+Tβ2TαTβ2)+i4(Tα+iTβ2TαiTβ2)=14(T(α+β)2T(αβ)2)+i4(T(α+iβ)2T(αiβ)2)=14(α+β2αβ2)+i4(α+iβ2αiβ2)=α|β
定义. 一个内积空间上的一个酉算子是一个从此空间到自身的同构.

两个酉算子之积仍然是酉算子, 因为如果U1U2是酉算子, 那么U2U1是可逆的, 并且对于每个αU2U1α2=U1α2=α2. [译注: 作者这里提及可逆时, 指的是作为映射的可逆, 或者是作为线性变换的可逆, 但肯定不是作为内积空间同态的可逆, 因为那样的话就不需要说明了.] 当然, 酉算子的逆也是酉算子, 鉴于Uα=α可以推出U1β=β, 其中β=Uα. [译注: 这个逆当然说的是作为映射的逆.] 既然恒等算子显然是一个酉算子, 我们看到一个内积空间上的所有酉算子构成的集合在复合运算下是一个群.

如果V是一个有限维内积空间而TV上的一个线性算子, 那么定理10告诉我们U是酉算子当且仅当对于每个α,βV, Uα|Uβ=α|β; 或者, 当且仅当对于某个 (或者每个) 规范正交基{α1,,αn}, {Uα1,,Uαn}也是规范正交基.

定理12.U是内积空间V上的一个线性算子, 那么U是酉算子当且仅当U的伴随U存在并且UU=UU=I.
证明.U是酉算子, 那么U是可逆的, 并且Uα|β=Uα|UU1β=α|U1β对于任意的α,βV成立, 因而U1U的伴随.
反过来, 设U存在并且UU=UU=I, 那么U是可逆的, 而U1=U. 于是, 剩下来我们要做的事情就只是证明U保持内积. 对于任意的α,βV, 我们有Uα|Uβ=α|UUβ=α|Iβ=α|β
例子26. 考虑带有标准内积的n×1, 令A是域上的一个n×n矩阵, U是由U(X)=AX定义的线性算子, 那么对于每个X,Yn×1UX|UY=AX|AY=YAAX因此, U是酉算子当且仅当AA=I.
定义. 一个n×n的复矩阵被称为酉矩阵, 如果AA=I. [译注: 这里提及了复矩阵, 也就包括了实矩阵的情况, 鉴于实数域是复数域的子域.]
定理13.V是一个有限维内积空间而UV上的一个线性算子, 那么U是酉算子当且仅当U在某个 (或者每个) 有序规范正交基下的表示是酉矩阵.
证明. 在当前阶段, 这不太算是一个定理, 我们陈述该定理主要是为了强调一下. 如果𝔅={α1,,αn}V的一个有序规范正交基, 而AU相对于𝔅的矩阵, 那么AA=I当且仅当UU=I. 现在这个结果可由定理12直接推出.

A是一个n×n的复矩阵, 那么陈述A为酉矩阵即意味着(AA)j,k=δj,k或者r=1nAr,jAr,k=δj,k.换言之, A的列相对于标准内积X|Y=YX构成了一个规范正交集合. 既然AA=I当且仅当AA=I, 我们看到U是酉矩阵恰当A的行在带有标准内积的n中构成了一个规范正交集合. [译注: 在本书中, 作者将1×nn视为完全相同的.] 因此, 使用标准内积, A是酉矩阵当且仅当A的行和列都构成了规范正交集合. 这里读者看到了展现矩阵的单边逆也是双边逆这个定理的威力的一例. 按照以上方式应用该定理于实矩阵, 我们得到了以下结果: 设我们有一个实方阵, 其每一行的元素的平方和为1而不同的行是正交的, 那么每一列的元素的平方和也为1, 并且不同的列是正交的. [译注: 相对于标准内积而言. 当然, 这本质上只是对于实数域上的方阵重复了一下刚才的结果.] 若是读者对于3×3的情形写下证明而不诉诸于任何矩阵的知识, 那么他应该会对于矩阵的单边逆可以推出双边逆印象深刻.

定义. 一个实或复的n×n矩阵A被称为是正交矩阵, 如果AtA=I.

一个实正交矩阵是酉矩阵; 并且, 一个酉矩阵是正交矩阵当且仅当其每个元素都是实数.

译者注记. 读者应该注意一下, 这里的定义与其他材料稍有不同. 一般而言, 当提起酉矩阵的时候, 人们默认这是一个复矩阵; 当提起正交矩阵的时候, 人们默认这是一个实矩阵. 显然, 正交矩阵即酉矩阵被限制为实情形得到的概念. 或者说, 酉矩阵即正交矩阵在复情形上的推广. 当然, 只要读者稍加注意, 就不会有什么问题.
例子27. 我们给出一些酉矩阵和正交矩阵的例子.
  1. 1×1的矩阵[c]是正交矩阵当且仅当c=±1, 是酉矩阵当且仅当cc=1. 后一个条件即|c|=1, 或者c=eiθ, 其中θ是实数.
  2. A=[abcd]那么A是正交矩阵当且仅当At=A1=1adbc[dbca].显然, 任何正交矩阵的行列式都是±1. 因此, A是正交矩阵当且仅当A=[abba]或者A=[abba]其中a2+b2=1. 这两种情形由det(A)的值区分.
  3. 三角函数之间的关系表明Aθ=[cosθsinθsinθcosθ]是正交矩阵. 如果θ是一个实数, 那么Aθ即平面上逆时针旋转θ的线性变换Uθ2的标准有序基下的矩阵. 此时, 鉴于Aθ是一个实正交矩阵, 因而Aθ是一个酉矩阵, 那么Uθ是一个酉算子, 即保持点积.
  4. A=[abcd]那么A是酉矩阵当且仅当[acbd]=1adbc[dbca].酉矩阵的行列式具有绝对值1, 因而是一个具有eiθ形式的复数, 其中θ是实数. 于是, A是酉矩阵当且仅当A=[abeiθbeiθa]=[100eiθ][abba]其中θ是一个实数而ab是满足|a|2+|b|2=1的复数.

正如我们之前所注意到的, 一个内积空间上的酉算子构成了一个群. 根据这个观察以及定理13, 我们可以推出由所有n×n的酉矩阵构成的集合U(n)也是一个群. 因此, 酉矩阵的逆和两个酉矩阵之积都是酉矩阵. 当然, 直接看出来也是很简单的. 一个n×n的复矩阵A是酉矩阵当且仅当A1=A. 因此, 如果A是酉矩阵, 我们有(A1)1=A=(A)1=(A1). 如果ABn×n的酉矩阵, 那么(AB)1=B1A1=BA=(AB). [译注: 似乎直接按照酉矩阵的定义进行证明反而更简单.]

n中的Gram-Schmidt过程对于牵涉群U(n)的矩阵具有一个有趣的推论.

定理14. 对于每个n×n的可逆复矩阵B, 存在唯一的主对角线元素皆为正数的下三角矩阵M使得MB是酉矩阵.
证明. B的行β1,,βn构成了n的一个基. 应用Gram-Schmidt过程于β1,,βn, 我们得到了n的一个正交基α1,,αn, 其中αk=βkj=1k1βk|αjαj2αj.因此, 对于每个k, 存在唯一的标量Ck,j使得αk=βkj=1k1Ck,jβj.U是以α1α1,,αnαn为行的酉矩阵, 而M是由Mk,j={Ck,jαk, 如果j<k1αk, 如果j=k0, 如果j>k定义的矩阵. 那么, M是下三角矩阵 (意即主对角线的上面的元素均为0), M的主对角线上的元素均大于0, 并且αkαk=j=1nMk,jβj,1kn.此即是说U=MB.为了证明M的唯一性, 令T+(n)代表所有主对角线元素均为正数的下三角矩阵构成的集合. 设M1,M2T+(n)满足M1B,M2BU(n), 那么因为U(n)是一个群, 我们有(M1B)(M2B)1=M1M21U(n).另一方面, 虽然并不全然明显, 但是T+(n)在矩阵乘法下也是一个群. 一种看出这点的方法是考虑列矩阵的空间上的线性变换MMX,MT+(n)的几何性质. 因此, M21,M1M21,(M1M21)1T+(n). 但是, 既然M1M21U(n), 我们知道(M1M21)1=(M1M21). 鉴于任何下三角矩阵的转置或者共轭转置都是上三角矩阵, 所以M1M21既是上三角矩阵又是下三角矩阵. 换言之, 就是对角矩阵. 一个对角矩阵是酉矩阵当且仅当其每个对角线元素均具有绝对值1; 若是对角线元素都为正数, 那么它们只能全等于1. 因此, M1M21=I, 即M1=M2.
译者注记. 译者也没太明白怎么利用几何性质说明T+(n)是一个群, 但是当然还有其他方式. 例如, 通过和以上证明相同的手法 (其中的酉矩阵就是恒等矩阵), 我们可以证明T+(n)中的矩阵的逆必然也是T+(n)的元素. 另外, T+(n)显然对于乘法封闭, 所以T+(n)是一个群.

GL(n)代表所有n×n的可逆复矩阵构成的集合, 那么GL(n)在矩阵乘法下也是一个群. 这个群被称为一般线性群. 定理14等价于以下结果.

推论. 对于每个BGL(n), 存在唯一的NT+(n)UU(n)使得B=NU.
证明. 根据定理14, 存在唯一的矩阵MT+(n)使得MBU(n). 令U=MBN=M1, 那么NT+(n)B=NU. 另一方面, 若NT+(n)UU(n)满足B=NU, 那么N1BU(n), 其中N1即是由定理14刻画的唯一的矩阵M. 而且, U必然为N1B.
例子28.x1x2是满足x12+x22=1的实数, 并且x10. 令B=[x1x20010001].应用Gram-Schmidt过程于B的行, 我们会得到向量α1=(x1,x2,0)α2=(0,1,0)x2(x1,x2,0)=x1(x2,x1,0)α3=(0,0,1)U是以α1,(α2/x1),α3为行的矩阵, 那么U是酉矩阵, 并且U=[x1x20x2x10001]=[100x2x11x10001][x1x20010001].现在左乘M=[100x2x11x10001]的逆, 我们得到[x1x20010001]=[100x2x10001][x1x20x2x10001].

现在让我们来简要考虑一下内积空间的坐标变换. 设V是一个有限维内积空间, 𝔅={α1,,αn}𝔅={α1,,αn}V的两个规范正交基, 那么存在唯一的(必然可逆的)n×n矩阵P使得[α]𝔅=P1[α]𝔅对于每个αV成立. 如果U是由Uαj=αj定义的唯一的V上的线性算子, 那么PU在有序基𝔅下的矩阵:αk=j=1nPj,kαj.既然𝔅𝔅都是规范正交基, 那么U是一个酉算子而P是一个酉矩阵. 如果TV上的一个线性算子, 那么[T]𝔅=P1[T]𝔅P=P[T]𝔅P.

定义.ABn×n的复矩阵. 我们称B酉等价于A, 如果存在一个n×n的酉矩阵P使得B=P1AP. 我们称B正交等价于A, 如果存在一个n×n的正交矩阵使得B=P1AP.
译者注记. 当然, 以上定义中, 酉等价里的P1AP可以换成PAP, 正交等价里的P1AP可以换成PtAP. 另外, 酉等价也可以被称为酉相似, 正交等价也可以被称为正交相似.

根据这个定义, 我们可以重新表述以上的观察如下: 如果𝔅𝔅V的两个规范正交基, 那么[T]𝔅酉等价于[T]𝔅. 在V是实内积空间的情形下, 这些矩阵是正交等价的, 通过一个实正交矩阵.

练习1. 找出一个不是正交矩阵的酉矩阵, 以及一个不是酉矩阵的正交矩阵.
练习2.Vn×n, 带有通常内积A|B=tr(AB). 对于每个MA, 令TM(A)=MAV上的线性算子. 证明TM是一个酉算子当且仅当M是一个酉矩阵.
练习3.V是被当作向量空间的复数域.
  1. 表明α|β=Re(αβ)定义了一个V上的内积.
  2. 找出一个从V到带有标准内积的2的(内积空间的)同构.
  3. 对于每个γV, 令Mγ(α)=γαV上的线性算子, 证明(Mγ)=Mγ.
  4. 对于什么样的复数γ, Mγ是自伴算子?
  5. 对于什么样的复数γ, Mγ是酉算子?
  6. 对于什么样的复数γ, Mγ是正定算子? [译注: 正定算子的定义见第9.3节.]
  7. det(Mγ)是多少?
  8. 找出Mγ在基{1,i}下的矩阵.
  9. 如果TV上的一个线性算子, 找出存在γ使得T=Mγ的充要条件.
  10. 找出一个V上的酉算子U, 但是不存在γ使得U=Mγ.
练习4.V是带有标准内积的2. 如果UV上的一个酉算子, 证明U在标准有序基下的矩阵是[cosθsinθsinθcosθ]或者[cosθsinθsinθcosθ]其中0θ<2π. 令Uθ是在标准有序基下以[cosθsinθsinθcosθ]为矩阵表示的线性算子, 即Uθ是逆时针旋转θ的变换. 现在读者应该说服自己, V上的每个酉矩阵, 要么是一个旋转, 要么是一个关于ε1轴的反射接着一个旋转. [译注: 对于后一种变换, 另外一种描述方法是关于角度为θ/2的轴的反射.]
  1. UθUϕ是什么?
  2. 表明Uθ=Uθ.
  3. ϕ是一个固定的实数, 𝔅={α1,α2}是由{ε1,ε2}经过逆时针旋转ϕ得到的规范正交基, 即αj=Uϕεj. 如果θ是另一个实数, 那么Uθ在有序基𝔅下的矩阵是什么?
练习5.V是带有标准内积的3. 令W是由α=(1,1,1)β=(1,1,2)张成的平面. 令U是按照以下方式几何地定义的线性算子: U是关于过原点正交于W的直线旋转θ的变换. 实际上存在两种这样的旋转, 选择一个即可. 找出U在标准有序基下的矩阵. (这里给出一种可行的方法. 找到W的一个规范正交基α1α2. 令α3是正交于W且范数为1的向量. 找出U在基{α1,α2,α3}的矩阵. 施行一次基变换.)
练习6.V是有限维的内积空间, WV的一个子空间, 那么V=WW, 即每个αV都可以唯一地被表示为α=β+γ的形式, 其中βWγW. 我们定义线性算子Uα=βγ.
  1. 证明U既是自伴算子又是酉算子.
  2. 如果V是带有标准内积的3W是由(1,0,1)张成的子空间, 找出U在标准有序基下的矩阵.
练习7.V是一个复内积空间而TV上的一个自伴线性算子, 证明
  1. α+iTα=αiTα.
  2. α+iTα=β+iTβ当且仅当α=β.
  3. I+iT是非奇异的.
  4. IiT是非奇异的.
  5. 现在设V是有限维的, 证明U=(IiT)(I+iT)1是一个酉算子. U被称为TCayley变换. 在某种意义上说, 令f(x)=(1ix)/(1+ix), 那么U=f(T).
练习8. 如果θ是一个实数, 证明[cosθsinθsinθcosθ][eiθ00eiθ]是酉等价的.
练习9.V是一个有限维内积空间而TV上的一个正定算子. 令pT(α,β)=Tα|βV上的内积. 令UV上的一个线性算子而U是其相对于|的伴随. 证明U是相对于内积pT的酉算子当且仅当T=UTU.
练习10.V是一个有限维内积空间, 对于每个α,βV, 定义V上的线性算子Tα,β(γ)=γ|βα, 证明以下命题.
  1. Tα,β=Tβ,α.
  2. trace(Tα,β)=α|β.
  3. Tα,βTγ,δ=Tα,β|γδ.
  4. 在何种条件下Tα,β是自伴算子?
练习11.V是域F上的一个n维内积空间, L(V,V)V上的所有线性算子构成的空间, 证明L(V,V)上存在唯一的一个内积使得对于任意的α,βV, Tα,β=α2β2, 其中Tα,β是练习10中那样定义的线性算子. 找到一个带有此内积的L(V,V)和带有内积A|B=tr(AB)的空间Fn×n之间的同构.
练习12.V是一个有限维内积空间. 在练习6中, 我们展示了如何构造一个V上既自伴又酉的算子. 现在证明对于每个V上的自伴酉算子, 都存在一个子空间W使得这个算子可由练习6中所描述的方法构造出来.
练习13.VW是有限维内积空间, U是从VW的同构, 证明
  1. 映射TUTU1是从向量空间L(V,V)到向量空间L(W,W)的同构.
  2. 对于每个TL(V,V), trace(UTU1)=trace(T).
  3. UTα,βU1=TUα,Uβ, 其中Tα,β于练习10中被定义.
  4. (UTU1)=UTU1.
  5. 如果我们装备L(V,V)以内积T1|T2=trace(T1T2), 并以类似的方式定义L(W,W)上的内积, 那么TUTU1是一个内积空间的同构.
练习14. 如果V是一个内积空间, 那么刚体运动是满足对于每个α,βVTαTβ=αβ的映射T:VV, 其中T不必是线性变换. 酉算子是刚体运动的一个例子. 另外一个例子是平移一个固定的向量γ:Tγ(α)=α+γ.
  1. V是带有标准内积的2, 设TV的一个刚体运动, 并且T(0)=0, 证明T是线性的, 而且是一个酉算子.
  2. 使用a的结果证明每个2的刚体运动都是由一个平移接着一个酉算子复合而成的.
  3. 现在证明2的刚体运动要么是一个平移接着一个旋转, 要么是一个平移接着一个反射接着一个旋转.
练习15. 4 (带有标准内积) 上的酉算子不过就是保持二次形式(x,y,z,t)2=x2+y2+z2+t2的线性算子, 即对于每个α4满足Uα2=α2的线性算子U. 在相对论的特定部分中, 寻找保持形式(x,y,z,t)L2=t2x2y2z2的线性算子T是令人感兴趣的. L2并不来源于内积, 而是某种被称为"Lorentz度量"的东西 (我们不会深入讨论这个). 出于这种原因, 4上的线性变换T, 若满足对于每个α4都有TαL2=αL2, 则被称为Lorentz变换.
  1. 说明由U(x,y,z,t)=[t+xy+izyiztx]定义的函数U是从4到由所有2×2的自伴复矩阵构成的实向量空间H的同构.
  2. 说明αL2=det(Uα).
  3. TH上的一个(实)线性算子, 说明L=U1TU4上的线性算子.
  4. M是任意的2×2复矩阵, 说明TM(A)=MAM定义了一个H上的线性算子. (一定要检查TM的确将H映入H.)
  5. 如果M2×2满足|det(M)|=1, 说明LM=U1TMU4上的一个Lorentz变换.
  6. 找到一个这样的Lorentz变换L, 不存在M2×2使得L=LM.

第8.5节 正规算子

本节的主要目标在于解决以下问题. 如果T是有限维内积空间V上的一个线性算子, 在何种条件下V拥有一个由T的特征向量构成的规范正交基? 换言之, 何时存在V的一个规范正交基𝔅使得T𝔅下的表示是一个对角矩阵.

我们先来推导一些T上的必要条件, 之后我们将逐步证明这些条件也是充分的. 设𝔅={α1,,αn}V的一个规范正交基, 并且满足性质Tαj=cjαj,j=1,,n.这不过就是在说T在有序基𝔅下的表示是以c1,,cn为对角线元素的对角矩阵. 伴随算子T在相同的有序基下的表示是该矩阵的共轭转置, 即以c1,,cn为对角线元素的对角矩阵. 如果V是一个实内积空间, 标量c1,,cn都是实数, 因而必然有T=T. 换言之, 对于有限维内积空间V和其上的线性算子T, 若存在一个全由T的特征向量构成的规范正交基, 那么T必然是自伴算子. 如果V是复内积空间, 那么标量c1,,cn不必是实数, T也就不必是自伴的了. 但是, 我们应该注意到T必然满足TT=TT.这是因为, 任意的两个对角矩阵都是交换的, 而TT同时在有序基𝔅下由对角矩阵表示. [译注: 读者可以回忆一下第6.5节的内容, 交换是同时对角化的充要条件.] 有趣的是, 在复情形下, 交换的条件实际上足以推出全由特征向量构成的规范正交基的存在性.

定义.V是一个有限维内积空间而TV上的一个线性算子, 我们称T正规算子, 如果其与它的伴随交换, 即TT=TT.

任意的自伴算子都是正规算子, 任意的酉算子也是正规算子. 正规算子的任意标量倍数都是正规的; 然而, 正规算子之和与积并不一定是正规的. 尽管并非必要, 我们将从考虑自伴算子开始我们对于正规算子的研究.

定理15. 如果V是一个内积空间而TV上的一个自伴算子, 那么T的特征值均为实数, 且不同的特征值所对应的特征向量之间是正交的.
证明.cT的一个特征值, 那么存在α0使得Tα=cα, 于是cα|α=cα|α=Tα|α=α|Tα=α|cα=cα|α鉴于α|α0, 我们必然有c=c. 现在设我们也有β0满足Tβ=dβ, 那么cα|β=Tα|β=α|Tβ=α|dβ=dα|β=dα|β如果cd, 那么α|β=0.

应该指出的是, 定理15并没有断言特征值或者说特征向量一定存在.

定理16. 在有限维内积空间上 (除开仅包含零向量的平凡空间), 每个自伴算子都拥有一个特征向量.
译者注记. 原文给特征向量之前加上了带括号的"non-zero", 这可能是为第6章找补, 因为那里的定义将零向量也视为特征向量. 但是, 自从第7章开始, 本书所提的特征向量的概念, 就不再包含零向量了, 这也与通行的定义保持一致.
证明.V是一个n维内积空间, 其中n>0, 而TV上的一个自伴算子. 挑选V的一个规范正交基𝔅而令A=[T]𝔅, 既然T=T, 我们有A=A. 现在令W是带有标准内积的n×1, 那么U(X)=AX定义了一个W上的自伴算子. 对于特征多项式det(xIA), 我们知道其在域上至少拥有一个根c. 鉴于U是自伴算子, 根据定理15, c是实数. 换言之, 存在c使得AcI是奇异的. 若V是复内积空间, 那么证明算是结束了, 因为TcI是奇异的. 而对于实内积空间V, 我们最好回忆一下第1章关于线性方程组的观察. 也就是说, 如果以AcI为系数矩阵的齐次线性方程组在复数域上有非平凡解, 那么其在实数域上也应该有非平凡解, 即AcI在实数域上当然也是奇异的. 因此, TcI是奇异的, 存在非零的向量αV使得Tα=cα.

关于这个证明, 我们应该作出数条评注.

  1. 在复情形下, 即便A不是Hermite矩阵 (或者说自伴矩阵), 也不影响A具有特征值和特征向量. 但是, 在实情形下, 自伴的条件就显得非常重要了, 因为它可以告诉我们A的特征多项式在域上的根均为实数.
  2. Hermite矩阵的特征多项式的系数一定是实数, 即便矩阵的各个元素可能不都是实数.
  3. 对于A是有限维空间的假设是必要的, 无限维内积空间上的自伴算子可能没有特征值.

例子29.V是单位区间上的连续复值 (或者实值) 函数构成的向量空间, 带有内积f|g=01f(t)g(t)dt."乘上t"的算子(Tf)(t)=tf(t)是自伴的. 让我们设Tf=cf, 那么(tc)f(t)=0,0t1于是, tcf(t)=0. 鉴于f是连续的, f=0, 因而T没有特征值.
定理17.V是一个有限维内积空间, TV上任意的线性算子. 设W是一个T不变子空间, 那么W的正交补在T下不变.
证明.βW, 对于每个αW, 因为WT下不变, 所以TαW, 那么α|Tβ=Tα|β=0.换言之, TβW, 即WT下不变.
定理18.V是一个有限维内积空间, TV上的一个自伴算子, 那么存在一个全由T的特征向量构成的V的规范正交基.
证明. 不妨设dimV>0. 根据定理16, T拥有一个特征向量α. 令α1=α/α, 那么α1也是T的一个特征向量, 并且α1=1. 如果dimV=1, 证明就结束了. 不然的话, 我们对于V的维数施行归纳. 设定理对于维数小于dimV的内积空间成立. 令W是由α1张成的一维子空间. 既然α1T的特征向量, 那么WT下不变. 根据定理17, 正交补WT=T下不变. 现在W在继承自V的内积下成为了一个dimV1维的内积空间. 令UTW上由限制导出的算子, 那么U是自伴的. 根据归纳假设, W拥有一个以U的特征向量构成的规范正交基{α2,,αn}. 当然, U的特征向量自然也是T的特征向量. 因此, 我们可以断言{α1,,αn}即是我们所要的V的基.
推论.A是一个n×n的Hermite矩阵 (自伴矩阵), 那么存在一个酉矩阵P使得P1AP是对角矩阵. (或者说, A酉等价于一个对角矩阵.) 若A是一个实对称矩阵, 那么存在一个实正交矩阵P使得P1AP成为对角矩阵.
证明.V是带有标准内积的n×1, 而T是在标准有序基下由A表示的线性算子. 既然A=A, 我们有T=T. 令𝔅={α1,,αn}是一个全由T的特征向量构成的V的规范正交基, 我们设Tαj=cjαj,j=1,,n. 如果D=[T]𝔅, 那么D是以c1,,cn为对角线元素的对角矩阵. 考虑由Uεj=αj定义的线性算子U, 令PU在标准有序基下的表示. 那么, P是一个酉矩阵, 并且D=P1AP.
对于推论的后半部分, 实际上取V为带有标准内积的n×1然后重复前述论证即可. 在此情形下, P仍然是一个酉矩阵, 只是其元素都是实数, 因而也是一个正交矩阵.

将定理18与本节开头的评注相结合, 我们就得到了以下结果: 如果V是一个有限维内积空间, 而TV上的一个线性算子, 那么V拥有一个全由T的特征向量构成的规范正交基当且仅当T是自伴算子. 等价地, 如果A是一个n×n的实矩阵, 那么存在实正交矩阵P使得PtAP为对角矩阵当且仅当A=At. 对于复对称矩阵我们没有这样的结果. 换言之, 对于复矩阵而言, 条件A=AtA=A有着显著的不同之处.

译者注记. 实矩阵的正交相似对角化的充要条件为对称.

解决了自伴的情况, 我们现在回到对于正规算子的一般性研究上来. 我们将在情形下对于正规算子证明定理18的类似物. 之所以我们要限制于复情形, 一个原因在于实内积空间上的正规算子可能压根就没有任何特征向量. 例如, 2中的旋转, 除开旋转0度和180度这两种特殊情况.

定理19.V是一个有限维内积空间, TV上的一个正规算子. 设非零向量αV, 那么αT在特征值c下所对应的特征向量当且仅当αT在特征值c下所对应的特征向量.
证明.UV上任意的正规算子, 根据UU=UU, 我们可以推出Uα|Uα=α|UUα=α|UUα=Uα|Uα换言之, Uα=Uα. 如果c是任意的标量, 那么(TcI)=TcI. 我们很容易验证TcI的确是一个正规算子, 于是(TcI)α=(TcI)α因而(TcI)α=0当且仅当(TcI)α=0, 证明就结束了.
定义. 一个n×n的复矩阵被称为正规矩阵, 如果AA=AA.

理解正规矩阵或者正规算子究竟具有什么意义并不容易. 然而, 为了建立一点对于这个概念的感觉, 或许读者知道{一个三角矩阵是一个正规矩阵当且仅当其是一个对角矩阵}是有用的.

定理20.V是一个有限维内积空间, TV上的一个线性算子, 𝔅V的一个规范正交基. 设T𝔅下的矩阵A是上三角的, 那么T是一个正规算子当且仅当A是一个对角矩阵.
证明. 既然𝔅是规范正交基, 那么AT𝔅下的矩阵. 若A是对角矩阵, 那么显然AA=AA, 这可以推出TT=TT. 反过来, 设T是正规算子而𝔅={α1,,αn}. 既然A是上三角矩阵, 那么Tα1=A1,1α1. 根据定理19, Tα1=A1,1α1. 另一方面, 我们有Tα1=j=1n(A)j,1αj=j=1nA1,jαj因此, 对于每个j>1, A1,j=0. 特别地, A1,2=0. 鉴于A是上三角矩阵, 可以推出Tα2=A2,2α2因而Tα2=A2,2α2, 于是对于j>2, A2,j=0. 按照这种手段继续下去, 我们最终可以证明A的确是一个对角矩阵.
定理21.V是一个有限维的复内积空间, TV上的一个线性算子, 那么存在规范正交基使得T在其下的矩阵为上三角的.
证明.n=dimV. 当n=1时, 这个定理显然成立. 我们对于n施行归纳, 假设结果对于n1维的复内积空间上的线性算子成立. 既然V是一个有限维复内积空间, 那么对于伴随T而言, 存在标量c和单位向量αV使得Tα=cα.W是由α张成的子空间的正交补, 根据定理17, WT下不变. 设ST由限制于W上导出的算子. 既然Wn1维的, 归纳假设告诉我们存在W的一个规范正交基{α1,,αn1}使得S在其下的矩阵是上三角的. 令αn=α, 那么{α1,,αn}V的一个规范正交基, 并且T在其下的表示是一个上三角矩阵.

这个定理推出了以下的矩阵版本.

推论. 对于每个n×n的复矩阵A, 存在一个酉矩阵U使得U1AU是上三角矩阵.
译者注记. 每个复矩阵都可以酉相似三角化 (Schur定理).

现在将定理20和定理21相结合, 我们就立即得到了定理18对于正规算子而言的类似物.

定理22.V是一个有限维复内积空间, TV上的一个正规算子, 那么存在一个全由T的特征向量构成的V的规范正交基.

当然, 这个定理也有一个矩阵解释.

推论. 对于每个n×n的(复)正规矩阵A, 存在一个酉矩阵P使得PAP是对角矩阵.
译者注记. 对于有限维复内积空间V, 设TV上的一个线性算子, 那么存在V的一个全由T的特征向量构成的规范正交基 (或者说T在某个V的规范正交基下呈现对角矩阵的形式) 当且仅当T是一个正规算子. 另外, 复矩阵酉相似对角化的充要条件为正规.
练习1. 对于以下每个实对称矩阵A, 找出一个实正交矩阵P使得PtAP成为对角矩阵.[1111],[1221],[cosθsinθsinθcosθ]
练习2. 复对称矩阵是自伴的吗? 是正规的吗?
练习3. 对于A=[123234345]存在实正交矩阵P使得PtAP=D是一个对角矩阵. 找出一个这样的对角矩阵D.
练习4.V是带有标准内积的2, TV上在标准有序基下由矩阵A=[1ii1]表示的线性算子. 证明T是正规算子, 并找到V的一个全由T的特征向量构成的规范正交基.
练习5. 给出一个2×2的矩阵A的例子, A2是正规的, 但是A不是正规的.
练习6.T是有限维复内积空间上的一个正规算子, 证明
  1. 如果T的每个特征值都是实数, 那么T是一个自伴算子.
  2. 如果T的每个特征值都是正数, 那么T是一个正定算子.
  3. 如果T的每个特征值的绝对值均为1, 那么T是一个酉算子.
练习7.T是有限维内积空间V上的一个线性算子, 设T既是正定算子又是酉算子, 证明T=I.
练习8. 证明有限维复内积空间上的线性算子T是正规的当且仅当存在交换的自伴算子T1T2使得T=T1+iT2.
练习9. 证明实对称矩阵具有实对称立方根, 即若A为实对称矩阵, 则存在实对称的B满足B3=A.
练习10. 证明每个正定矩阵都是某个正定矩阵的平方.
练习11.T是有限维复内积空间上的一个线性算子, 若T既是正规算子也是幂零算子, 那么T=0.
练习12. 如果T是有限维内积空间上的一个正规算子, 证明T的不同特征值所对应的特征向量之间是正交的.
练习13.T是有限维复内积空间上的一个正规算子, 证明存在复数域上的多项式f使得T=f(T). (表示T以对角矩阵, 看看f必须是什么.)
练习14. 如果有限维复内积空间上的两个正规算子交换, 证明它们的积也是正规算子.
译者注记. 以上诸多练习缺少条件, 经过译者考察, 绝大部分都应该是有限维复内积空间. 实际上, 读者也可以看到, 虽然正文中的正规算子也可以定义在实内积空间上, 但是理论构建的主要结果中只考虑复内积空间上的正规算子.