线性代数

前言

我们编写本书的初衷是为Massachusetts Institute of Technology的本科线性代数课程提供一本教材. 这门课程是为数学专业的大三学生设计的, 不过实际上有四分之三的学生来自其他科学和技术学科, 并且从大一新生到研究生都有. 时至今日, 这对于本书在M.I.T.的受众刻画仍然大体上是准确的. 自第一版出版以来的十年间, 线性代数课程在全国范围内得到了普及, 本书的作者之一也有机会在Brandeis University, Washington University (St. Louis), 以及University of California (Irvine)为各种各样的群体讲授基本材料.

第1章 线性方程

第1.1节 域

我们假定读者熟悉实数和复数的初等代数. 对于本书的很大一部分, 数字的代数性质可从以下所列加法和乘法的性质简单推导出来. 我们令F代表实数集或复数集.

  1. 加法是交换的,x+y=y+x对于所有F中的xy成立.
  2. 加法是结合的,x+(y+z)=(x+y)+z对于所有F中的x, yz成立.
  3. F中存在唯一的元素0 (零) 满足x+0=x对于每个F中的x成立.
  4. 对于每个F中的x存在唯一的F中的元素(x)满足x+(x)=0与之对应.
  5. 乘法是交换的,xy=yx对于所有F中的xy成立.
  6. 乘法是结合的,x(yz)=(xy)z对于所有F中的x, yz成立.
  7. F中存在唯一的非零元素1 (幺) 满足x1=x对于每个F中的x成立.
  8. 对于每个F中非零的x存在唯一的F中的元素x1 (或1/x) 满足xx1=1与之对应.
  9. 乘法对于加法分配, 即x(y+z)=xy+xz对于所有F中的x, yz成立.

假定我们拥有一个包含对象x,y,z,的集合F和如下两种F上的运算. 第一种运算, 被称为加法, 联系每对F中的xyF中的元素(x+y). 第二种运算, 被称为乘法, 联系每对F中的xyF中的元素xy. 若是这两种运算满足如上从1到9的条件, 那么集合F以及此两种运算被合称为一个域. 粗略说来, 一个域就是一个集合带有某些运算, 这些运算表现得就像通常的数字加减乘除一样, 在满足如上九条代数法则的意义下. 带有通常的加法和乘法运算, 复数集是一个域, 实数集也是一个域.

对于本书的大部分内容而言, 我们使用的"数字"可以来源于任意的域. 为了允许这种一般性, 我们将使用术语"标量"而不是"数字". 如果读者总是认为标量域是一个复数域的子域, 他也不会损失太多. 域的一个子域是一个复数的集合F, 其在通常的加法和乘法下自身就是一个域. 这意味着01F之中, 并且如果xyF的元素, 那么(x+y), x, xyx1 (如果x0) 也是F的元素. [译注: 实际上这给出了子域的判则.] 这样的子域的一个例子是实数域, 因为如果我们把实数当作是虚部为0的复数, 复数域的01是实数, 并且如果xy是实数, 那么(x+y), x, xyx1 (如果x0) 也是实数. 我们讨论子域的要义如下, 若是我们处理来源于某个特定子域的标量, 那么施行加减乘除不会将我们带出给定的子域.

例子1. 正整数1,2,3,的集合不是一个的子域, 出于各种原因. 例如, 0不是正整数, 没有正整数n的加法逆元n是正整数. 除了1之外, 没有正整数n的乘法逆元1/n是正整数.
例子2. 整数,2,1,0,1,2,的集合不是的子域, 因为除了01, 没有整数的乘法逆元是一个整数. 整数集在通常的加法和乘法下除了条件8其余都满足.
例子3. 有理数集是复数域的子域. 整数集里并不可能的除法, 在有理数集里是可能的. 有兴趣的读者应该验证一下每个复数域的子域都必须包含所有的有理数.
例子4. 所有具有x+y2形式的数字构成的集合, 其中xy是有理数, 是一个的子域. 我们将其留给读者进行验证.

在本书的例子和练习中, 读者应该将其中的域当成是复数域的某个子域, 除非另有说明这个域更加一般. 我们不想对于该点多加讨论. 然而, 我们应该指出我们为什么采用这样的约定. 如果F是一个域, 有限多个单位元1加起来有可能得到0 (见第1.2节练习5):1+1++1=0复数域并不会发生这样的事情 (或者在任何复数域的子域). 如果在域F中的确发生了这样的事情, 那么使得有限个1加起来等于0所用的1的最少数目被称为域F的特征. 若是没有这样的事情, (出于某种奇怪的原因) 我们就称域F的特征为零. 经常的情况是, 我们假定F的子域是希望保证F的特征为零. 不过, 在初次接触线性代数的时候, 通常最好还是别太担心关于域的特征的事情.

第1.2节 线性方程组

F是一个域. 我们考虑找出满足下列条件的n个标量 (即F的元素) x1,,xn的问题.{A1,1x1+A1,2x2++A1,nxn=y1A2,1x1+A2,2x2++A2,nxn=y2Am,1x1+Am,2x2++Am,nxn=ym其中y1,,ymAi,j,1im,1jn是给定的F的元素. 我们称其为具m个方程n个未知元的线性方程组. 任何满足每个方程的由F的元素构成的n元组(x1,,xn)都被称为方程组的一个解. 如果y1==ym=0, 我们称该方程组是齐次的, 或者说每个方程是齐次的.

或许寻找线性方程组的解的最根本的技术就是消元法. 我们可以对于以下齐次方程组刻画这种方法.{2x1x2+x3=0x1+3x2+4x3=0如果我们加(2)倍的第二个方程到第一个方程上去, 就得到了7x27x3=0x2=x3. 如果加3倍的第一个方程到第二个方程上去, 就得到了7x1+7x3=0x1=x3. 因此, 我们总结道, 如果(x1,x2,x3)是一个解, 那么x1=x2=x3. 反过来, 我们可以验证每个这样的三元组都是一个解, 于是解集就由所有的三元组(a,a,a)构成.

我们通过"消去未知元"找到了方程组的解, 也就是通过给方程乘上标量再加起来的方式产生有些xj不存在的方程. 我们希望形式化这个过程一点, 以理解为什么这种方法有效, 并按照秩序井然的方式来施行解方程组所必要的计算.

对于这样的一般性方程组, 假定我们挑选m个标量c1,,cm, 将第j个方程乘上cj并将它们加起来, 我们就得到了方程(c1A1,1++cmAm,1)x1++(c1A1,n++cmAm,n)xn=c1y1++cmym这样的方程被我们称为该线性方程组的线性组合. 显然, 每个方程组的解也是这个新的方程的解. 这就是消元过程的根本想法. 如果我们有了另外一个线性方程组{B1,1x1+B1,2x2++B1,nxn=z1B2,1x1+B2,2x2++B2,nxn=z2Bk,1x1+Bk,2x2++Bk,nxn=zk其每个方程都是原本的线性方程组的方程的线性组合, 那么每个原本的线性方程组的解也是这个新的线性方程组的解. 当然, 新的方程组的解不一定是原本方程组的解. 但要是原本方程组的每个方程都是新的线性方程组的方程的线性组合的话, 这种事情就不会发生. 我们称两个线性方程组是等价的, 如果它们的每个方程都能表示为另一个线性方程组的方程的线性组合.

定理1. 等价的线性方程组拥有相同的解.

欲使消元过程在线性方程组求解中发挥效用, 人们就必须找出产生更容易求解的等价线性方程组的手段. 接下来的一节, 我们将讨论其中一种方法.

练习1. 验证例子4的集合是的子域.
练习2.F是复数域. 下面两个线性方程组等价吗? 如果是, 就互相表示成线性组合.{x1x2=02x1+x2=0{3x1+x2=0x1+x2=0
练习3. 像练习2一样测试以下的线性方程组.{x1+x2+4x3=0x1+3x2+8x3=012x1+x2+52x3=0{x1x3=0x2+3x3=0
练习4. 像练习2一样测试以下的线性方程组.{2x1+(1+i)x2+x4=03x22ix3+5x4=0{(1+i2)x1+8x2ix3x4=023x112x2+x3+7x4=0
练习5.F是恰包含两个元素01的集合. 由以下表格定义加法和乘法:+0100111001000101验证集合F带有这两种运算是一个域.
练习6. 证明若两个具二未知元的线性方程组具有相同的解, 那么它们等价.
练习7. 证明每个的子域都包含所有的有理数.
练习8. 证明每个特征为零的域都包含一个有理数域的复制.

第1.3节 矩阵和初等行变换

读者不可能没注意到, 在构造线性方程的线性组合时, 未知元x1,,xn是没有必要写下来的, 因为你实际上只是根据系数Ai,j和常元yi进行计算. 现在我们将线性方程组简写成AX=Y其中A=[A1,1A1,nAm,1Am,n],X=[x1xn],Y=[y1ym]我们将A称为系数矩阵. 严格说来, 上面显示的矩形阵列不是矩阵, 而是矩阵的表示. 一个域F上的m×n矩阵是一个从序对(i,j),1im,1jn的集合到域F的函数. [译注: 或许读者会对于这句话感到迷惑, 这是因为中文将matrix翻译成矩阵.] 矩阵A的元素即标量A(i,j)=Ai,j, 并且往往描述矩阵的最简单方式是将其元素写成如上mn列的矩形阵列的形式. 因此, 上面的X是 (或者说定义了) 一个n×1的矩阵, 而Y是一个m×1的矩阵. 暂时, AX=Y只是一种简记法. 之后, 我们将定义矩阵乘法, 那么它的意思就是YAX之积.

我们现在希望考虑与构造线性方程的线性组合有关的矩阵A的行上的操作. 我们将我们的注意力限制在域F上的m×n矩阵A的三种初等行变换上:

  1. 给矩阵A的一行乘上一个非零的标量c;
  2. A的第r行替换以第r行加上c乘上第s行, 其中c是任意的标量, 并且rs;
  3. 交换A的第r行和第s行.
因此, 一个初等行变换是一个特别的函数e联系每个m×n矩阵A以一个m×n的矩阵e(A). 我们可以精确地将三种e刻画如下:
  1. e(A)i,j=Ai,j如果ir, e(A)r,j=cAr,j.
  2. e(A)i,j=Ai,j如果ir, e(A)r,j=Ar,j+cAs,j.
  3. e(A)i,j=Ai,j如果i异于rs, e(A)r,j=As,j, e(A)s,j=Ar,j.
在定义e(A)时, A的列数并不重要, 但A的行数是关键的. 例如, 我们不得不担心能否交换一个5×5矩阵的第5行和第6行. 为了避免这种复杂性, 我们约定一个初等行变换e定义在由所有域Fm×n矩阵构成的类之上, 其中m是固定的而n是任意的. 换句话说, 一个特定的e定义在由所有域F上的m行矩阵构成的类之上.

之所以我们将我们自己限制于这三种简单的行变换上, 是因为既已施行这样的eA之上后, 我们能够通过在e(A)上施行一个类似的操作来恢复A.

定理2. 对于每个初等行变换e, 存在一个与之对应的具有相同类型的初等行变换e1满足e1(e(A))=e(e1(A))=A. 换言之, 初等行变换的逆变换存在, 并与之具有相同的类型. [译注: 显然不仅存在, 也是唯一的.]
证明.
  1. e是给第r行乘上非零标量c的变换, 令e1为给第r行乘上c1的变换.
  2. e是将第r行替换以第r行加上c乘上第s行的变换, 其中rs, 令e1为将第r行替换以第r行加上(c)乘上第s行的变换.
  3. e是交换第r行和第s行的变换, 令e1=e.
每种情形之下, 显然有e1(e(A))=e(e1(A))=A对于每个A成立.
定义. 如果AB是域F上的m×n矩阵, 我们称B行等价于A, 如果B可由A通过 (有限的) 一系列初等行变换得到. [译注: 原则上包含0步, 尽管包不包含均不影响结果, 因为本身初等行变换就包含恒等变换.]

使用定理2, 容易验证以下事实. 每个矩阵都行等价于自身. 如果B行等价于A, 那么A行等价于B. 如果B行等价于AC行等价于B, 那么C行等价于A. 换句话说, 行等价是等价关系 (见附录).

定理3. 如果AB是域F上行等价的m×n矩阵, 那么齐次线性方程组AX=0BX=0拥有相同的解.
证明. 设经过一系列变换我们从A得到了B:A=A0A1Ak=B.只需要证明线性方程组AjX=0Aj+1X=0拥有相同的解就够了, 即一次初等行变换不改变解集.
因此, 设B是由A通过一次初等行变换得到的, 不论它是三种变换的哪一种, 线性方程组BX=0的每个方程都是线性方程组AX=0的方程的线性组合. 鉴于初等行变换的逆也是初等行变换, 每个线性方程组AX=0的方程也是线性方程组BX=0的方程的线性组合. 于是, 两个线性方程组是等价的. 根据定理1, 它们拥有相同的解.
例子5.F是有理数域, 并且A=[213214012615].我们将施行一系列初等行变换于A, 并在箭头上标示出变换的类型.[213214012615]2[093414012615]2[093414010217]1[09341401011272]2[093410213011272]2[0015255210213011272]1[00111310213011272]2[001113100173011272]2[00111310017301053]上面的一系列初等行变换告诉我们{2x1x2+3x3+2x4=0x1+4x2x4=02x1+6x2x3+5x4=0{x3113x4=0x1+173x4=0x253x4=0拥有相同的解. 对于第二个线性方程组, 显然如果我们赋任意的有理数值cx4就得到了一个解(173c,53c,113c,c), 并且每个解都具有这样的形式.
例子6.F是复数域并且A=[1ii312]施行行变换的时候通常把几个类型2的变换组合起来是方便的. 把这点记在心中,[1ii312]2[02+i03+2i12]1[0103+2i12]2[010010]因此线性方程组{x1+ix2=0ix1+3x2=0x1+2x2=0只有平凡解x1=x2=0.

例子5和例子6里我们显然不是在随意施行行变换. 我们对于行变换的选择是由想要像消去未知元解线性方程组一样化简系数矩阵的欲望驱使的. 现在让我们给出一个形式化的定义, 对于我们想要抵达什么类型的矩阵.

定义. 一个m×n矩阵R被称为行简化的, 如果
  1. 每个R的非零行的第一个非零元素是1;
  2. 每个包含首非零元的列, 其余的元素均为0.
例子7. 一个行简化矩阵的例子是n×n的恒等矩阵I. 这是由Ii,j=δi,j={1,如果i=j0,如果ij定义的矩阵. 目前是我们第一次使用Kronecker delta, 之后也将经常用到.

例子5和例子6最终呈现的矩阵都是行简化矩阵. 以下是两个不是行简化矩阵的例子:[100001100010][021103000]第二个矩阵没有满足条件a, 因为第一行的首非零元不是1. 第一个矩阵满足了条件a, 但是第三列没有满足条件b.

现在我们将证明我们可以从任意的矩阵出发, 通过有限数目的初等行变换, 得到一个行简化矩阵. 结合定理3, 这给我们提供了一个解决线性方程组的有效工具.

定理4. 每个域F上的m×n矩阵都行等价于一个行简化矩阵.
证明.A是一个域F上的m×n矩阵. 如果A的第一行的每个元素都是0, 那么只考虑第一行条件a就是成立的. 如果第一行有非零的元素, 令k是满足A1,j0的正整数j中最小的. 给第一行乘上A1,k1, 那么第一行就满足条件a了. 现在对于每个i2, 将第一行乘上(Ai,k)加到第i行. 现在第一行的首非零元出现在第k列, 其值为1, 并且第k列的每个其他元素都是0.
现在考虑上面得到的矩阵. 如果第二行的每个元素都是0, 我们就什么也不做. 如果第二行有异于零的元素, 就给第二行乘上一个标量使其首非零元为1. 在第一行首非零元位于第k列的情况下, 第二行的首非零元不可能出现在第k列, 设其出现在第k列. 通过给第二行乘上合适的标量加到其他行上去, 就能使得第k列除了第二行之外都是0. 重要的是注意到以下这点, 在施行这些操作的时候, 我们不会改变第一行处于第1,,k列的元素, 也不会改变第k列的元素. 当然, 如果第一行全是零, 那么这些操作就不会影响第一行.
以如上方式逐行操作, 显然在有限步内我们能够抵达一个行简化矩阵.
练习1. 找出下列线性方程组的所有解.{(1i)x1ix2=02x1+(1i)x2=0
练习2. 如果A=[312211130]通过行简化A以找出AX=0的所有解.
练习3. 如果A=[640420103]找出AX=2XAX=3X的解. (符号cX表示一个矩阵, 其每个元素都是c乘上相对应的X的元素.)
练习4. 找出一个与下列矩阵行等价的行简化矩阵.A=[i(1+i)012112i1]
练习5. 证明下列两个矩阵不是行等价的.[200a10bc3][112201135]
练习6.A=[abcd]是一个复数域上的2×2矩阵. 设A是行简化的, 并且a+b+c+d=0. 证明恰存在三个这样的矩阵.
练习7. 证明交换矩阵两行的操作可由其他两种操作达成.
练习8. 考虑线性方程组AX=0, 其中A=[abcd]是一个域F上的2×2矩阵. [译注: 意即线性方程组就是域F上的.] 证明以下陈述.
  1. 如果A的每个元素都是0, 那么每个序对(x1,x2)都是AX=0的解.
  2. 如果adbc0, 那么线性方程组AX=0仅有平凡解x1=x2=0.
  3. 如果adbc=0并且某个A的元素异于0, 那么存在一个解(x10,x20)满足, (x1,x2)是一个解当且仅当存在标量y满足x1=yx10,x2=yx20.

第1.4节 行简化阶梯矩阵

到目前为止, 我们对于线性方程组的处理是由找出方程组的解的尝试推动的. 在第1.3节, 我们建立了找出这些解的一种标准化技术. 现在我们希望获得一些稍微理论一点的信息, 出于这样的目的, 走得比行简化矩阵更远一点是方便的.

定义. 一个m×n的矩阵R被称为一个行简化阶梯矩阵, 如果
  1. R是行简化的;
  2. R的每个元素全为0的行在具有非零元素的行的下方;
  3. 如果第1,,r行是R的非零行, 并且如果第i行的首非零元出现在第ki列, i=1,,r, 那么k1<k2<<kr.

人们也可以按照以下方式刻画m×n的行简化阶梯矩阵R. 要么R的每个元素都是0, 要么存在一个正整数r,1rm, 以及r个正整数k1,,kr,1kin满足

  1. 对于i>r, Ri,j=0, 并且Ri,j=0如果j<ki.
  2. Ri,kj=δi,j,1ir,1jr.
  3. k1<<kr.

例子8. 两个行简化阶梯矩阵的例子分别是n×n的恒等矩阵和m×n的零矩阵0m,n, 其每个元素都是零. 当然读者构造出其他例子也没有困难, 不过这里我们给出一个非平凡的例子.[0130120001200000]
定理5. 每个m×n的矩阵A都行等价于一个行简化阶梯矩阵.
证明. 我们知道A行等价于一个行简化矩阵, 所有我们需要做的只是观察到通过有限次的行交换我们可以将行简化矩阵变成行简化阶梯矩阵.

在例子5和例子6中我们看到了在求解齐次线性方程组时行简化矩阵的重要性. 现在让我们来简要讨论方程组RX=0, 其中R是一个行简化阶梯矩阵. 令第1,,r行是R的非零行, 并设第i行的首非零元出现在第ki列. 于是, 方程组RX=0包含r个非平凡方程. 并且, 未知元xki仅会出现在第i行. 如果我们用u1,,unr代表异于xk1,,xkr(nr)个未知元, 那么RX=0r个非平凡方程具有如下的形式.{xk1+j=1nrC1,juj=0xkr+j=1nrCr,juj=0线性方程组RX=0的所有解都可以由给u1,,unr赋任意的值然后计算相对应的xk1,,xkr的值获得. 例如, 如果R是例子8展示的那个矩阵, 那么r=2,k1=2,k2=4, 并且RX=0的两个非平凡方程是{x23x3+12x5=0x4+2x5=0或者写成{x2=3x312x5x4=2x5于是我们可以给x1, x3x5赋任意的值, 比如x1=a,x3=b,x5=c, 然后就得到了解(a,3b12c,b,2c,c).

让我们再观察到与线性方程组RX=0有关的另一个事实. 如果R的非零行数r小于n, 那么方程组RX=0具有一个非平凡的解, 即一个解(x1,,xn), 其中不是每个xj都是0. 这是因为, 既然r<n, 我们可以挑选一个xj, 其异于xk1,,xkr, 那么我们可以按照如上方式构造出一个解, 其中令xj=1. 这个观察将我们引导至和齐次线性方程组有关的最根本性的事实之一.

定理6. 如果A是一个m×n的矩阵并且m<n, 那么齐次线性方程组AX=0具有非平凡解.
证明.R是一个行等价于A的行简化阶梯矩阵, 那么根据定理3, 方程组AX=0RX=0具有相同的解. 令rR的非零行数, 那么肯定rm. 既然m<n, 就有r<n. 立刻从我们以上的观察中就得知AX=0具有非平凡解.
定理7. 如果A是一个n×n的矩阵, 那么A行等价于n×n的恒等矩阵当且仅当线性方程组AX=0仅有平凡解.
证明. 如果A行等价于I, 那么AX=0IX=0具有相同的解. 反过来, 设AX=0仅有平凡解X=0. 令R是一个与A行等价的n×n的行简化阶梯矩阵, 并令rR的非零行数. 既然RX=0没有非平凡的解, 那么rn. 又因为R只有n行, 所以当然rn, 于是r=n. 这意味着R的每一行都具有首非零元1, 而且因为它们分布于不同的n列里, R只可能是n×n的恒等矩阵.

现在让我们来探究如何使用初等行变换求解非齐次的线性方程组AX=Y. 首先, 读者应该注意到它与齐次情形的一个基本区别, 即尽管齐次线性方程组总有平凡的解x1==xn=0, 非齐次的情况压根不一定有解.

我们来构造线性方程组AX=Y的增广矩阵A. 这是一个m×(n+1)的矩阵, 其中前n列是A的列, 最后一列是Y. 更精确地,Ai,j=Ai,j如果jn,Ai,n+1=yi.设我们施行了一系列初等行变换于A, 得到了一个行简化阶梯矩阵R. 如果我们施行相同的初等行变换于A, 就会得到一个矩阵R, 其前n列是R的列, 而最后一列包含特定的标量z1,,zm. 标量zim×1矩阵Z=[z1zm]的元素, 它是由施行相同的初等行变换于Y得到的. 显然读者应该认识到, 正如定理3的证明一样, 线性方程组AX=YRX=Z是等价的, 因而拥有相同的解. 很容易确定RX=Z是否有解并在有解的情况下确定所有的解. 这是因为, 如果R具有r个非零行, 并且其第i行的首非零元出现在第ki列, 其中i=1,,r, 那么RX=Z的前r行有效地表达了xk1,,xkr, 基于(nr)个剩余的xj和标量z1,,zr. 最后的(mr)个方程是0=zr+10=zm据此, 方程组拥有解的条件是i>rzi=0. 如果这个条件被满足, 所有线性方程组的解就可以像齐次的情况一样被找到, 即给(nr)xj赋任意的值, 然后根据第i个方程计算xki的值.

例子9.F是有理数域, 并且A=[121211051]设我们希望求解线性方程组AX=Y, 对于某些y1, y2y3. 让我们将行规约A的一系列初等行变换施行于A之上:[121y1211y2051y3]2[121y1051(y22y1)051y3]2[121y1051(y22y1)000(y3y2+2y1)]1[121y1011515(y22y1)000(y3y2+2y1)]2[103515(y1+2y2)011515(y22y1)000(y3y2+2y1)]那么线性方程组AX=Y有解的条件就是2y1y2+y3=0并且如果给定的标量yi满足这个条件, 所有的解都可以由以下方式获得, 赋一个值cx3, 然后计算x1=35c+15(y1+2y2)x2=15c+15(y22y1)

让我们再做关于线性方程组AX=Y的最后一个观察. 设矩阵A的元素和标量y1,,ym恰好落入域F的一个子域F1中. 如果线性方程组AX=Y拥有在域F中的解, 那么它也拥有在域F1中的解, 因为不论对于哪一个域而言, 线性方程组有解的条件都是域F1y1,,ym之间的特定关系成立 (也就是上面的关系zi=0对于i>r成立). 举个例子, 如果AX=Y是一个线性方程组, 其标量ykAi,j都是实数, 若其有复数的解, 那么它也有实数的解.

练习1. 通过行规约系数矩阵来找出下列线性方程组的所有解.{13x1+2x26x3=04x1+5x3=03x1+6x213x3=073x1+2x283x3=0
练习2. 找出与下列矩阵行等价的一个行简化阶梯矩阵.A=[1i22i1+i]AX=0的解是什么?
练习3. 显式描述所有2×2的行简化阶梯矩阵.
练习4. 考虑以下线性方程组.{x1x2+2x3=12x1+2x3=1x13x2+4x3=2这个方程组有解吗? 如果有的话, 显式描述所有的解.
练习5. 给出一个无解的具有两个方程和两个未知元的线性方程组的例子.
练习6. 证明线性方程组{x12x2+x3+2x4=1x1+x2x3+x4=2x1+7x25x3x4=3没有解.
练习7. 找出下列线性方程组的所有解.{2x13x27x3+5x4+2x5=2x12x24x3+3x4+x5=22x14x3+2x4+x5=3x15x27x3+6x4+2x5=7
练习8.A=[312211130]对于什么样的三元组(y1,y2,y3)线性方程组AX=Y有解?
练习9.A=[3621241300111210]对于什么样的四元组(y1,y2,y3,y4)线性方程组AX=Y有解?
练习10.RR2×3的行简化阶梯矩阵并且线性方程组RX=0RX=0具有相同的解, 证明R=R.

第1.5节 矩阵乘法

显然构造矩阵的行的线性组合的过程是一种根本性的运算. 出于这样的理由, 引入指示何种操作将被施行的系统记号是很有好处的. 更细致地说, 设B是域F上的n×p矩阵, 其行分别为β1,,βn. 从B我们构造出C, 其行分别为γ1,,γmγi=Ai,1β1+Ai,2β2++Ai,nβn.C的行是由mn个标量Ai,j决定的, 而它们本身是一个m×n矩阵A的元素. 将γi展开来看,(Ci,1,,Ci,p)=r=1n(Ai,rBr,1,,Ai,rBr,p)我们发现C的元素由Ci,j=r=1nAi,rBr,j给出.

定义.A是一个域F上的m×n矩阵, 令B是一个域F上的n×p矩阵. 积AB是一个m×p矩阵C, 其第ij列的元素为Ci,j=r=1nAi,rBr,j.
例子10. 这里给出一些有理数域上的矩阵之积.
  1. [512072]=[1031][5121548]其中γ1=(5,1,2)=1(5,1,2)+0(15,4,8)γ2=(0,7,2)=3(5,1,2)+1(15,4,8)
  2. [061912812623382]=[10235401][061382]其中γ2=(9,12,8)=2(0,6,1)+3(3,8,2)γ3=(12,62,3)=5(0,6,1)+4(3,8,2)
  3. [829]=[2154][16]
  4. [24612]=[13][24]其中γ2=(6,12)=3(2,4)
  5. [24][13]=[10]
  6. [010000000][152234913]=[234000000]
  7. [152234913][010000000]=[010020090]

注意到两个矩阵之积不必有定义是重要的. 积有定义当且仅当第一个矩阵的列数与第二个矩阵的行数相合. 因此, 交换以上a, b, c中因子的顺序是没有意义的. 往往我们写下如AB一样的积时并不显式提及因子的尺寸, 在这种情况下, 应该理解为积是有定义的. 从d, e, f, g中我们发现, 即便ABBA都有定义, 也不一定有AB=BA. 换句话说, 矩阵乘法不是交换的.

例子11.
  1. 如果Im×m的恒等矩阵, 而A是一个m×n的矩阵, 那么IA=A.
  2. 如果In×n的恒等矩阵, 而A是一个m×n的矩阵, 那么AI=A.
  3. 如果0k,mk×m的零矩阵, 那么0k,n=0k,mA. 类似地, A0n,p=0m,p.
例子12.A是域F上的一个m×n矩阵. 我们之前对于线性方程组的简记法AX=Y和我们对于矩阵乘法的定义是一致的, 因为如果X=[x1x2xn]其中xiF中, 那么AXm×1矩阵Y=[y1y2ym]满足yi=Ai,1x1+Ai,2x2++Ai,nxn.

列矩阵的使用提示了一种往往有用的记号. 如果B是一个n×p的矩阵, 那么B的列是n×1矩阵B1,,Bp, 由Bj=[B1,jBn,j],1jp定义. 矩阵B是由这些列相继构成的:B=[B1,,Bp]积矩阵AB的第ij列元素是由A的第i行和B的第j列构造出来的. 读者应该验证AB的第j列就是ABj:AB=[AB1,,ABp]

尽管矩阵之积依赖于因子的顺序, 但是它独立于结合的方式, 这正是下一个定理表明的.

定理8. 如果A, B, C是域F上的矩阵, 满足乘积BCA(BC)有定义, 那么乘积AB(AB)C也有定义, 并且A(BC)=(AB)C
证明.B是一个n×p矩阵. 既然BC是有定义的, 那么C就是一个有p行的矩阵, 而BCn行. 因为A(BC)是有定义的, 我们可以假定A是一个m×n矩阵. 因此, 积AB存在, 是一个m×p矩阵, 从中又可以知道(AB)C存在. 为了证明A(BC)=(AB)C其实也就是要证明[A(BC)]i,j=[(AB)C]i,j对于每个ij成立. 根据定义,[A(BC)]i,j=rAi,r(BC)r,j=rAi,rsBr,sCs,j=rsAi,rBr,sCs,j=srAi,rBr,sCs,j=s(rAi,rBr,s)Cs,j=s(AB)i,sCs,j=[(AB)C]i,j

A是一个n×n矩阵时, 积AA是有定义的. 我们用A2表示这个矩阵. 根据定理8, (AA)A=A(AA)或者说A2A=AA2, 于是积AAA是良定的. 我们用A3表示这个积. 一般地, 积AAA (k次) 是良定的, 我们将其记作Ak.

注意到A(BC)=(AB)C可以推出C的行的线性组合的线性组合也是C的行的线性组合.

如果B是一个给定的矩阵而C是由B通过一次初等行变换得到的, 那么C的每一行都是B的行的线性组合, 因此存在一个矩阵A满足AB=C. 一般而言, 这样的A不止一个, 而从诸多这样的矩阵中挑选出一个具有许多特别性质的矩阵是可能的也是方便的. 在讨论这个之前我们需要先引入一类矩阵.

定义. 一个m×m矩阵被称为是一个初等矩阵, 如果它是可由m×m的恒等矩阵通过一次初等行变换得到.
例子13. 一个2×2的初等矩阵只可能是以下几种之一:[0110],[1c01],[10c1][c001],c0,[100c],c0
定理9.e是一个初等行变换, 令m×m矩阵E=e(I). 那么, 对于每一个m×n矩阵A,e(A)=EA
证明. 证明的要点在于积矩阵EAij列的元素是由E的第i行和A的第j列得到的. 三种初等行变换应该分开看待. 我们将给出对于类型2的变换的详细证明. 其他两种情况更加简单, 留给读者作为练习. 设rse是将第r行替换为第r行加上c乘上第s行的变换, 那么Ei,k={δi,k,irδr,k+cδs,k,i=r因此,(EA)i,j=k=1mEi,kAk,j={Ai,j,irAr,j+cAs,j,i=r换句话说, EA=e(A).
推论.AB是域F上的m×n矩阵, 那么B行等价于A当且仅当B=PA, 其中P是一系列m×m的初等矩阵之积.
证明.B=PA, 其中P=EsE2E1Eim×m的初等矩阵, 那么E1A行等价于A, 并且E2(E1A)行等价于E1A, 于是E2E1A行等价于A. 如法炮制我们可以看到(EsE1)A行等价于A.
现在设B行等价于A. 令E1,E2,,Es为与将A变为B的一系列初等行变换相对应的初等矩阵, 那么B=(EsE1)A.
练习1.A=[211121],B=[311],C=[11]计算ABCCAB.
练习2.A=[111201301],B=[221344]验证A(AB)=A2B.
练习3. 找出两个不同的2×2矩阵A满足A2=0但是A0.
练习4. 对于练习2的矩阵A, 找出初等矩阵E1,E2,,Ek满足EkE2E1A=I
练习5.A=[112210],B=[3144]存在矩阵C满足CA=B吗?
练习6.A是一个m×n矩阵而B是一个n×k矩阵. 证明C=AB的列是A的列的线性组合, 并且如果α1,,αnA的列, 而γ1,,γkC的列, 那么γj=r=1nBr,jαr
练习7.AB2×2的矩阵满足AB=I, 证明BA=I.
练习8.C=[C1,1C1,2C2,1C2,2]是一个2×2的矩阵. 我们想问什么情况下有可能找到两个2×2的矩阵AB满足C=ABBA. 证明这样的矩阵可以被找到当且仅当C1,1+C2,2=0.

第1.6节 可逆矩阵

m×m矩阵P是初等矩阵之积. 对于每个m×n矩阵A, 矩阵B=PA行等价于A, 因此A行等价于B, 存在一个初等矩阵之积Q满足A=QB. 特别地, 当Am×m的恒等矩阵时亦成立. 换言之, 存在一个m×m矩阵Q, 其自身是初等矩阵之积, 满足QP=I. 正如我们将看到的, 存在Q满足QP=I等价于P是初等矩阵之积.

定义.A是域F上的一个n×n矩阵. 一个n×n矩阵B若是满足BA=I, 则被称为A的一个左逆. 一个n×n矩阵B若是满足AB=I, 则被称为A的一个右逆. 如果AB=BA=I, 则B被称为A的双端逆, 而A被称为可逆的.
引理. 如果A有一个左逆B和一个右逆C, 那么B=C.
证明.BA=IAC=I, 那么B=BI=B(AC)=(BA)C=IC=C

因此, 如果A有一个左逆和一个右逆, A就是可逆的, 并且拥有一个唯一的双端逆, 我们将其表示为A1并简单地称其为A的逆.

定理10.AB是域F上的n×n矩阵.
  1. 如果A可逆, 那么A1也可逆, 并且(A1)1=A.
  2. 如果AB都可逆, 那么AB也可逆, 并且(AB)1=B1A1.
证明. 第一条陈述从定义的对称性来看是显然的. 第二条陈述由验证以下关系自然得到.(AB)(B1A1)=(B1A1)(AB)=I
推论. 一系列可逆矩阵之积是可逆的.
定理11. 初等矩阵是可逆的. [译注: 并且逆也是初等矩阵.]
证明.E是与初等行变换e相对应的初等矩阵. 如果e1e的逆变换 (见定理2) 而E1=e1(I), 那么有EE1=e(E1)=e(e1(I))=IE1E=e1(E)=e1(e(I))=I于是E是可逆的且E1=E1.
例子14.
  1. [0110]1=[0110]
  2. [1c01]1=[1c01]
  3. [10c1]1=[10c1]
  4. c0,[c001]1=[c1001][100c]1=[100c1]
定理12. 如果A是一个n×n的矩阵, 那么以下命题等价.
  1. A可逆.
  2. A行等价于n×n的恒等矩阵.
  3. A是一系列初等矩阵之积.
证明.R是行等价于A的一个行简化阶梯矩阵. 根据定理9 (或其推论),R=EkE2E1A其中E1,,Ek是初等矩阵. 每个Ej都是可逆的, 于是A=E11Ek1R既然可逆矩阵之积是可逆的, 我们看到A可逆当且仅当R可逆. 因为R是一个 (方的) 行简化阶梯矩阵, R可逆当且仅当R的每一行都包含非零元, 即当且仅当R=I. 现在我们已经证明了A可逆当且仅当R=I, 并且如果R=I, 那么A=E11Ek1. 现在i, ii, iii是关于A的等价陈述应该是显然的了.
推论. 如果A是一个n×n的可逆矩阵, 并且一系列初等行变换将A规约为I, 那么相同的初等行变换应用于I就得到A1.
推论.ABm×n的矩阵, 那么B行等价于A当且仅当B=PA, 其中P是一个m×m的可逆矩阵.
定理13. 对于n×n矩阵A, 以下命题等价.
  1. A可逆.
  2. 齐次线性方程组AX=0仅有平凡解.
  3. 线性方程组AX=Y对于每个n×1Y都有一个解X.
证明. 根据定理7, 条件ii等价于A行等价于恒等矩阵. 根据定理12, i和ii因此是等价的. 如果A可逆, AX=Y的解是X=A1Y. 反过来, 设AX=Y对于每个给定的Y都有一个解. 令R是行等价于A的一个行简化阶梯矩阵. 我们想要证明R=I. 这只需要证明R的最后一行不都是零即可. 令E=[0001]RX=E有解, 那么R的最后一行就不可能都是零. 我们知道R=PA, 其中P可逆, 因而RX=EAX=P1E拥有相同的解. 根据条件iii, 后一个线性方程组有解, 故A可逆.
推论. 一个有左逆或右逆的方阵是可逆的.
证明.A是一个n×n矩阵. 设A有一个左逆, 即一个矩阵B满足BA=I, 那么AX=0仅有平凡解, 因为X=IX=B(AX), 故A可逆. 另一方面, 设A有一个右逆, 即一个矩阵C满足AC=I, 那么C有一个左逆, 故是可逆的, 于是就有A=C1, 那么A可逆, 其逆为C.
推论.A=A1A2Ak, 其中A1,,Akn×n的方阵, 那么A可逆当且仅当每个Aj可逆.
证明. 我们已经证明了两个可逆矩阵之积是可逆的, 从中读者可以简单地看出来若是每个Aj可逆, 则A可逆. [译注: 实际上之前有一个推论陈述了这个事实.]
现在设A可逆. 我们先来证明Ak是可逆的. 设X是一个n×1的矩阵并且AkX=0, 那么AX=(A1Ak1)AkX=0. 既然A是可逆的, 那么X就必须是0. 因此, AkX=0没有非平凡的解, 于是Ak可逆. 现在, A1Ak1=AAk1也是可逆的了. 施行前述论证, 可知Ak1是可逆的. 续行此法, 可得每个Aj都是可逆的.

我们想要作出关于求解线性方程组的最后一个注记. 设A是一个m×n的矩阵, 并且我们想要求解线性方程组AX=Y. 如果R是行等价于A的一个行简化阶梯矩阵, 那么R=PA, 其中P是一个m×m的可逆矩阵. 方程组AX=Y的解恰好就和RX=PY(=Z)相同. 在实践中, 找到矩阵P并不比行规约AR困难. 这是因为, 设我们构造了方程组AX=Y的增广矩阵A, 其最后一行是任意的标量y1,,ym, 然后我们施行将A变为R的初等行变换于A, 那么矩阵P是什么就很清楚了. (读者应该参考例子9, 那里我们基本上执行了这套过程.) [译注: 这段话并不十分清楚, 但实际上它的意思就是将y1,,ym当作符号带入计算.] 特别地, 如果A是一个方阵, 那么这个过程将会表明A是否可逆, 以及若可逆, 逆P是什么. 既然我们已经给出这样的计算的一个例子的核心了, 那么现在我们举一个2×2的例子就心满意足了.

例子15.F是有理数域, 而A=[2113]那么[21y113y2]3[13y221y1]2[13y207y12y2]1[13y20117(2y2y1)]2[1017(y2+3y1)0117(2y2y1)]从中可以清楚地看出来A可逆, 并且A1=[37171727]

或许看上去一直把任意的标量y1,y2,写下来太过繁琐. 有的人觉得同时操作两列矩阵不那么尴尬一点, 一列描述了从A到恒等矩阵的规约过程, 另一列记录了相同的操作对于恒等矩阵的影响. 读者或许应该自行决定哪一种对于他而言是更加利落的簿记格式.

例子16. 让我们找出A=[11213121314131415]的逆.[11213121314131415][100010001][1121301121120112445][10012101301][112130112112001180][10012101611][11213011001][100612030180180][1120010001][960603619218030180180][100010001][936303619218030180180]

读者肯定想过我们详细地讨论了矩阵的行但很少涉及列. 我们专注于行是因为从线性方程的角度来看这似乎更加自然. 既然行没有什么神圣的地方, 后几节的讨论当然本可用列来展开而不是行. 如果有人仿照初等行变换和行等价定义了初等列变换和列等价, 那么显然每个m×n的矩阵都列等价于一个"列简化阶梯"矩阵. 另外, 每个初等列变换将拥有AAE的形式, 其中E是一个n×n的初等矩阵. 诸如此类, 留给读者自行思考.

练习1.A=[121010351211]找出一个行等价于A的行简化阶梯矩阵R以及一个可逆的3×3矩阵P满足R=PA.
练习2. 做练习1, 但是A=[20i13ii11]
练习3. 对于以下两个矩阵的每一个[251412641],[112324012]使用初等行变换来判断其是否可逆, 并且在可逆的情况下找出其逆.
练习4.A=[500150015]对于什么样的X存在标量c满足AX=cX?
练习5. 判断A=[1234023400340004]是否可逆, 并且在A1存在的情况下找到它.
练习6.A是一个2×1矩阵而B是一个1×2矩阵, 证明C=AB不可逆.
练习7.A是一个n×n的方阵. 证明以下两个陈述:
  1. 如果A可逆而对于某个n×n的矩阵BAB=0, 那么B=0.
  2. 如果A不可逆, 那么存在一个n×n的矩阵B满足AB=0但是B0.
练习8.A=[abcd]使用初等行变换证明, A可逆当且仅当(adbc)0.
练习9. 一个n×n矩阵A被称为是上三角的, 如果i>jAi,j=0, 即主对角线以下的元素均为零. 证明一个上三角矩阵可逆当且仅当其每个主对角线上的元素均不为零.
练习10. 证明以下练习6的一般化版本. 若A是一个m×n矩阵而B是一个n×m矩阵, 并且n<m, 那么AB不可逆.
练习11.A是一个m×n矩阵. 证明通过一系列初等行变换和初等列变换可以从A得到一个矩阵R, 其既是行简化阶梯矩阵, 也是列简化阶梯矩阵. 也就是说, 如果ij, 那么Ri,j=0; 如果1ir, 那么Ri,i=1; 如果i>r, 那么Ri,i=0. 证明R=PAQ, 其中P是一个m×m的可逆矩阵, 而Q是一个n×n的可逆矩阵.
练习12. 例子16的结果暗示或许矩阵A=[1121n12131n+11n1n+112n1]可逆并且A1的元素都是整数. 你能证明吗?

第2章 向量空间

第2.1节 向量空间

在数学的许多部分中, 人们经常会遇到这样的集合, 其中处理对象的线性组合是有趣的. 例如, 我们发现在对于线性方程的研究中, 考虑矩阵的行的线性组合是相当自然的. 很有可能读者学过微积分, 那里处理函数的线性组合, 特别是学习微分方程的时候. 或许读者有些与三维Euclid空间打交道的经历, 特别是处理其中向量的线性组合.

不严格地说, 线性代数是这样的数学分支, 它讨论其中线性组合是有意义的代数系统的共同性质. 本节我们将定义一种数学对象, 经验表明它是此类代数系统最有用的抽象.

定义. 一个向量空间 (或者说线性空间) 包含以下资料:
  1. 一个标量域F;
  2. 一个对象的集合V, 这些对象被称为向量;
  3. 一个法则 (或者说运算), 被称为向量加法, 联系每对V中向量αβ以一个V中向量α+β, 其被称为αβ之和, 并且该运算满足
    1. 加法是交换的, α+β=β+α;
    2. 加法是结合的, α+(β+γ)=(α+β)+γ;
    3. V中存在唯一的向量0, 被称为零向量, 满足α+0=α对于V中所有向量α成立;
    4. 对于每个V中向量α, 存在唯一的V中向量α满足α+(α)=0;
  4. 一种法则 (或者说运算), 被称为标量乘法, 联系每个F中标量cV中向量α以一个V中向量cα, 其被称为cα之积, 并且该运算满足
    1. 1α=α对于每个V中的α成立;
    2. c1(c2α)=(c1c2)α;
    3. c(α+β)=cα+cβ;
    4. (c1+c2)α=c1α+c2α.

注意到, 正如定义所言, 一个向量空间是一个复合对象, 包含一个域, 一集"向量", 和两个带有特别性质的运算. 相同的向量集合可能是其他不同向量空间的组成部分 (见以下的例子5). 当没有歧义的时候, 我们就简单地以V引用这个向量空间, 或者当我们想要刻画域的时候, 我们就说V是一个域F上的向量空间. "向量"这个名字应用于集合V的元素很大程度上只是为了方便起见. 这个名字的由来可以从以下的例子1中找到, 但读者不应该给这个名字附加太多的重要性, 因为作为向量出现的各种对象可能与读者对于向量预先赋予的概念并无类似之处. 我们将在下面的一连串例子中尽力传达这点. 随着我们开始研究向量空间, 例子也会丰富起来.

例子1. n元组空间, Fn.F是任意的域, 令V是所有n元组α=(x1,x2,,xn)构成的集合, 其中xiF中的标量. 如果β=(y1,y2,,yn), 其中yiF中的标量, 那么αβ的和由α+β=(x1+y1,x2+y2,,xn+yn)定义. 标量c和向量α的积由cα=(cx1,cx2,,cxn)定义. 这向量加法和标量乘法满足条件3和4是容易验证的, 运用F的元素的加法和乘法的类似性质即可.
例子2. m×n矩阵的空间, Fm×n.F是任意的域, 并令mn是正整数. 令Fm×n是域F上所有m×n矩阵构成的集合. Fm×n中的两个向量AB的和由(A+B)i,j=Ai,j+Bi,j定义. 标量c和矩阵A的积由(cA)i,j=cAi,j定义. 注意到F1×n=Fn. [译注: 在同构的意义上.]
例子3. 从一个集合到一个域的函数的空间.F是任意的域, 令S是一个非空集合. 令V是所有从集合S到域F的函数构成的集合. V中两个向量fg之和是向量f+g, 即一个从SF的函数, 由(f+g)(s)=f(s)+g(s)定义. 标量c和函数f的积是函数cf, 由(cf)(s)=cf(s)定义. 前述例子不过就是这个的特殊情形. 对于F的元素的n元组而言, 其或可被视为从整数1,,n的集合SF的一个函数. 类似地, 一个域F上的m×n矩阵是一个从整数序对(i,j),1im,1jn的集合S到域F的函数. 对于这第三个例子, 我们将指明读者该如何验证条件3和4. 对于向量加法:
  1. 既然F中的加法是交换的,f(s)+g(s)=g(s)+f(s)对于每个S中的s成立, 于是函数f+gg+f是等同的.
  2. 既然F中的加法是结合的,f(s)+[g(s)+h(s)]=[f(s)+g(s)]+h(s)对于每个s成立, 于是f+(g+h)(f+g)+h是相同的函数.
  3. 唯一的零向量就是零函数, 其赋S的每个元素以F中的标量0.
  4. 对于每个V中的f, (f)是由(f)(s)=f(s)给定的函数.
读者应当发现验证标量乘法满足条件4是容易的, 通过施行类似于我们上面对于向量加法的论证.
例子4. F上的多项式函数的空间.F是一个域, 令V是所有具有如下形式的从FF的函数f(x)=c0+c1x++cnxn构成的集合, 其中c0,c1,,cnF中固定的标量 (独立于x). 一个这种类型的函数被称为F上的一个多项式函数. 令加法和标量乘法如例子3所定义的那样. 读者必须观察到如果fg是多项式函数而cF中, 那么f+gcf也是多项式函数.
例子5. 复数域可以被当作实数域上的向量空间. 更一般地, 令F实数域, 而令Vn元组(x1,,xn)的集合, 其中x1,,xn是复数. 如例子1一样定义向量的加法和标量乘法, 这般我们就得到了一个实数域上的向量空间, 其与nn相当不同.

从向量空间的定义中我们几乎立刻就能推出一些简单的事实, 接下来我们将推导它们. 如果c是一个标量而0是零向量, 那么根据3c和4cc0=c(0+0)=c0+c0加上(c0)并使用3d, 我们就得到了c0=0类似地, 对于标量0和任意的向量α我们发现0α=0如果c是一个非零标量而α是一个向量满足cα=0那么根据c0=0, 我们有c1(c0)=0, 但是又因为c1(c0)=(c1c)α=1α=α于是α=0. 因此, 我们看到如果c是一个标量而α是一个向量, 并且cα=0, 那么要么c标量零, 要么α是零向量.
如果αV中任意的向量, 那么0=0α=(11)α=1α+(1)α=α+(1)α从中就推出(1)α=α最后, 向量加法的结合和交换性质可以推出牵扯到数个向量的和独立于这些向量组合和结合的方式. 例如, 如果α1,α2,α3,α4V中向量, 那么(α1+α2)+(α3+α4)=[α2+(α1+α3)]+α4并且这样一个和可以无歧义地被写成α1+α2+α3+α4

定义. V中一个向量β被称为V中向量α1,,αn的线性组合, 只要存在F中的标量c1,,cn满足β=c1α1++cnαn=i=1nciαi

对于向量加法的结合性质以及标量乘法的分配性质4c和4d的其他扩展可以施行于线性组合之上:i=1nciαi+i=1ndiαi=i=1n(ci+di)αici=1nciαi=i=1n(cci)αi

线性代数的特定部分与几何紧密关联. "空间"暗示了某种几何的东西, "向量"对于大多数人也是如此. 当我们进一步研究向量空间时, 读者将会发现许多术语的确拥有几何的内涵. 在结束介绍向量空间的本节之前, 我们将在某种程度上讨论向量空间和几何之间的关系, 至少能够指明"向量空间"这个名字的由来. 这将会是简要的直觉性的讨论.

让我们考虑向量空间3. 在解析几何中, 人们将实数三元组(x1,x2,x3)和三维Euclid空间中的点视为等同的. 在这样的上下文之中, 一个向量经常被定义成一个有向线段PQ, 从点P的位置到点Q. 这相当于对从PQ的"箭头"的想法进行小心的形式化. 当向量被使用时, 意图在于它们应该由它们的长度和方向所决定. 因此, 当两个有向线段具有相同的长度和相同的方向时, 人们必须将其视为等同的.

P=(x1,x2,x3)Q=(y1,y2,y3)的有向线段PQ与从原点O=(0,0,0)到点(y1x1,y2x2,y3x3)的有向线段具有相同的长度和方向. 并且, 这是自原点出发而与PQ具有相同长度和方向的唯一一条有向线段. 因此, 如果读者同意仅处理从原点出发的向量, 那么与每个给定的长度和方向相关联着的仅恰有一个向量.

从原点至P=(x1,x2,x3)的向量OP完全由P决定, 因此将这个向量与点P视为等同是可能的. 在我们对于向量空间3的定义中, 那些向量就简单地被定义成三元组(x1,x2,x3).

给定点P=(x1,x2,x3)Q=(y1,y2,y3), 向量OPOQ之和的定义可以被几何地给出. 如果这两个向量不是平行的, 那么线段OPOQ确定了一个平面, 并且这两条线段是该平面中的一个平行四边形的两条边 (见图1). 该平行四边形的一条对角线自O延伸至点S, 而OPOQ之和就被定义成向量OS. 点S的坐标为(x1+y1,x2+y2,x3+y3), 因此这向量加法的几何定义就等价于例子1的代数定义.

P(x1,x2,x3)Q(y1,y2,y3)S(x1+y1,x2+y2,x3+y3)
图1

标量乘法拥有一个简单的几何解释. 如果c是一个实数, 那么c与向量OP之积是一个向量, 其自原点出发, 长度为|c|乘以OP的长度, 方向在c>0时与OP相同, c<0时与OP相反. 这标量乘法就产生向量OT, 其中T=(cx1,cx2,cx3), 因此也与为3给出的代数定义一致.

时不时地, 读者可能会发现"几何地思考"向量空间很有助益. 也就是说, 出于自身的需要, 通过绘图来刻画和启发一些想法. 的确, 读者应该这么做. 然而, 在绘制这样的图形时, 读者必须记住, 由于我们是把向量空间作为代数系统进行处理的, 所有我们给出的证明在性质上都是代数的.

练习1. 如果F是一个域, 验证Fn (在例子1中被定义) 是一个域F上的向量空间.
练习2. 如果V是一个域F上的向量空间, 验证(α1+α2)+(α3+α4)=[α2+(α3+α1)]+α4对于V中所有向量α1,α2,α3,α4成立.
练习3. 如果是复数域, 那么3中哪些向量是(1,0,1),(0,1,1),(1,1,1)的线性组合?
练习4.V是所有实数序对(x,y)的集合, 令F是实数域, 定义(x,y)+(x1,y1)=(x+x1,y+y1),c(x,y)=(cx,cy)V在这些运算下是一个实数域上的向量空间吗?
练习5.n上定义两个运算αβ=αβ,cα=cα右侧的运算即通常的运算, 那么(n,,)满足哪些向量空间的公理?
练习6.V是所有满足f(t)=f(t)的实数轴上的复值函数f的集合. 横杠代表复共轭. 证明V, 对于运算(f+g)(t)=f(t)+g(t),(cf)(t)=cf(t)是一个实数域上的向量空间. 给出V中一个不是实值函数的例子.
练习7.V是实数序对(x,y)的集合, 令F是实数域, 定义(x,y)+(x1,y1)=(x+x1,0),c(x,y)=(cx,0)V在这些运算下是一个向量空间吗?

第2.2节 子空间

本节我们引入一些研究向量空间的基本概念.

定义.V是域F上的向量空间. V的子空间是V的子集W, 其在V的加法和数乘之下是域F上的向量空间.

对于向量空间的公理的直接检视表明, V的子集W是一个子空间, 如果对于每个W中的αβ, 向量α+β也在W中; 零向量0W之中; 对于每个W中的α, 向量(α)W之中; 对于每个W中的α和每个标量c, 向量cαW之中. 向量加法的交换律和结合律, 以及标量乘法的性质4a, 4b, 4c, 4d并不需要验证, 因为这些是V上的运算所固有的性质. 判断的标准还可以进一步得到简化.

定理1. V的非空子集WV的一个子空间当且仅当对于W中的每对向量αβ以及F中的每个标量c, 向量cα+β仍然在W之中. [译注: 空集显然不是子空间, 因为向量空间至少包含零向量.]
证明.WV是一个非空子集, 其满足对于W中所有的向量αβ以及F中所有的标量ccα+β属于W. 既然W是非空的, W中存在一个向量ρ, 因此(1)ρ+ρ=0也在W中. 然后, 如果αW中的任意向量, c是任意的标量, 那么向量cα=cα+0W中. 特别地, (1)α=αW中. 最后, 如果αβW中, 那么α+β=1α+βW中. 因此, WV的一个子空间.
反过来, 如果WV的一个子空间, αβW中, c是一个标量, 当然有cα+βW中.

有些人倾向于使用定理中的cα+β性质作为子空间的定义. 这没有什么区别. 重要的是, 如果W是一个V的非空子集满足对于W中的αβ以及F中的ccα+βV之中, 那么W (在继承自V的运算下) 是一个向量空间. 这给我们提供了许多向量空间的新例子.

例子6.
  1. 如果V是任意的向量空间, 那么VV的一个子空间; 仅包含零向量的子集也是V的子空间, 被称为V的零子空间.
  2. Fn中, 满足x1=0n元组(x1,,xn)的集合是一个子空间; 然而, 满足x1=1+x2n元组的集合不是一个子空间 (n2).
  3. F上的多项式函数的空间是从FF的所有函数的空间的子空间.
  4. F上的一个n×n矩阵A是对称的, 如果对于每个ijAi,j=Aj,i. 对称矩阵形成了一个域F上的n×n矩阵的空间的子空间.
  5. 上的一个n×n矩阵A是Hermite的 (或者说自伴的), 如果Aj,k=Ak,j对于每个jk成立, 其中横杠代表复共轭. 一个2×2矩阵是Hermite的当且仅当其具有如下形式[zx+iyxiyw]其中x,y,z,w是实数. 所有Hermite矩阵的集合不是上的n×n矩阵空间的子空间, 因为如果A是Hermite的, 那么它的对角线元素A1,1,A2,2,都是实数, 但是iA的对角线元素不总是实数. 另一方面, 很容易验证n×n的复Hermite矩阵的集合是一个域上的向量空间 (在通常的运算下).
例子7. 齐次线性方程组的解空间.A是域F上的一个m×n矩阵, 那么满足AX=0的所有n×1矩阵X构成的集合是域F上的n×1矩阵空间的一个子空间. 为了证明这个事实, 我们必须证明当AX=0, AY=0以及cF中任意标量时有A(cX+Y)=0, 而这可由以下的一般性事实立即得到.
引理. 如果A是域F上的一个m×n矩阵而BC是域F上的n×p矩阵, 那么A(dB+C)=d(AB)+AC对于每个F中的标量d成立.
证明. [A(dB+C)]i,j=kAi,k(dB+C)k,j=k(dAi,kBk,j+Ai,kCk,j)=dkAi,kBk,j+kAi,kCk,j=d(AB)i,j+ACi,j=[d(AB)+AC]i,j

类似地, 还可以证明(dB+C)A=d(BA)+CA, 若矩阵的和与积确有定义.

定理2.V是域F上的一个向量空间, 那么V的任何子空间族的交是V的子空间.
证明.{Wα}V的一个子空间族, 令W=αWα是其交. 回忆一下, W被定义成属于每个Wα的所有元素的集合 (见附录). 既然每个Wα都是子空间, 那么每个都包含零向量, 于是其交W也包含零向量, W非空. 令αβW中的向量, 令c是一个标量. 根据W的定义, αβ都属于每个Wα, 并且因为每个Wα都是一个子空间, 向量(cα+β)在每个Wα之中, 于是(cα+β)也在W里. 根据定理1, WV的一个子空间.

根据定理2, 若SV的任意子集, 那么存在一个包含S的最小的V的子空间, 最小的意思即这个包含S的子空间是其他每个包含S的子空间的子集.

定义.S是一个向量的集合, 其来自于一个向量空间V. 由S张成的子空间被定义为所有包含SV的子空间的交W. 当S是有限的向量集时, 如S={α1,α2,,αn}, 我们也将W简单地称为由向量α1,α2,,αn张成的子空间.
定理3. 由向量空间V的一个非空子集S张成的子空间是S中向量所有的线性组合构成的集合.
证明.WS张成的子空间, 那么S中的向量α1,α2,,αm的每个线性组合α=x1α1+x2α2++xmαm显然在W之中. 因此, W包含集合L, LS中向量的所有线性组合的集合. 另一方面, 集合L包含S, 是非空的. 如果αβ属于L, 那么α是一个线性组合,α=x1α1+x2α2++xmαm其中αiS中, 并且β是一个线性组合,β=y1β1+y2β2++ynβn其中βjS中. 对于每个标量c,cα+β=i=1m(cxi)αi+j=1nyjβj因此, cα+β属于L, 于是LV的一个子空间.
现在我们已经证明L是包含S的一个V的子空间, 并且任何包含S的子空间也包含L, 于是L是所有包含S的子空间之交, 即L是由集合S张成的子空间.
定义. 如果S1,S2,,Sk是向量空间V的子集, 那么所有形式为α1+α2++αk的和 (其中αiSi之中) 构成的集合被称为子集S1,S2,,Sk的和, 用记号S1+S2++Sk表达, 或者i=1kSi如果W1,W2,,WkV的子空间, 那么和W=W1+W2++Wk显然是V的一个子空间, 其包含每个子空间Wi. 从中可以得到, 正如定理3的证明, W是由W1,W2,,Wk之并张成的子空间.
例子8.F是复数域的一个子域, 设α1=(1,2,0,3,0),α2=(0,0,1,4,0),α3=(0,0,0,0,1)根据定理3, 一个向量α在由α1,α2,α3张成的F5的子空间W之中当且仅当存在F中的标量c1,c2,c3满足α=c1α1+c2α2+c3α3因此W由所有形式为α=(c1,2c1,c2,3c1+4c2,c3)的向量构成, 其中c1,c2,c3F中任意的标量. 换句话说, W可以被描述为由满足x2=2x1,x4=3x1+4x35元组α=(x1,x2,x3,x4,x5)构成的集合, 其中xiF中. 因此, (3,6,1,5,2)W中, 而(2,4,6,7,8)不在.
例子9.F是复数域的一个子域, 令V是域F上所有2×2矩阵的向量空间. 令W1是包含所有形式为[xyz0]的矩阵的V的子集, 其中x,y,zF中任意的标量. 最后, 令W2是包含所有形式为[x00y]的矩阵的V的子集, 其中xyF中任意的标量. 那么, W1W2V的子空间, 并且V=W1+W2因为[abcd]=[abc0]+[000d]子空间W1W2包含所有形式为[x000]的矩阵.
例子10.A是域F上的一个m×n矩阵. A的行向量是Fn中的向量, 其由αi=(Ai,1,,Ai,n),i=1,,m给定. 由A的行向量张成的Fn的子空间被称为A的行空间. 例子8中所考虑的子空间是矩阵A=[120300014000001]的行空间. 它也是矩阵B=[12030001400000148180]的行空间.
例子11.V是所有域F上的多项式函数的空间, 令SV的一个子集, 包含多项式函数f0,f1,f2,, 其由fn(x)=xn,n=0,1,2,定义, 那么V是由S张成的子空间.
练习1. 以下哪些n中的向量α=(a1,,an)的集合是n的子空间 (n3)?
  1. 所有满足a10α;
  2. 所有满足a1+3a2=a3α;
  3. 所有满足a2=a12α;
  4. 所有满足a1a2=0α;
  5. 所有a2为有理数的α.
练习2.V是所有从的函数f构成的(实)向量空间, 以下哪些函数的集合是V的子空间?
  1. 所有满足f(x2)=[f(x)]2f;
  2. 所有满足f(0)=f(1)f;
  3. 所有满足f(3)=1+f(5)f;
  4. 所有满足f(1)=0f;
  5. 所有连续的f.
练习3. 向量(3,1,0,1)在由向量(2,1,3,2),(1,1,1,3),(1,1,9,5)张成的4的子空间之中吗?
练习4.W是满足{2x1x2+43x3x4=0x1+23x3x5=09x13x2+6x33x43x5=0的所有5中的(x1,x2,x3,x4,x5)的集合. 找出一个张成W的向量的有限集合.
练习5.F是一个域, n是一个大于等于2的正整数. 令V是域F上所有n×n矩阵的向量空间. 以下哪些V中矩阵A的集合是V的子空间?
  1. 所有可逆的A;
  2. 所有不可逆的A;
  3. 所有满足AB=BAA, 其中BV中一个固定的矩阵;
  4. 所有满足A2=AA.
练习6.
  1. 证明1的子空间仅有1和零子空间.
  2. 证明2的子空间是2, 或是零子空间, 或是由某个2中固定的(非零)向量的标量倍数构成. (最后一种类型的子空间, 从直觉上说, 是一条通过原点的直线.)
  3. 你能描述3的子空间吗?
练习7.W1W2是向量空间V的子空间, 满足W1W2之并也是子空间. 证明其中一个空间Wi是另一个的子集.
练习8.V是所有从的函数f的向量空间, 令Ve是偶函数的子集, 即满足f(x)=f(x)的函数, 令Vo是奇函数的子集, 即满足f(x)=f(x)的函数.
  1. 证明VeVoV的子空间.
  2. 证明Ve+Vo=V.
  3. 证明VeVo={0}.
练习9.W1W2是向量空间V的子空间, 满足W1+W2=VW1W2={0}. 证明对于每个V中的向量α存在唯一的W1中的向量α1W2中的向量α2满足α=α1+α2.

第2.3节 基和维数

现在我们转向为特定的向量空间赋一个维数的任务. 尽管我们通常将"维数"与某种几何的东西联系起来, 我们必须为向量空间的维数寻找一个合适的代数定义. 这将通过向量空间的基的概念来完成.

定义.V是域F上的一个向量空间. V的一个子集S被称为线性相关的, 如果存在S中不同的向量α1,α2,,αnF中的不全为0的标量c1,c2,,cn满足c1α1+c2α2++cnαn=0不是线性相关的集合被称为线性无关的. 如果集合S仅包含有限多个向量α1,α2,,αn, 有时我们称α1,α2,,αn是线性相关的 (或线性无关的) 而不是说S是线性相关的 (或线性无关的).

以下陈述是定义的简单推论.

  1. 任何包含线性相关集合的集合是线性相关的.
  2. 线性无关集合的任意子集是线性无关的.
  3. 任何包含零向量的集合是线性相关的, 因为10=0.
  4. 一个集合S是线性无关的当且仅当S的每个有限子集是线性无关的, 即当且仅当对于S的不同向量α1,,αnc1α1++cnαn=0可以推出每个ci=0.

定义.V是一个向量空间. V的一个基是一个能够张成V的线性无关的向量集合. V被称为有限维的, 如果它拥有一个有限的基.
例子12.F是一个的子域. 在F3中, 向量α1=(3,0,3),α2=(1,1,2),α3=(4,2,2),α4=(2,1,1)是线性相关的, 因为2α1+2α2α3+0α4=0向量ε1=(1,0,0),ε2=(0,1,0),ε3=(0,0,1)是线性无关的.
例子13.F是一个域, 令S是由ε1,ε2,,εn构成的Fn的子集, 其中ε1=(1,0,0,,0),ε2=(0,1,0,,0),,εn=(0,0,0,,1)x1,x2,,xnF中标量, 置α=x1ε1+x2ε2++xnεn, 那么α=(x1,x2,,xn)这表明ε1,,εn可以张成Fn. 因为α=0当且仅当x1=x2==xn=0, 所以向量ε1,,εn是线性无关的. 因此, S={ε1,,εn}Fn的一个基, 我们将其称为Fn的标准基.
例子14.P是域F上的一个n×n的可逆矩阵, 那么P的列P1,,Pn构成了列矩阵空间Fn×1的一个基, 理由如下. 如果X是一个列矩阵, 那么PX=x1P1++xnPn既然PX=0仅有平凡解X=0, 那么{P1,,Pn}是一个线性无关的集合. 为什么它能够张成Fn×1呢? 令Y是任意的列矩阵, 如果X=P1Y, 那么Y=PX, 即Y=x1P1++xnPn于是{P1,,Pn}Fn×1的一个基.
例子15.A是一个m×n矩阵, S是齐次线性方程组AX=0 (例子7) 的解空间. 令R是行等价于A的一个行简化阶梯形式, 那么S也是方程组RX=0的解空间. 如果R具有r个非零行, 那么RX=0就简单地将未知元x1,,xn中的r个表达为了基于剩余nr个未知元xj的线性组合. 设非零行的首非零元出现在第k1,,kr列, 令J是除去k1,,kr剩下的nr个索引的集合:J={1,,n}{k1,,kr}那么方程组RX=0具有如下形式{xk1+Jc1,jxj=0xkr+Jcr,jxj=0其中ci,j是特定的标量. 所有的解都可由以下方式获得, 对于每个J中的j, 给xj赋(任意的)值, 然后计算相应的xk1,,xkr的值. 若对于每个J中的j, Ej是令xj=1, 其余xi=0 (iJ中异于j的索引) 得到的解, 那么我们断言这(nr)个向量Ej构成了解空间的一个基.
因为列矩阵Ej的第j行为1, 而由J中其余元素索引的行是0, 根据例子13的推理, 这表明这些向量构成的集合是线性无关的. 以下是这些向量能够张成解空间的理由. 如果列矩阵T (其元素依次为t1,,tn) 在解空间之中, 那么矩阵N=JtjEj同样也在解空间之中, 并且满足对于每个J中的jxj=tj. 具有这样性质的解是唯一的, 因此N=T, 而T就在诸向量Ej张成的空间之中.
例子16. 现在我们将给出一个无穷基的例子. 令F是复数域的一个子域, VF上的多项式函数的空间. 回忆一下, 这些从FF的函数具有如下形式f(x)=c0+c1x++cnxnfk(x)=xk,k=0,1,2,, 那么(无限的)集合{f0,f1,f2,}V的一个基. 显然, 它能张成V, 因为(上面的)函数f可以表示为f=c0f0+c1f1++cnfn读者应该看出来这事实上不过就是重复一遍多项式函数的定义, 即一个从FF的函数f是多项式函数当且仅当存在一个整数n和标量c0,,cn满足c0f0++cnfn. 那么为什么这些函数线性无关呢? 为了证明集合{f0,f1,f2,}是线性无关的, 只需要证明其每个有限子集是线性无关的即可, 实际上证明对于每个n, 集合{f0,,fn}是线性无关的就够了. 设c0f0++cnfn=0这等价于说c0+c1x++cnxn=0对于每个F中的x成立. 换句话说, 每个F中的x都是多项式函数f(x)=c0+c1x++cnxn的根. 我们假定读者已经知道一个n阶的复系数多项式不可能拥有多于n个的不同的根, 于是就有c0=c1==cn=0.
我们已经给出了V的一个无限的基, 那么这是否意味着V不是有限维的? 实际上的确如此, 但这不能通过定义直接得到, 因为就目前我们所知, 或许V还拥有一个有限的基. 不过, 这种可能性很容易被排除. (我们将于下一个定理中在一般情况下排除它.) 假设我们拥有一个有限数目的多项式函数g1,,gr, 那么g1(x),,gr(x)中将出现一个最高的x的幂次. 如果该幂次是k, 那么显然fk+1(x)=xk+1不在g1,,gr的线性扩张之中, 因此V不可能是有限维的. [译注: 当然, 存在一种极端情况, 即每个多项式函数都是零函数, 那就不存在最高的幂次, 不过这种情况可以被特殊对待, 论证仍然完全合理.]

关于这个例子的最后一条评注就位了. 无限的基同"无限的线性组合"毫无关系. 若是读者不能抵制将幂级数k=0ckxk注入这个例子之中, 那么他就应该再一次好好琢磨一下这个例子. 如果还是没有疗效的话, 从现在开始他就应该考虑将注意力限制在有限维空间上.

定理4.V是一个由有限多个向量β1,β2,,βm张成的向量空间, 那么V中任意线性无关的集合都是有限的, 并且拥有的元素不超过m个.
证明. 为了证明这个定理, 只需要证明V的每个拥有超过m个元素的子集S是线性相关的就够了. 令S就是这样一个集合. 在S中, 存在n个互异的向量α1,α2,,αn, 其中n>m. 因为β1,,βm能够张成V, 所以存在F中的标量Ai,j满足αj=i=1mAi,jβi对于n个标量x1,x2,,xn, 我们有x1α1++xnαn=j=1nxjαj=j=1nxj(i=1mAi,jβi)=j=1ni=1m(Ai,jxj)βi=i=1m(j=1nAi,jxj)βi既然n>m, 那么根据第1章的定理6, 存在不全为零的x1,x2,,xn满足j=1nAi,jxj=0,1im因此x1α1+x2α2++xnαn=0, 这表明S是线性相关的集合.
推论1. 如果V是一个有限维向量空间, 那么任意两个V的基都具有相同(有限)数目的元素.
证明. 既然V是有限维的, 它拥有一个有限的基{β1,β2,,βm}[译注: 这个记号隐含了β1,β2,,βm互异之意, 但请读者注意, 这并非集合论公理的要求, 只是一个常见的默认约定罢了.] 根据定理4, 每个V的基都应该是有限的, 并且拥有的元素不超过m个. 因此, 如果{α1,α2,,αn}是一个基, 那么nm. 根据相同的论证, 有mn, 于是m=n.

这个推论允许我们将有限维向量空间的维数定义为V的一个基的元素个数. 我们将用dimV表示有限维向量空间V的维数. 这允许我们重新表述定理4如下.

推论2.V是一个有限维向量空间, 令n=dimV, 那么
  1. 任何包含多于n个向量的V的子集是线性相关的;
  2. 没有包含少于n个向量的V的子集可以张成V.
例子17. 如果F是一个域, 那么Fn的维数是n, 因为Fn的标准基包含n个向量. 矩阵空间Fm×n的维数是mn. 若与Fn的情况进行类比, 这应该是很显然的, 因为mn个矩阵, 其中每个矩阵的第ij列是1, 其余位置是0, 构成了Fm×n的一个基. 如果A是一个m×n的矩阵, 那么A的维数是nr, 其中r是与A行等价的行简化阶梯矩阵的非零行数, 见例子15.
如果VF上任意的向量空间, 那么其零子空间可由向量0张成, 但是{0}是线性相关的集合, 因此不是一个基. 出于这样的原因, 我们将约定零子空间的维数是0. 另一种做法是, 我们论证空集是零子空间的基, 那么也能够达成相同的结论. 空集可以张成{0}, 因为所有包含空集的子空间之交是{0}. 并且, 空集也是线性无关的, 因为它不包含任何向量.
引理.S是向量空间V的一个线性无关的子集, 设βV中向量但不在S张成的子空间之中, 那么将β加入S得到的集合仍然是线性无关的.
证明.α1,,αmS中互异的向量, 并且c1α1++cmαm+bβ=0那么b=0, 否则的话β=(c1b)α1++(cmb)αm那么β就在S张成的子空间之中. 因此, c1α1++cmαm=0. 既然S是线性无关的, 那么每个ci=0.
定理5. 如果W是一个有限维向量空间V的子空间, 那么W每个线性无关的子集都是有限的, 并且是W的某个(有限的)基的一部分.
证明.S0W的一个线性无关的子集. 如果S是包含S0W的一个线性无关的子集, 那么S也是V的一个线性无关的子集. 因为V是有限维的, 所以S包含的元素个数不超过dimV个.
我们按照以下方式将S0扩展为W的一个基. 如果S0可以张成W, 那么S0就是W的一个基, 我们的任务就完成了. 如果S0不能张成W, 那么根据前述引理, 我们可以在W中找到一个β1满足S1=S0{β1}是线性无关的. [译注: 显然β1不是S0的元素.] 如果S1能够张成W, 那就结束了. 否则的话, 再次应用引理以得到一个W中的β2满足S2=S1{β2}是线性无关的. 继续实行此法, 那么 (在不超过dimV步的情况下) 我们能够抵达一个集合Sm=S0{β1,,βm}其为W的一个基.
推论1. 如果W是有限维向量空间V的一个真子空间, 那么W也是有限维的, 并且dimW<dimV.
证明. 我们不妨设W包含一个向量α0. 根据定理5及其证明, 存在一个W的基, 其包含α且拥有不超过dimV个元素. 因此, W是有限维的, 并且dimWdimV. 既然W是一个真子空间, 那么存在V中的向量β, 但其不在W中. 将β加入W的任何一个基之中, 我们都能得到V的一个线性无关的子集, 于是dimW<dimV. [译注: 实际上证明不必如此曲折, 从空集开始就好, 即能扩展成为W的一个基, 并且这也覆盖了W是零子空间的平凡情况.]
推论2. 在有限维向量空间V中每个非空的线性无关集合都是某个基的一部分. [译注: 平凡的空集情况当然也是某个基的一部分.]
推论3.A是域F上的一个n×n矩阵, 设其行向量构成了Fn的一个线性无关的集合, 那么A是可逆的. [译注: 一般情况下, "构成集合"也就默认了互异, 尽管这不存在什么确切的道理可言.]
证明.α1,α2,,αnA的行向量, 设W是由α1,α2,,αn张成的Fn的子空间. 既然α1,α2,,αn是线性无关的, 那么W的维数就是n. 推论1现在告诉我们W=Fn, 因此存在F中标量Bi,j满足εi=j=1nBi,jαj,1in其中{ε1,ε2,,εn}Fn的标准基, 因此对于以Bi,j为元素的矩阵B, 我们有BA=I
定理6. 如果W1W2是向量空间V的有限维子空间, 那么W1+W2也是有限维的, 并且有dimW1+dimW2=dim(W1W2)+dim(W1+W2)
证明. 根据定理5及其推论, W1W2具有一个有限的基{α1,,αk}, 其为W1的基{α1,,αk,β1,,βm}的一部分, 也是W2的基{α1,,αk,γ1,,γn}的一部分. 子空间W1+W2可由向量α1,,αk,β1,,βm,γ1,,γn张成, 并且这些向量也构成了一个线性无关的集合, 因为若设xiαi+yjβj+zrγr=0那么zrγr=xiαi+yjβj这表明zrγr属于W1. 因为zrγr也属于W2, 所以zrγr=ciαi对于特定的c1,,ck成立. 鉴于{α1,,αk,γ1,,γn}是线性无关的, 每个标量zr=0, 因此xiαi+yjβj=0既然{α1,,αk,β1,,βm}也是线性无关的, 那么有每个xi=0且每个yj=0. 最终我们得到{α1,,αk,β1,,βm,γ1,,γn}W1+W2的一个基, 于是dimW1+dimW2=(k+m)+(k+n)=k+(m+k+n)=dim(W1W2)+dim(W1+W2)

让我们以一条关于线性无关和线性相关的注记作结. 我们对于向量的集合定义了这些概念. 对于向量的有限序列 (有序的n元组) α1,,αn定义它们也是很有用的. 我们称向量α1,,αn是线性相关的, 如果存在不全为零的标量c1,,cn满足c1α1++cnαn=0. 这是如此自然的, 以至于读者可能会发现他已经在这样使用术语了. 那么, 有限序列α1,,αn和集合{α1,,αn}之间有什么区别呢? 存在两种区别, 等同性和顺序.
如果我们讨论集合{α1,,αn}, 通常已经假定向量α1,,αn之中没有两个向量是相同的. 对于序列α1,,αn而言, 可能每个αi都是相同的向量. 若对于某ijαi=αj, 那么序列α1,,αn是线性相关的:αi+(1)αj=0因此, 如果α1,,αn是线性无关的, 那么它们就是互异的, 并且我们可以讨论集合{α1,,αn}, 知道其中有n个向量. 显然, 在讨论基和维数的时候, 这不会引起什么歧义. 有限维向量空间V的维数就是满足存在V中线性无关的n元向量组的最大的n, 诸如此类. 若是读者感到本段杂乱无章而毫无内容可言, 那么他该问问自己向量α1=(eπ/2,1),α2=(1103,1)2中是否线性无关.
一个序列的元素以特定的顺序被枚举出来. 一个集合是对象的合集, 而没有预先给定的排列或顺序. 当然, 为了描述一个集合, 我们或许会列出其成员, 而这就需要挑选一个顺序. 但是, 顺序不是集合的一部分. 集合{1,2,3,4}{4,3,2,1}是等同的, 而序列1,2,3,44,3,2,1相当不同. 序列的顺序方面并不影响线性相关或者无关, 因为线性相关性 (根据定义) 并不受顺序影响. 序列αn,,α1线性相关当且仅当序列α1,,αn线性相关. 在下一节中, 顺序将变得重要起来.

练习1. 证明如果两个向量线性相关, 那么其中一个是另一个的标量倍数.
练习2. 向量α1=(1,1,2,4),α2=(2,1,5,2),α3=(1,1,4,0),α4=(2,1,1,6)4中线性无关吗?
练习3. 找到由练习2的四个向量张成的4的子空间的一个基.
练习4. 证明向量α1=(1,0,1),α2=(1,2,1),α3=(0,3,2)构成了3的一个基. 将每个标准基向量表达为α1,α2,α3的线性组合.
练习5. 找出3中的三个向量, 它们线性相关, 但是两两线性无关.
练习6.V是域F上的2×2矩阵的向量空间. 通过给出V的一个具有四个元素的基, 证明V的维数是4.
练习7.V是练习6的向量空间, 令W1是由形式为[xxyz]的矩阵构成的集合, 令W2是由形式为[abac]的矩阵构成的集合.
  1. 证明W1W2V的子空间.
  2. 找出W1,W2,W1+W2,W1W2的维数.
练习8. 又一次令V是域F上的2×2矩阵的向量空间. 找出V的一个基{A1,A2,A3,A4}满足对于每个jAj2=Aj.
练习9.V是复数域的一个子域F上的一个向量空间. 设α,β,γV中线性无关的向量. 证明(α+β),(β+γ),(γ+α)是线性无关的.
练习10.V是域F上的一个向量空间. 设有限数目的向量α1,,αr能够张成V. 证明V是有限维的.
练习11.V是复数域上所有满足A1,1+A2,2=02×2矩阵A构成的集合.
  1. 证明在通常的运算下, V是实数域上的向量空间.
  2. 找出该向量空间的一个基.
  3. WV中满足A2,1=A1,2的矩阵A的集合, 其中横杠代表复数共轭. 证明WV的子空间并找出W的一个基.
练习12. 通过找出向量空间的一个基, 证明域F上的m×n矩阵构成的向量空间的维数是mn.
练习13. 讨论练习9, 其中V是二元域上的向量空间. 二元域见第1.2节的练习5.
练习14.V是实数集合. 若将V视为有理数域上的向量空间 (带有通常的运算), 证明该向量空间不是有限维的.

第2.4节 坐标

n维空间V的基𝔅的诸多有用性质之一在于, 它允许人们在V中引入与空间Fn中的向量α=(x1,,xn)的"自然坐标"xi类似的东西. 沿此进路, V中的向量α相对于基𝔅的坐标将会是用于将α表达为基中向量的线性组合的标量. 因此, 我们想要将Fn中的向量α的自然坐标视为由αFn的标准基定义的. 然而, 若是采取此法, 我们必须足够小心. 如果α=(x1,,xn)=i=1nxiεi𝔅Fn的标准基, 那么α的坐标是如何由𝔅α决定的呢? 一种组织回答的方式如下. 给定的α作为标准基向量的线性组合的表达是唯一的, 并且α的第i个坐标xi就是该表达下εi的系数. 以此观点来看, 我们之所以能够言称何谓第i个坐标, 是因为我们已经为标准基中的向量安排了"自然"的顺序. 也就是说, 我们拥有一个规则来确定哪一个是基中"第一"的向量, 哪一个是基中"第二"的向量, 诸如此类. 如果𝔅n维空间V的任意一个基, 那么可能𝔅中的向量并没有什么自然的顺序. 因此, 在我们能够定义"α相对于𝔅的第i个坐标"之前, 就有必要为这些向量施加一个顺序. 换言之, 坐标将相对于向量的序列而不是向量的集合进行定义.

定义. 如果V是一个有限维向量空间, 那么V的一个有序基是一个向量的有限序列, 其线性无关并可张成V.

如果序列α1,,αnV的一个有序基, 那么集合{α1,,αn}V的一个基. 有序基不过就是基的集合, 带上一个指定的顺序. 我们将稍微滥用一下符号, 言称𝔅={α1,,αn}V的一个有序基. 这不仅确定了什么是基的向量, 也刻画了顺序.

现在我们设V是域F上的一个有限维向量空间, 并且𝔅={α1,,αn}V的一个有序基. 给定V中的α, 存在唯一的一个标量的n元组满足α=i=1nxiαi之所以这个n元组是唯一的, 是因为若我们同样有α=i=1nziαi那么i=1n(xizi)αi=0并且αi的线性无关性告诉我们对于每个ixizi=0. 我们称xiα相对于有序基𝔅={α1,,αn}的第i个坐标. 如果β=i=1nyiαi那么α+β=i=1n(xi+yi)αi于是(α+β)在此有序基之下的第i个坐标是(xi+yi). 类似地, (cα)的第i个坐标是cxi. 读者也应该注意到每个F中的n元组(x1,,xn)也是V中某个向量的坐标的n元组, 即i=1nxiαi

总结一下, 每个V的有序基都确定了一个V的所有向量的集合与Fn的所有n元组的集合之间的一一对应α(x1,,xn)这个对应拥有以下性质. (α+β)的像是Fnαβ的像之和, 以及(cα)的像是Fn中的标量cα的像之积.

有的读者或许想问为什么在此时此刻我们为什么不简单地选取一个V的有序基然后将V的每个向量描述为与之对应的坐标n元组, 因为若是这样的话, 我们就可以获得只与n元组打交道之便. 这违背了我们的目的, 出于两个原因. 首先, 正如我们对于向量空间的公理化定义所暗示的那样, 我们试图研究如何将向量空间作为抽象的代数系统进行推理. 其次, 即便是在那些我们使用坐标的场合, 有的重要结果来源于我们能够改变坐标系统的能力, 即改变有序基的能力.

往往对于我们而言使用α相对于𝔅的坐标矩阵X=[x1xn]而不是坐标n元组(x1,,xn)更加方便. 为了指明坐标矩阵依赖于哪个基, 我们将使用符号[α]𝔅来表示向量α相对于有序基𝔅的坐标矩阵. 从一个有序基变到另一个有序基时, 这个记号对于描述向量α的坐标发生了什么变化是特别有用的.

接着, 我们设Vn维的, 并且𝔅={α1,,αn}𝔅={α1,,αn}V的两个有序基. 存在唯一的标量Pi,j满足αj=i=1nPi,jαi,1jnx1,,xn是给定的向量α相对于有序基𝔅的坐标, 那么α=x1α1++xnαn=j=1nxjαj=j=1nxji=1nPi,jαi=j=1ni=1n(Pi,jxj)αi=i=1n(j=1nPi,jxj)αi因此我们就得到关系α=i=1n(j=1nPi,jxj)αi既然α在有序基𝔅下的坐标x1,,xn是被唯一确定的, 那么xi=j=1nPi,jxj,1inP是一个n×n矩阵, 其第ij列的元素是标量Pi,j并令XX分别是α在基𝔅𝔅下的坐标矩阵, 那么我们可以重新表达上述结果为X=PX既然𝔅𝔅都是线性无关的, 那么X=0当且仅当X=0. 根据第1章的定理7, P是可逆的, 于是X=P1X若我们使用之前引入的向量相对于某个有序基的坐标矩阵的记号, 那么[α]𝔅=P[α]𝔅,[α]𝔅=P1[α]𝔅因而之前的讨论可以被总结如下.

定理7.V是域F上的n维向量空间, 令𝔅𝔅V的两个有序基, 那么存在一个唯一的且必然可逆的域F上的n×n矩阵P满足[α]𝔅=P[α]𝔅,[α]𝔅=P1[α]𝔅对于每个V中的向量α成立. P的列由Pj=[αj]𝔅,j=1,,n给出.

为了使上面的分析完整, 我们还需要证明以下结果.

定理8.P是域F上的一个n×n可逆矩阵. 令V是域F上的一个n维向量空间, 令𝔅V的一个有序基. 那么, 存在唯一的一个V的有序基𝔅满足[α]𝔅=P[α]𝔅,[α]𝔅=P1[α]𝔅对于每个V中的向量α成立.
证明.𝔅由向量α1,,αn构成. 如果𝔅={α1,,αn}是满足第一条的V的有序基, 那么显然有αj=i=1nPi,jαi因此我们只需要证明由这些等式定义的向量αj的确构成了一个基. 令Q=P1, 那么jQj,kαj=jQj,kiPi,jαi=jiPi,jQj,kαi=i(jPi,jQj,k)αi=αk故由集合𝔅={α1,,αn}张成的子空间包含𝔅, 因而等于V. 于是, 𝔅是一个基. 根据其定义和定理7, 显然第一条是成立的, 第二条也是.
例子18.F是一个域, 令α=(x1,x2,,xn)是一个Fn中的向量. 如果𝔅Fn的标准有序基, 即𝔅={ε1,,εn}那么向量α在基𝔅下的坐标矩阵为[α]𝔅=[x1x2xn]
例子19.是实数域, 令θ是一个固定的实数. 矩阵P=[cosθsinθsinθcosθ]是可逆的, 其逆为P1=[cosθsinθsinθcosθ]因此, 对于每个θ, 由向量(cosθ,sinθ)(sinθ,cosθ)构成的集合𝔅2的一个基. 从直觉上说, 这个基可被描述为由标准基旋转角度θ得到的. 如果α是向量(x1,x2), 那么[α]𝔅=[cosθsinθsinθcosθ][x1x2]或者x1=x1cosθ+x2sinθ,x2=x1sinθ+x2cosθ.
例子20.F是复数域的一个子域. 矩阵P=[145023008]是可逆的, 其逆为P1=[121180123160018]因此向量α1=(1,0,0),α2=(4,2,0),α3=(5,3,8)构成了F3的一个基𝔅. 向量α=(x1,x2,x3)在基𝔅下的坐标x1,x2,x3[x1x2x3]=[x1+2x2+118x312x2+316x318x3]=[121180123160018][x1x2x3]特别地,(3,2,8)=10α112α2α3
练习1. 证明向量α1=(1,1,0,0),α2=(0,0,1,1),α3=(1,0,0,4),α4=(0,0,0,2)构成了4的一个基. 找出每个标准基向量在有序基{α1,α2,α3,α4}下的坐标.
练习2. 找出向量(1,0,1)3的有序基(2i,1,0),(2,1,1),(0,1+i,1i)下的坐标矩阵.
练习3.𝔅={α1,α2,α3}是由α1=(1,0,1),α2=(1,1,1),α3=(1,0,0)构成的3的有序基. 那么, 向量(a,b,c)在有序基𝔅下的坐标是什么呢?
练习4.W是由α1=(1,0,i)α2=(1+i,1,1)张成的3的子空间.
  1. 证明α1α2构成了W的一个基.
  2. 证明β1=(1,1,0)β2=(1,i,1+i)也在W中并且构成了W的另一个基.
  3. α1α2W的有序基{β1,β2}下的坐标是什么?
练习5.α=(x1,x2)β=(y1,y2)2中满足x1y1+x2y2=0,x12+x22=y12+y22=1的向量. 证明𝔅={α,β}2的一个基. 找出向量(a,b)在有序基𝔅={α,β}下的坐标. (αβ上的条件, 从几何上说, 指的是αβ垂直, 并且每个长度均为1.)
练习6.V是一个复数域上的向量空间, 其由所有从的函数构成, 即实轴上所有复值函数的空间. 令f1(x)=1,f2(x)=eix,f3(x)=eix.
  1. 证明f1,f2,f3是线性无关的.
  2. g1(x)=1,g2(x)=cosx,g3(x)=sinx, 找出一个3×3的矩阵P满足gj=i=13Pi,jfi.
练习7.V是所有次数小于等于2的从的多项式函数构成的(实)向量空间, 即由所有形式为f(x)=c0+c1x+c2x2的函数f构成的空间. 令t是一个固定的实数, 定义g1(x)=1,g2(x)=x+t,g3(x)=(x+t)2证明𝔅={g1,g2,g3}V的一个基. 如果f(x)=c0+c1x+c2x2那么f在此有序基𝔅下的坐标是什么呢?

第2.5节 行等价的总结

本节我们将利用一些有限维向量空间基和维数的基本事实来完成我们对于矩阵的行等价性的讨论. 回忆一下, 如果A是域F上的一个m×n矩阵, 那么A的行向量是Fn中的向量α1,,αm, 由αi=(Ai,1,,Ai,n)定义. A的行空间是由这些向量张成的Fn的子空间. A的行秩是A的行空间的维数.

如果P是域F上的一个k×m矩阵, 那么积B=PA是一个k×n矩阵, 其行向量β1,,βk分别为线性组合βi=Pi,1α1++Pi,mαm因此, B的行空间是A的行空间的一个子空间. 如果P是一个m×m的可逆矩阵, 那么B行等价于A, 于是根据行等价的对称性, 或者等式A=P1B, 可知A的行空间也是B的行空间的一个子空间.

定理9. 行等价的矩阵拥有相同的子空间.

因而我们发现为了研究A的行空间, 研究与A行等价的行简化阶梯矩阵的行空间也是一样的. 接下来我们就要这么做.

定理10.R是一个非零的行简化阶梯矩阵, 那么R的非零行向量构成了R的行空间的一个基.
证明.ρ1,,ρrR的非零行向量, 那么显然这些向量可以张成R的行空间, 因此我们只需证明它们线性无关即可. 既然R是一个行简化阶梯矩阵, 那么存在正整数k1,,kr满足对于ir,
  1. R(i,j)=0j<ki;
  2. R(i,kj)=δi,j;
  3. k1<<kr.
β=(b1,,bn)R的行空间的一个向量:β=c1ρ1++crρr那么我们发现cj=bkj, 因为bkj=i=1rciR(i,kj)=i=1rciδi,j=cj特别地, 如果β=0, 即如果c1ρ1++crρr=0, 那么cj必须是零向量的第kj个分量, 于是cj=0,j=1,,r. 因此, ρ1,,ρr是线性无关的.
定理11.mn是正整数, 令F是一个域. 设WFn的一个子空间, 并且dimWm. 那么, 存在唯一的一个域F上的m×n的行简化阶梯矩阵以W作为其行空间.
证明. 至少存在一个以W为行空间的m×n的行简化阶梯矩阵, 因为既然dimWm, 我们可以挑选出W中的某m个向量α1,,αm张成W. 令A是以α1,,αm为行向量的m×n矩阵, 令R是与A行等价的行简化阶梯矩阵, 那么R的行空间就是W.
现在令R是任意的以W为行空间的行简化阶梯矩阵, 令ρ1,,ρrR的非零行向量, 设ρi的首非零元在第ki列, i=1,,r. 向量ρ1,,ρr构成了W的一个基. 在定理10的证明中, 我们观察到如果β=(b1,,bn)W之中, 那么有β=c1ρ1++crρr,并且ci=bki. 换句话说, β作为ρ1,,ρr的线性组合的唯一表示即β=i=1rbkiρi因此若读者知道了坐标分量bki,i=1,,r, 那么向量β就是确定的了. 例如, ρs可以被描述为W中唯一的第ks个坐标为1, 第ki个坐标为0的向量, 其中is.
βW之中而β0. 我们证明β的首非零元出现在某第ks列. 既然β=i=1rbkiρiβ0, 我们可以记β=i=srbkiρi,bks0[译注: 根据上下文可知, 这个s是满足bks0的最小的整数.] 根据行简化阶梯矩阵的条件, 我们知道若有i>sjks, 那么Ri,j=0, 于是β=(0,,0,bks,,bn),bks0β的首非零元即出现在第ks列. 读者也应该注意到, 对于每个ks,s=1,,r, 存在一个W中的向量, 其第ks个分量不为零, 即ρs.
现在看来RW唯一决定是很清晰的了. 基于W对于R的刻画如下. 我们考虑所有W中的向量β. 如果β0, 那么β的首非零元必然出现在某第t列之中:β=(0,,0,bt,,bn),bt0k1,,kr是那些正整数t, 满足存在W中的某个β0其首非零元出现在第t列. 将k1,,kr按照k1<k2<<kr的顺序排列. 对于每个正整数ks存在唯一的W中的向量ρs满足ρs的第ks个分量为1, 第ki个分量为0, 其中is. 那么, R就是以ρ1,,ρr,0,,0为行向量的行简化阶梯矩阵.
推论. 每个m×n矩阵A都行等价于唯一的一个行简化阶梯矩阵.
证明. 我们知道A至少行等价于一个行简化阶梯矩阵R. 如果A还行等价于另一个这样的矩阵R, 那么R行等价于R. 因此, RR拥有相同的行空间, 必然是等同的.
推论.AB是域F上的m×n矩阵, 那么AB行等价当且仅当它们拥有相同的行空间.
证明. 我们已经知道如果AB行等价, 那么它们拥有相同的行空间. 于是, 设AB拥有相同的行空间. 现在, A行等价于一个行简化阶梯矩阵R, B行等价于一个行简化阶梯矩阵R. 既然AB拥有相同的行空间, 那么RR也拥有相同的行空间. 因此R=R, A行等价于B.

总结一下, 如果AB是域F上的m×n矩阵, 那么以下陈述等价:

  1. AB行等价.
  2. AB拥有相同的行空间.
  3. B=PA, 其中P是一个m×m的可逆矩阵.
第4条等价的陈述其实是齐次线性方程组AX=0BX=0拥有相同的解. 然而, 尽管我们知道AB的行等价可以推出这两个方程组拥有相同的解, 似乎最好将反方向的证明留到后面再说.

第2.6节 关于子空间的计算

现在我们想要展示初等行变换是如何为回答与Fn的子空间有关的特定问题提供一种标准化的方法的. 我们已经推导出了所有我们将用到的事实. 为了读者的方便, 它们被总结在这里. 这里的讨论适用于任何域F上的n维向量空间, 只需要选取一个固定的有序基𝔅, 然后每个V中的向量α就可由n元组x1,,xn刻画, 其给出了α在有序基𝔅下的坐标.

假设给定了Fn中的m个向量α1,,αm, 我们考虑下列问题.

  1. 如何判定向量α1,,αm是否线性相关? 更一般地, 如何找出由这些向量张成的子空间W的维数?
  2. 给定Fn中的β, 如何判定β是否是α1,,αm的线性组合, 即β是否在子空间W中?
  3. 如何给出子空间W的一个显式描述?
第三个问题有些模糊, 因为它没有说明什么叫做一个"显式描述". 然而, 我们将给出我们心中所想的这种描述以扫清模糊. 根据这种描述, 问题一和问题二都可以立即回答.

A是一个带有行向量αim×n矩阵:αi=(Ai,1,,Ai,n).施行一系列初等行变换, 自A始, 终于行简化阶梯矩阵R. 之前我们已经说明过这是怎样做的. 此时, W (A的行空间) 的维数是显然易见的, 因为这个维数不过就是R的非零行向量的数目. 如果ρ1,,ρrR的非零行向量, 那么𝔅={ρ1,,ρr}W的一个基. 如果ρi的首非零元在第ki列, 那么对于ir我们有R(i,j)=0, 如果j<kiR(i,kj)=δi,jk1<<kr.子空间W由所有具有以下形式的向量构成:β=c1ρ1++crρr=i=1rci(Ri,1,,Ri,n)这样一个向量β的坐标b1,,bn因此是bj=i=1rciRi,j特别地, bkj=cj, 于是如果β=(b1,,bn)ρi的线性组合, 那么它就必须是以下特定的线性组合.β=i=1rbkiρi将此β上之条件转换为坐标形式即bj=i=1rbkiRi,j,j=1,,n这就是由α1,,αm张成的子空间W的显式描述, 即这个子空间由所有Fn中坐标满足显式描述的向量β构成. 显式描述是什么样的呢? 首先, 它将W描述为某个齐次线性方程组的所有解β=(b1,,bn). 这个方程组当然具有非常特别的性质, 因为它将(nr)个坐标表示为另外r个特别坐标bk1,,bkr的线性组合. 坐标bki的选择是完全自由的, 也就是说, 如果c1,,cr是任意的r的标量, 那么W中存在唯一的向量β满足以ci作为第ki个坐标.

重要的点在于此: 给定向量αi, 行规约是一种确定整数r,k1,,kr和标量Ri,j的直接方法, 其给出了由α1,,αm张成的子空间的显式描述. 读者应该注意到定理11表明每个Fn的子空间W都具有这样一个显式描述. 我们也应该指出问题2的一些东西. 我们已经在第1.4节陈述了如何找出一个m×m的可逆矩阵P满足R=PA. P的知识允许我们在可能的情况下找出满足β=x1α1++xmαm的标量x1,,xm. 这是因为R的行向量由ρi=j=1mPi,jαj给出, 于是若βαj的线性组合, 那么我们有β=i=1rbkiρi=i=1rbkij=1mPi,jαj=j=1mi=1rbkiPi,jαj因此xj=i=1rbkiPi,jxj的选择之一 (可能存在许多解).

这样一个问题, 即β=(b1,,bn)是否是αi的线性组合, 以及若是的情况下标量xi该是什么, 也可以通过问以下线性方程组i=1mAi,jxi=bj,j=1,,n是否有解, 以及解是什么来得出答案. 这个线性方程组的系数矩阵是n×m的矩阵B, 其列向量分别为α1,,αm. 第1章中我们讨论了使用初等行变换来解这样一个线性方程组BX=Y. 让我们考虑一个例子, 其中我们采取两种观点来回答有关Fn的子空间的问题.

例子21. 让我们提出以下问题. 令W是由向量α1=(1,2,2,1),α2=(0,2,0,1),α3=(2,0,4,3)张成的4的子空间.
  1. 证明α1,α2,α3W的一个基, 即这些向量是线性无关的.
  2. β=(b1,b2,b3,b4)W中的一个向量, 那么β相对于有序基{α1,α2,α3}的坐标是什么?
  3. α1=(1,0,2,0),α2=(0,2,0,1),α3=(0,0,0,3)证明α1,α2,α3构成了W的一个基.
  4. 如果βW中, 令Xβ相对于α基的坐标矩阵, X是相对于α基的坐标矩阵. 找出3×3的矩阵P满足对于每个这样的βX=PX.
为了用第一种方法回答这些问题, 我们构造以α1,α2,α3为行向量的矩阵A, 并找出行等价于A的行简化阶梯矩阵R. 同时, 我们将相同的操作施行于恒等矩阵之上以获得满足R=QA的可逆矩阵Q:[122102012043]R=[102001000001][100010001]Q=16[660251442]
  1. 显然R的秩为3, 于是α1,α2,α3是线性无关的.
  2. 什么样的向量β=(b1,b2,b3,b4)W之中? 我们有W的基ρ1,ρ2,ρ3, 即R的行向量. 读者只需一眼即可看出ρ1,ρ2,ρ3张成的空间由所有满足b3=2b1的向量β构成. 对于这样一个β我们有β=b1ρ1+b2ρ2+b3ρ3=[b1b2b4]R=[b1b2b4]QA=x1α1+x2α2+x3α3其中xi=[b1b2b4]Qi:x1=b113b2+23b4x2=b1+56b223b4x3=16b2+13b4
  3. 向量α1,α2,α3都具有(y1,y2,y3,y4)的形式, 其中y3=2y1, 因此它们都在W中. 读者一眼就能看出它们是线性无关的.
  4. 矩阵PPj=[αj]𝔅为列, 其中𝔅={α1,α2,α3}. 前面b里的结果已经告诉我们该如何找出α1,α2,α3的坐标矩阵了. 例如, 若β=α1我们有b1=1,b2=0,b3=2,b4=0, 然后x1=113(0)+23(0)=1x2=1+56(0)23(0)=1x3=16(0)+13(0)=0因此α1=α1α2. 类似地, 我们可以得到α2=α2α3=2α12α2+α3. 于是,P=[102112001]
现在让我们看看如何用我们描述的第二种方法回答这些问题. 我们构造以α1,α2,α3为列向量的4×3矩阵B:B=[102220204113]我们问对于什么样的y1,y2,y3,y4方程组BX=Y有解.[102y1220y2204y3113y4][102y1024y22y1000y32y1015y4y1][102y1006y22y4015y4y1000y32y1][100y113y2+23y400116(2y4y2)010y1+56y223y4000y32y1]因此方程组BX=Y有解的条件是y3=2y1. 于是, β=(b1,b2,b3,b4)W中当且仅当b3=2b1. 如果βW中, 那么有序基{α1,α2,α3}下的坐标(x1,x2,x3)可以从上面最后一个矩阵读出来. 其实我们就是又一次得到了第一种方法做出来的结果. 问题c和d可以像之前一样回答.
例子22. 我们考虑5×5矩阵A=[12030121100014024110100001]以及以下和A有关的问题.
  1. 找出一个可逆矩阵P满足PA是行简化阶梯矩阵R.
  2. 找出A的行空间W的一个基.
  3. 说明什么样的向量(b1,b2,b3,b4,b5)W中.
  4. 找出W中的每个向量(b1,b2,b3,b4,b5)在b选择的有序基下的坐标矩阵.
  5. W中的每个向量(b1,b2,b3,b4,b5)写成A的行的线性组合的形式.
  6. 给出所有满足AX=05×1的列矩阵X构成的向量空间V的显式描述.
  7. 找出V的一个基.
  8. 对于什么样的5×1的列矩阵Y, 方程组AX=Y有解?
为了解决这些问题, 我们构造方程组AX=Y的增广矩阵A, 并对其施行一系列合适的行变换.[12030y112110y200140y3241101y400001y5][12030y100140y1+y200140y3001412y1+y400001y5][12030y100140y1y200000y1+y2+y3000013y1+y2+y400001y5][12030y100140y1y200001y500000y1+y2+y3000003y1+y2+y4y5]
  1. 如果对于所有的YPY=[y1y1y2y5y1+y2+y33y1+y2+y4y5]那么P=[1000011000000011110031011]因此PA是行简化阶梯矩阵R=[1203000140000010000000000]必须要强调的是矩阵P不是唯一的, 实际上存在很多种可能的矩阵P (来源于规约的不同顺序) 满足PA=R.
  2. 我们可以提取R非零行ρ1=(1,2,0,3,0)ρ2=(0,0,1,4,0)ρ3=(0,0,0,0,1)作为W的一个基.
  3. 行空间W由所有具有形式β=c1ρ1+c2ρ2+c3ρ3=(c1,2c1,c2,3c1+4c2,c3)的向量构成, 其中c1,c2,c3是任意的标量. 因此, (b1,b2,b3,b4,b5)W中当且仅当(b1,b2,b3,b4,b5)=b1ρ1+b3ρ2+b5ρ3其为真当且仅当b2=2b1,b4=3b1+4b3这个线性方程组是显式描述的实例, 而通过它我们可以一眼看出一个给定向量是否在W之中. 因此, (5,10,1,11,20)A的行的线性组合, 而(1,2,3,4,5)不是.
  4. 向量(b1,2b1,b3,3b1+4b3,b5)在有序基{ρ1,ρ2,ρ3}下的坐标矩阵显然是[b1b3b5].
  5. 许多种方法都可以将W的向量写成A的行的线性组合, 或许最简单的一种是遵循例子21之前的第一个过程的步骤:β=(b1,2b1,b3,3b1+4b3,b5)=[b1b3b500]R=[b1b3b500]PA=[b1b3b500][1000011000000011110031011]A=[b1+b3b300b5]A特别地, 如果β=(5,10,1,11,20)我们有β=[410020][12030121100014024110100001]
  6. 方程组RX=0中的方程是x1+2x2+3x4=0x3+4x4=0x5=0因此, V由所有具有形式[2x23x4x24x4x40]的列向量构成, 其中x2x4是任意的.
  7. 列向量[21000],[30410]构成了V的一个基, 这是例子15所描述的基的一个例子.
  8. 方程组AX=Y有解当且仅当y1+y2+y3=03y1+y2+y4y5=0
练习1.s<nA是一个域F上的s×n矩阵, 使用定理4 (但不是其证明) 证明Fn×1中存在非零的X满足AX=0.
练习2.α1=(1,1,2,1),α2=(3,0,4,1),α3=(1,2,5,2)α=(4,5,9,7),β=(3,1,4,4),γ=(1,1,0,1)
  1. α,β,γ中哪些在αi张成的4的子空间之中?
  2. α,β,γ中哪些在αi张成的4的子空间之中?
  3. 这是否暗示了一个定理?
练习3. 考虑以下4中的向量α1=(1,0,1,2),α2=(3,4,2,5),α3=(1,4,0,9)找出一个齐次线性方程组, 其解空间恰是这些向量张成的子空间.
练习4.3中, 令α1=(1,0,i),α2=(1+i,1i,1),α3=(i,i,i)证明这些向量构成了3的一个基. 向量(a,b,c)在这个基下的坐标是什么?
练习5. 给出5中的向量β=(b1,b2,b3,b4,b5)的显式描述, 其为向量α1=(1,0,2,1,1),α2=(1,2,4,2,0),α3=(2,1,5,2,1),α4=(2,1,3,5,2)的线性组合.
练习6.V是由矩阵A=[321090171212140616421130]的行张成的实向量空间.
  1. 找出A的一个基.
  2. 什么样的向量(x1,x2,x3,x4,x5)V的元素.
  3. 如果(x1,x2,x3,x4,x5)V中, 那么它在a选择的基下的坐标是什么?
练习7.A是域F上的m×n矩阵, 考虑线性方程组AX=Y. 证明该线性方程组有解当且仅当A的行秩等于其增广矩阵的行秩.

第3章 线性变换

第3.1节 线性变换

我们将引入线性变换, 本书的剩余部分我们将研究的对象. 读者或许会发现阅读 (或重读) 附录里关于函数的部分是有用的, 因为我们将自由地使用其中的术语.

定义.VW是域F上的向量空间. 一个从VW的线性变换是一个从VW的函数T满足T(cα+β)=c(Tα)+Tβ对于所有Vαβ以及所有F中标量c成立.
例子1. 如果V是任意的向量空间, 恒等变换I, 由Iα=α定义, 是一个从VV的线性变换. 零变换, 由0α=0定义, 也是一个从VV的线性变换.
例子2.F是一个域, V是从FF的多项式函数f构成的空间, ff(x)=c0+c1x++ckxk给定. 令(Df)(x)=c1+2c1x++kckxk1.那么D是一个从VV的线性变换, 即微分变换.
例子3.A是域F上一个固定的m×n矩阵, 由T(X)=AX定义的函数T是一个从Fn×1Fm×1的线性变换. 由U(α)=αA定义的函数U是一个从FmFn的线性变换.
例子4.P是域F上一个固定的m×m矩阵, 令Q是域F上一个固定的n×n矩阵. 定义一个从Fm×n到自身的函数T, T(A)=PAQ. 那么T是一个线性变换, 因为T(cA+B)=P(cA+B)Q=(cPA+PB)Q=cPAQ+PBQ=cT(A)+T(B)
例子5.V是所有从的连续函数构成的空间, 由(Tf)(x)=0xf(t)dt定义T, 那么T是一个从VV的线性变换. 函数Tf不仅是连续的, 还拥有连续的一阶导数. 积分的线性性质是其根本性质之一.

读者验证例子1, 2, 3, 5是线性变换是没有难度的. 当我们了解更多关于线性变换的东西时, 例子也会随之得到扩展.

注意到以下事实是重要的. 如果T是一个从VW的线性变换, 那么T(0)=0. 人们可以从定义中看出来, 因为T(0)=T(0+0)=T(0)+T(0).这点对于线性代数的初学者而言有时令人迷惑, 因为他可能已经接触过术语"线性函数"一个稍微有点不同的用法. 扼要的注记应该能够扫清这种迷惑. 设V是向量空间1, 那么一个从VV的线性变换是一种特定的实数轴上的实值函数. 在一个微积分课程中, 人们可能会将图像是直线的函数称为线性的. 一个从11的线性变换, 根据我们的定义, 将会是一个从的函数, 其图像是经过原点的直线.

不仅是T(0)=0, 让我们指出一般的线性变换T的另一个性质. 这样的线性变换"保持"线性组合, 也就是说, 如果α1,,αnV中的向量, c1,,cn是标量, 那么T(c1α1++cnαn)=c1(Tα1)++cn(Tαn)这可由定义直接推得, 例如T(c1α1+c2α2)=c1(Tα1)+T(c2α2)=c1(Tα1)+c2(Tα2)

定理1.V是一个域F上的有限维向量空间, 令{α1,,αn}V的一个有序基. 令W也是域F上的一个向量空间, 并且令β1,,βnW中任意的向量. 那么, 恰存在唯一的从VW的线性映射T满足Tαj=βj,j=1,,n
证明. 为了证明存在某个线性变换T满足Tαj=βj我们按照以下方式推进. 给定V中的α, 存在唯一的n元组(x1,,xn)满足α=x1α1++xnαn.对于这个向量α我们定义Tα=x1β1++xnβn.那么T是一个将每个V中的向量α与一个W中的向量Tα联系起来的良定义的规则. 从此定义中显然可以看出对于每个jTαj=βj. 为了说明T是线性的, 令β=y1α1++ynαnV中的向量, 令c是任意的标量. 现在cα+β=(cx1+y1)α1++(cxn+yn)αn于是根据定义T(cα+β)=(cx1+y1)β1++(cxn+yn)βn另一方面c(Tα)+Tβ=ci=1nxiβi+i=1nyiβi=i=1n(cxi+yi)βi因此T(cα+β)=c(Tα)+Tβ.如果U也是一个满足Uαj=βj,j=1,,n的从VW的线性变换, 那么对于向量α=i=1nxiαi我们有Uα=U(i=1nxiαi)=i=1nxi(Uαi)=i=1nxiβi因此U恰是我们之前所定义的规则T. 这表明满足Tαj=βj的线性变换T是唯一的.

定理1是相当初等的. 然而, 它是如此基本以至于我们形式化地陈述了该定理. 函数的概念是非常一般的. 如果VW是(非零的)向量空间, 那么从VW的函数存在相当多样的可能性. 定理1强调了线性函数是极其特殊的.

例子6. 向量α1=(1,2),α2=(3,4)是线性无关的, 因此构成了2的一个基. 根据定理1, 存在唯一的一个从23的线性变换满足Tα1=(3,2,1),Tα2=(6,5,4)如果是这样的话, 我们必须能够找出T(ε1). 我们先找到满足ε1=c1α1+c2α2的标量c1c2, 然后我们就知道Tε1=c1Tα1+c2Tα2. 如果(1,0)=c1(1,2)+c2(3,4), 那么c1=2c2=1, 因此T(1,0)=2(3,2,1)+(6,5,4)=(0,1,2)
例子7.T是一个从m元组空间Fmn元组空间Fn的线性变换. 定理1告诉我们T由向量的序列β1,,βm唯一地确定, 其中βi=Tεi,i=1,,m.简而言之, T由其在标准基向量下的像唯一地确定, 而这个确定就是α=(x1,,xm),Tα=x1β1++xmβm.如果B是一个以β1,,βm为行向量的m×n矩阵, 那么上面就是在说Tα=αB.换言之, 如果βi=(Bi,1,,Bi,n), 那么T(x1,,xm)=[x1xm][B1,1B1,nBm,1Bm,n].这是一种对于线性变换相当显式的刻画. 在第3.4节我们将严肃地研究线性变换和矩阵之间的关系. 之后我们并不会追求Tα=αB这种特定的描述, 因为它将矩阵B置于向量α的右边, 而这可能会引起一些困惑. 这个例子的要点在于展现了我们对于所有从FmFn的线性变换可以给出显式且相当简单的描述.

如果T是一个从VW的线性变换, 那么T的像不仅是W的子集, 而且是W的子空间. 令RTT的像, 即满足存在某个Vα使得β=Tα的所有W中向量β构成的集合. 令β1β2RT的元素, 令c是一个标量. 存在V中向量α1α2满足Tα1=β1Tα2=β2. 既然T是线性的, 那么T(cα1+α2)=cTα1+Tα2=cβ1+β2这表明cβ1+β2也在RT之中.

另一个与线性变换T相关的有趣子空间是由所有满足Tα=0V中的向量α构成的集合N. 它是V的一个子空间, 因为

  1. T(0)=0, 于是N非空;
  2. 如果Tα1=Tα2=0, 那么T(cα1+α2)=cTα1+Tα2=c0+0=0于是cβ1+β2也在N之中.

定义.VW是域F上的向量空间, 令T是一个从VW的线性变换. T的零空间是所有满足Tα=0V中向量α构成的集合. 如果V是有限维的, 那么称T的像的维数为T的秩, T的零空间的维数为T的零化度.

以下是线性代数中最重要的结果之一.

定理2.VW是域F上的向量空间, 令T是一个从VW的线性变换, 设V是有限维的, 那么rank(T)+nullity(T)=dimV.
证明.{α1,,αk}N的一个基, NT的零空间. 存在V中向量αk+1,,αn满足{α1,,αn}V的一个基. 我们将证明{Tαk+1,,Tαn}T的像的一个基. 向量Tα1,,Tαn当然能够张成T的像, 并且既然对于jkTαj=0, 我们可以看出Tαk+1,,Tαn能够张成像. 为了看出这些像是线性无关的, 设我们有标量ci满足i=k+1nci(Tαi)=0.这说明T(i=k+1nciαi)=0并且可知α=i=k+1nciαiT的零空间中. 既然α1,,αk构成了N的一个基, 那么必须存在标量b1,,bk满足α=i=1kbiαi.因此i=1kbiαij=k+1ncjαj=0并且既然α1,,αn是线性无关的, 我们必须有b1==bk=ck+1==cn=0.如果rT的秩, 那么Tαk+1,,Tαn构成了T的像的基的事实告诉我们r=nk. 既然kT的零化度而nV的维数, 证明结束了.
定理3. 如果A是域F上的一个m×n矩阵, 那么row-rank(A)=column-rank(A).
证明.T是由T(X)=AX定义的从Fn×1Fm×1的线性变换. T的零空间是线性方程组AX=0的解空间, 即由所有满足AX=0的列矩阵X构成的集合. T的像是由所有满足线性方程组AX=Y有解的m×1的列矩阵Y构成的集合. 如果A1,,AnA的列, 那么AX=x1A1++xnAn于是T的像是由A的列张成的子空间. 换句话说, T的像就是A的列空间, 因此rank(T)=column-rank(A).定理2告诉我们如果S是线性方程组AX=0的解空间, 那么dimS+column-rank(A)=n.我们现在引用第2章的例子15. 我们的意图在于, 如果rA的行空间的维数, 那么解空间S拥有一个由nr个向量构成的基:dimS=nrow-rank(A).现在显然有row-rank(A)=column-rank(A).

刚刚我们给出的对于定理3的证明依赖于和线性方程组有关的显式计算. 实际上存在一个不依赖于这样的计算的概念性证明. 我们将在第3.7节给出这个证明.

练习1. 以下哪些函数T是从22的线性变换呢?
  1. T(x1,x2)=(1+x1,x2);
  2. T(x1,x2)=(x2,x1);
  3. T(x1,x2)=(x12,x2);
  4. T(x1,x2)=(sinx1,x2);
  5. T(x1,x2)=(x1x2,0).
练习2. 找出有限维向量空间V上的零变换和恒等变换的像, 秩, 零空间, 零化度.
练习3. 描述例子2的微分变换和例子5的积分变换的像和零空间.
练习4. 存在从32的线性变换满足T(1,1,1)=(1,0)T(1,1,1)=(0,1)吗?
练习5. 如果α1=(1,1),β1=(1,0),α2=(2,1),β2=(0,1),α3=(3,2),β3=(1,1)存在从22的线性变换T满足Tαi=βi对于i=1,2,3成立吗?
练习6. 显式描述 (如练习1和2) 满足Tε1=(a,b),Tε2=(c,d)的从F2F2的线性变换T.
练习7.F是一个复数域的子域, 令T是由T(x1,x2,x3)=(x1x2+2x3,2x1+x2,x12x2+2x3)定义的从F3F3的函数.
  1. 验证T是一个线性变换.
  2. 如果(a,b,c)F3中向量, 那么a,b,c满足什么条件时向量在T的像中? T的秩是多少?
  3. a,b,c满足什么条件时(a,b,c)T的零空间中? T的零化度是多少?
练习8. 显式描述一个从33的线性变换, 其像是由(1,0,1)(1,2,2)张成的子空间.
练习9.V是域F上的所有n×n矩阵构成的向量空间, 令B是一个固定的n×n矩阵. 如果T(A)=ABBA验证T是一个从VV的线性变换.
练习10.V是所有复数的集合, 其被当作实数域上的向量空间 (在通常的运算下). 找出一个从VV的线性变换, 但不是1上的线性变换, 即不是复线性的.
练习11.VF上的n×1矩阵的空间, 令WF上的m×1矩阵的空间. 令AF上的一个固定的m×n矩阵, 令T是由T(X)=AX定义的从VW的线性变换. 证明T是零变换当且仅当A是零矩阵.
练习12.V是域F上的一个n维向量空间, 令T是一个从VV的线性变换, 并且T的像和零空间是相等的. 证明n是偶数. (你能给出这样的线性变换T的例子吗?)
练习13.V是一个向量空间, 令T是一个从VV的线性变换. 证明以下两个关于T的陈述是等价的.
  1. T的像与零空间之交是V的零子空间.
  2. 如果T(Tα)=0, 那么Tα=0.

第3.2节 线性变换的代数

在研究从VW的线性变换时, 这些变换的集合继承了自然的向量空间结构具有根本的重要性. 从空间V到自身的线性变换的集合甚至有着更多的代数结构, 因为通常的函数复合提供了这样的变换的"乘法". 我们将在本节探索这些想法.

定理4.VW是域F上的向量空间. 令TU是从VW的线性变换. 由(T+U)(α)=Tα+Uα定义的函数(T+U)是一个从VW的线性变换. 如果cF任意的元素, 那么由(cT)(α)=c(Tα)定义的函数(cT)是一个从VW的线性变换. 所有从VW的线性变换的集合, 与其上定义的加法和标量乘法一起, 构成了一个域F上的向量空间.
证明.TU是从VW的线性变换, 而(T+U)定义如上, 那么(T+U)(cα+β)=T(cα+β)+U(cα+β)=c(Tα)+Tβ+c(Uα)+Uβ=c(Tα+Uα)+(Tβ+Uβ)=c(T+U)(α)+(T+U)(β)这表明(T+U)是一个线性变换. 类似地,(cT)(dα+β)=c[T(dα+β)]=c[d(Tα)+Tβ]=cd(Tα)+c(Tβ)=d[c(Tα)]+c(Tβ)=d[(cT)α]+(cT)β这表明(cT)是一个线性变换.
为了验证从VW的线性变换的集合 (以及这些运算) 是一个向量空间, 我们还必须直接检验每个向量加法和数乘上的条件是否满足. 我们将这些工作留给读者, 并满足于以下的评论: 这个空间里的零向量是零变换, 其将每个V的向量送至W的零向量; 这两个运算的每个性质都对应于空间W的运算的相应性质.

或许我们应该提及另一种看待这个定理的方式. 如果我们如果上面那样定义和与标量积, 那么所有从VW的函数构成了一个域F上的向量空间. 这与V是向量空间无关, V是一个非空集合足矣. 当V是向量空间的时候我们可以定义从VW的线性变换, 那么定理4告诉我们这些变换构成了从VW的所有函数构成的空间的一个子空间.

我们将从VW的线性变换的空间记作L(V,W). 我们提醒读者只有当VW是定义于同一个域上的向量空间时L(V,W)才有定义.

定理5.V是域F上的n维向量空间而W是域F上的m维向量空间, 那么L(V,W)是有限维的, 并且维数是mn.
证明.𝔅={α1,,αn}𝔅={β1,,βm}分别是VW的有序基. 对于每个满足1pm1qn的整数序对(p,q), 我们定义从VW的线性变换Ep,q如下.Ep,q(αi)={0, 如果iqβp, 如果i=q=δi,qβp根据定理1, 存在唯一的从VW的线性变换满足这些条件. 我们要证明的是这mn个线性变换构成了L(V,W)的一个基.
T是从VW的线性变换. 对于每个j,1jn, 令A1,j,,Am,j是向量Tαj相对于有序基𝔅的坐标, 即Tαj=p=1mAp,jβp.我们想要表明T=p=1mq=1nAp,qEp,q.U是上面这个式子右侧的线性变换, 那么对于每个j,Uαj=p=1mq=1nAp,qEp,q(αj)=p=1mq=1nAp,qδj,qβp=p=1mAp,jβp=Tαj因此U=T. 目前我们已经证明了Ep,q可以张成L(V,W), 我们必须还要证明它们是线性无关的, 然而从我们上面写下的东西来看这是显然的, 因为如果变换U=p=1mq=1nAp,qEp,q是零变换, 那么对于每个jUαj=0, 于是p=1mAp,jβp=0βp的线性无关性质又可推出对于每个pj我们有Ap,j=0.
定理6.V,W,Z是域F上的向量空间, 令T是从VW的线性变换, 令U是从WZ的线性变换, 那么由(UT)(α)=U(T(α))定义的复合函数UT是一个从VZ的线性变换.
证明. UT(cα+β)=U[T(cα+β)]=U(cTα+Tβ)=c[U(Tα)]+U(Tβ)=c(UT)(α)+(UT)(β)

接下来, 我们将主要关注从一个向量空间到自身的线性变换. 鉴于我们经常得说"T是一个从VV的线性变换", 以后我们将说"TV上的一个线性算子".

定义. 如果V是域F上的一个向量空间, 那么一个V上的线性算子就是一个从VV的线性变换.

在定理6的情况下, 当V=W=Z时, 以至于UT都是空间V上的线性算子, 那么其复合UT也是一个V上的线性算子. 因此, 空间L(V,V)有一个乘法定义于其上, 即复合. 当然算子TU也是有定义的, 不过读者应该注意一般UTTU, 即UTTU0. 我们还应该特别注意如果T是一个V上的线性算子, 那么我们可以将TT复合. 我们将使用记号T2=TT, 而一般地, 对于n=1,2,3,, Tn=TT(nT相乘). 我们定义T0=I, 如果T0. [译注: T=0时定义T0=I也是合理且必要的.]

引理.V是域F上的向量空间, 令U,T1,T2V上的线性算子, 令cF的元素.
  1. IU=UI=U;
  2. U(T1+T2)=UT1+UT2; (T1+T2)U=T1U+T2U;
  3. c(UT1)=(cU)T1=U(cT1).
证明.
  1. 这个关于恒等函数的性质是显然的, 我们列在这里仅是为了强调一下.
  2. [U(T1+T2)](α)=U[(T1+T2)(α)]=U(T1α+T2α)=U(T1α)+U(T2α)=(UT1)(α)+(UT2)(α)于是U(T1+T2)=UT1+UT2. 另外,[(T1+T2)U](α)=(T1+T2)(Uα)=T1(Uα)+T2(Uα)=(T1U)(α)+(T2U)(α)于是(T1+T2)U=T1U+T2U. (读者或许注意到了这两个分配律的证明并没有用到T1T2是线性的这个事实, 而且第二个证明也没有用到U是线性的.)
  3. 我们将c的证明留给读者.

这个引理的内容和定理5的一部分告诉我们向量空间L(V,V)和复合运算构成了一个叫做含幺元的线性代数的结构. 我们将在第4章讨论这个东西. [译注: 其实在一般的代数学书籍里这种结构就叫代数.]

例子8. 如果A是一个元素来源于Fm×n矩阵, 我们可以由T(X)=AX定义一个从Fn×1Fm×1的线性变换T. 如果B是一个p×m的矩阵, 那么我们可以通过U(Y)=BY定义一个从Fm×1Fp×1的线性变换U. 它们的复合UT是很容易描述的:(UT)(X)=U(T(X))=U(AX)=B(AX)=(BA)X因此UT即"左乘积矩阵BA".
例子9.F是一个域而V是所有从FF的多项式函数构成的向量空间. 令D是例子2所定义的微分算子, 令T是"乘上x"的线性算子:(Tf)(x)=xf(x).那么DTTD. 实际上, 读者应该很容易验证DTTD=I, 即恒等算子.

即便我们定义的L(V,V)上的乘法并不交换, 其与L(V,V)的向量空间运算有着很好的联系.

例子10.𝔅={α1,,αn}是向量空间V的一个有序基. 考虑定理5的证明中出现的线性算子Ep,q:Ep,q(αi)=δi,qαp.n2个线性算子构成了V上的线性算子空间的一个基. Ep,qEr,s是什么呢? 我们有(Ep,qEr,s)(αi)=Ep,q(δi,sαr)=δi,sEp,q(αr)=δi,sδr,qαp因此Ep,qEr,s={0, 如果rqEp,s, 如果q=rT是一个V上的线性算子, 我们在定理5的证明中表明如果Aj=[Tαj]𝔅,A=[A1,,An]那么T=p=1nq=1nAp,qEp,q.如果U=r=1ns=1nBr,sEr,sV上另一个线性算子, 那么上一条引理告诉我们TU=(p=1nq=1nAp,qEp,q)(r=1ns=1nBr,sEr,s)=p=1nq=1nr=1ns=1nAp,qBr,sEp,qEr,s我们注意到, 这巨大的求和之中只有满足q=r的项才能活下来, 又因为Ep,rEr,s=Ep,s, 我们有TU=p=1ns=1n(r=1nAp,rBr,s)Ep,s=p=1ns=1n(AB)p,sEp,s因此, 复合TU的效用相当于矩阵AB相乘.

在我们对于线性变换的代数运算的讨论中, 我们还没有说任何与可逆性相关的东西. 我们所特别关心的问题之一是, 对于向量空间V上什么样的线性算子T存在线性算子T1满足TT1=T1T=I? [译注: 读者应该将这里的T1当作一个整体, 而不是T的逆, 因为还没有定义逆运算.]

VW的函数称为可逆的, 如果存在一个从WV的函数U满足UTV上的恒等函数而TUW上的恒等函数. 如果T是可逆的, 那么函数U是唯一的, 我们将其记作T1. (见附录.) 而且, T可逆当且仅当

  1. T是一一的, 即Tα=Tβ可以推出α=β;
  2. T是映上的, 即T的像是(整个的)W.
[译注: 一一和映上是过时的术语, 之后我们将用单射和满射.]

定理7.VW是域F上的向量空间, 令T是从VW的线性变换. 如果T是可逆的, 那么逆函数是一个从WV的线性变换. [译注: 这里说的可逆是函数的可逆.]
证明. 这里我们重复以强调一个点. 当T是单射且是满射, 那么存在唯一决定的从WV的逆函数T1满足T1TV上的恒等函数而TT1W上的恒等函数. 现在我们要证明的是, 如果线性函数T是可逆的, 那么其逆T1也是线性的.
β1β2W的向量而c是一个标量, 我们想要证明T1(cβ1+β2)=cT1β1+T1β2.αi=T1βi,i=1,2, 即令αiV中唯一满足Tαi=βi的向量. 既然T是线性的, 那么T(cα1+α2)=cTα1+Tα2=cβ1+β2因此cα1+α2V中唯一的由T送至cβ1+β2的向量, 于是T1(cβ1+β2)=cα1+α2=c(T1β1)+T1β2

设我们有一个从VW的可逆的线性变换T和一个从WZ的可逆的线性变换U, 那么UT是可逆的并且(UT)1=T1U1. 这个结论并不需要线性性质, 也不需要分开检验UT是单射和满射. 所有需要做的事情只是验证T1U1既是UT的左逆也是UT的右逆.

如果T是线性的, 那么T(αβ)=TαTβ. 因此, Tα=Tβ当且仅当T(αβ)=0. 这极大地简化了对于T是否为单射的验证. 让我们称一个线性变换是非奇异的, 如果Tγ=0可以推出γ=0, 即T的零空间是{0}. 显然, T是单射当且仅当T非奇异. 这个评注的一个扩展是非奇异的线性变换就是那些保持线性无关的线性变换.

定理8.T是一个从VW的线性变换, 那么T是非奇异的当且仅当V的每个线性无关子集在T下的像是W的线性无关子集.
证明. 首先设T是非奇异的. 令SV的一个线性无关子集. 如果α1,,αkS中的向量 [译注: 不同的向量], 那么Tα1,,Tαk是线性无关的, 因为如果c1(Tα1)++ck(Tαk)=0那么T(c1α1++ckαk)=0既然T是非奇异的, 那么c1α1++ckαk=0从中我们可以得出每个ci=0, 因为S是一个线性无关的集合. 这个论证表明ST下的像是线性无关的.
T将线性无关的子集映射至线性无关的子集. 令αV的一个非零向量, 那么仅包含α的集合S是线性无关的. S的像是仅包含向量Tα的集合, 而这个集合是线性无关的. 因而Tα0, 否则的话就是线性相关的了. 这表明T的零空间是零子空间, 即T是非奇异的.
例子11.F是一个复数域的子域 (或者特征为零的域), 令V是域F上的多项式函数的空间. 考虑例子9的微分算子D和"乘上x"的算子T. 既然D将每个常函数送至0, D是奇异的. 然而, 因为V不是有限维的, D的像是整个V, 于是定义一个D的右逆是有可能的. 例如, 如果E是不定积分算子:E(c0+c1x++cnxn)=c0x+12c1x2++1n+1cnxn+1那么EV上的线性算子并且DE=I. 另一方面, EDI, 因为ED将每个常函数都送至0. 与之相对地, 算子T是非奇异的, 因为如果对于每个xxf(x)=0, 那么f=0. 因此, 可以找到T的一个左逆. 例如, 如果U是"移除常数项并除以x"的操作:U(c0+c1x++cnxn)=c1+c2x++cnxn1那么U是一个V上的线性算子并且UT=I. 但是TUI, 因为每个TU的像中的函数自然也在T的像中, 而T的像是所有满足f(0)=0的函数f构成的空间. [译注: 而不是整个V.]
例子12.F是一个域而T是一个F2上的线性算子, 其由T(x1,x2)=(x1+x2,x1)定义. 那么, T是非奇异的, 因为如果T(x1,x2)=0, 我们有{x1+x2=0x1=0于是x1=x2=0. 我们也看出T是满射, 因为如果令(z1,z2)F2中任意的向量, 为了证明(z1,z2)T的像中, 我们必须找出满足{x1+x2=z1x1=z2的标量x1x2, 而x1=z2,x2=z1z2就是显而易见的解. 这个计算为我们提供了T1的显式公式, 即T1(z1,z2)=(z2,z1z2).

在例子11之中我们看到一个线性变换可能是非奇异的但不是满射, 或者可能是满射但不是非奇异的. 然而, 上面这个例子为我们刻画了一种情形, 其中例子11的这种事情不可能发生.

定理9.VW是域F上的有限维向量空间, 并且dimV=dimW. 如果T是一个从VW的线性变换, 那么以下陈述是等价的:
  1. T是可逆的.
  2. T是非奇异的.
  3. T是满射, 即T的像是W.
证明.n=dimV=dimW, 从定理2我们知道rank(T)+nullity(T)=n.既然T是非奇异的当且仅当nullity(T)=0, T的像是W当且仅当rank(T)=n (因为n=dimW), 而且零化度是0当且仅当秩为n, 那么T是非奇异的当且仅当T(V)=W. 于是, 只要ii或iii其中之一成立, 那么另一条也成立, 那么T就是可逆的了.

我们提醒读者一下, 除非有限维和dimV=dimW的条件都满足, 否则就不要应用定理9. 在定理9的假设下, 条件i, ii, iii还等价于以下陈述.

  1. 如果{α1,,αn}V的一个基, 那么{Tα1,,Tαn}W的一个基.
  2. 存在V的某个基{α1,,αn}使得{Tα1,,Tαn}W的一个基.
我们将给出一个这五个条件等价的证明, 它不同于之前给出的三个条件等价的证明.

i推出ii. 如果T是可逆的, T当然是非奇异的. ii推出iii. 设T是非奇异的. 令{α1,,αn}V的一个基, 那么根据定理8, {Tα1,,Tαn}W的一个线性无关集合. 而且, 因为W的维数也是n, 所以这个集合也构成了W的一个基. 现在令βW任意的向量, 那么存在标量c1,,cn满足β=c1(Tα1)++cn(Tαn)=T(c1α1++cnαn)这表明βT的像之中. iii推出iv. 现在我们假定T是满射. 如果{α1,,αn}V任意的基, 那么{Tα1,,Tαn}可以张成T的像, 根据假设也就是整个W. 既然W的维数是n, 那么这n个向量必然是线性无关的, 也就是说构成了W的一个基. iv推出v. 这不需要证明. v推出i. 设存在V的某个基满足{Tα1,,Tαn}W的一个基. 既然Tαi可以张成W, 那么显然T的像是整个W. 如果α=c1α1++cnαnT的零空间之中, 那么T(c1α1++cnαn)=0或者c1(Tα1)++cn(Tαn)=0既然Tαi是线性无关的, 那么每个ci=0, 因此α=0. 我们已经证明了T的像是WT是非奇异的, 所以T是可逆的.

一个空间V上的可逆线性算子, 连带着复合运算, 提供了一个代数中被称为"群"的例子. 尽管我们没有时间细致地讨论群, 但是我们至少可以给出群的定义.

定义. 一个群由以下资料构成.
  1. 一个集合G;
  2. 一个法则 (或者说一个运算), 其联系G中每对元素xy以一个G中元素xy, 并且满足
    1. 对于所以Gx,y,z, x(yz)=(xy)z;
    2. 存在一个G中的元素e满足对于每个G中的xex=xe=x;
    3. 对于每个G的元素x存在一个G中元素x1与之对应, 满足xx1=x1x=e.

我们已经证明了复合(U,T)UT联系空间V上的每对可逆线性算子以另一个V上的可逆线性算子. 复合是一个结合运算. 恒等算子I对于每个TIT=TI=T. 对于可逆的T, (根据定理7)存在一个可逆的线性算子T1满足TT1=T1T=I. 因此, V上的可逆线性算子的集合, 连带着复合运算, 构成了一个群. 以矩阵乘法作为运算的n×n可逆矩阵的集合是另一个群的例子. 一个群是交换的, 如果它满足对于每个xyxy=yx. 以上两个我们给出的例子一般不是交换群. 人们经常将交换群的运算写成(x,y)x+y而不是(x,y)xy, 并用符号0表示"恒元"e. 向量空间的向量的集合, 连带着向量加法, 是一个交换群. 一个域可以被描述为一个带有加法和乘法运算的集合, 其在加法下是一个交换群, 而非零元素在乘法下也构成了一个交换群, 并且分配律x(y+z)=xy+xz成立.

练习1.TU2上由T(x1,x2)=(x2,x1)U(x1,x2)=(x1,0)定义的线性算子.
  1. 如何几何地描述TU?
  2. 像定义TU一样给出刻画(U+T),UT,TU,T2,U2的规则.
练习2.T3上满足Tε1=(1,0,i),Tε2=(0,1,1),Tε3=(i,1,0)的(唯一的)线性算子. T可逆吗?
练习3.T3上由T(x1,x2,x3)=(3x1,x1x2,2x1+x2+x3)定义的线性算子. T可逆吗? 如果可逆的话, 像定义T一样给出T1的规则.
练习4. 对于练习3的线性算子T, 证明(T2I)(T3I)=0.
练习5.B=[1144]T是由T(A)=BA定义的2×2上的线性算子. T的秩是多少? 你能描述T2吗?
练习6.T是从32的线性变换, 令U是从23的线性变换. 证明变换UT是不可逆的. 给出这个定理的一般化版本.
练习7. 找出2上两个线性算子TU满足TU=0但是UT0.
练习8.V是域F上的向量空间, 令TV上的一个线性算子. 如果T2=0, 关于T的像和零空间的关系你有什么可说的? 给出一个2上的线性算子T的例子, 其满足T2=0T0.
练习9.T是有限维向量空间V上的一个线性算子. 设存在一个V上的线性算子U满足TU=I. 证明T是可逆的, 并且U=T1. 给出一个例子表明在V不是有限维的情况下这是错的. (提示: 令T=D, 多项式函数空间上的微分算子.)
练习10.A是域F上的一个m×n矩阵, 令T是由T(X)=AX定义的从Fn×1Fm×1的线性变换. 说明在m<n的情况下T可以是满射但不是非奇异的. 类似地, 说明在m>n的情况下T可以是非奇异的但不是满射.
练习11.V是一个有限维向量空间, 令TV上的一个线性算子. 设rank(T2)=rank(T). 证明T的像和零空间是不相交的 (disjoint), 即只有零向量作为共同元素.
练习12.p,m,n是正整数而F是一个域. 令V是域F上的m×n矩阵的空间, W是域F上的p×n矩阵的空间. 令B是一个固定的p×m矩阵而T是一个由T(A)=BA定义的从VW的线性变换. 证明T可逆当且仅当p=mB是一个可逆的m×m矩阵.

第3.3节 同构

如果VW是域F上的向量空间, 那么任何从VW的双射的线性变换T都被称为从VW的同构. 如果存在从VW的同构, 那么就称V同构于W. [译注: 更直接和正确的说法其实是可逆而不是双射, 不过在向量空间的情况下这二者是等价的.]

注意到V平凡地同构于V, 恒等算子是一个从VV的同构. 并且, 如果V通过T同构于W, 那么W也同构于V, 因为T1是一个从WV的同构. 读者应该很容易验证如果V同构于WW同构于Z, 那么V同构于Z. 简而言之, 同构是向量空间的类上的等价关系. [译注: 这里的用词是class而不是set, 因为所有的向量空间的确不构成一个集合.] 当存在一个从VW的同构时, 我们有时也说VW是同构的, 而不说V同构于W. 鉴于V同构于W当且仅当W同构于V, 这不会引起歧义.

定理10. 每个域F上的n维向量空间都同构于空间Fn.
证明.V是域F上的n维向量空间, 令𝔅={α1,,αn}V的一个有序基. 我们按照以下方式定义从VFn的函数T: 如果αV中, 令Tαα相对于有序基𝔅的坐标n元组(x1,,xn), 即满足α=x1α1++xnαnn元组. 根据我们第2章对于坐标的讨论, 我们验证这个T是线性的且是双射的.

出于许多目的我们可以将同构的向量空间视为"相同的", 尽管空间中的向量和运算可能是相当不同的. 我们目前不会详细讨论这个想法, 但将在我们对于向量空间的研究中积累对于同构的理解以及同构空间是"相同的"这个感觉.

我们将作出一些简要的评注. 设T是一个从VW的同构. 如果SV的一个子集, 那么定理8告诉我们S是线性无关的当且仅当集合T(S)W中是线性无关的. 因此, 在判断S是否线性无关时, 检视S还是T(S)是无关紧要的. 从中我们可以看出, 同构是"维数保持的", 也就是说对于V任意的有限维子空间, 其在T下的像有着相同的维数. 现在我们给出这个想法的一个非常简单的刻画. 设A是域F上的一个m×n矩阵, 实际上我们给过两种对于矩阵A的解空间的定义. 第一种是Fn中所有满足线性方程组AX=0的每个方程的n元组(x1,,xn)构成的集合. 第二种是所有满足AX=0n×1列矩阵X构成的集合. 第一种解空间是Fn的子空间, 第二种解空间是Fn×1的子空间. 实际上FnFn×1之间有一个显见的同构, 即(x1,,xn)[x1xn].在这个同构下, A的第一种解空间被映射至第二种解空间. 这两个空间有着相同的维数, 于是在证明关于解空间的维数的定理时, 选择那个空间来讨论是无关紧要的. 实际上, 读者或许并不会产生一点犹豫, 如果我们选择将FnFn×1视为等同的. 当方便的时候, 我们就会这么做, 而不方便的时候, 我们就不这么做.

练习1.V是复数集, 令F是实数域. 在通常的运算下, VF上的一个向量空间. 显式描述一个从该空间到2的同构.
练习2.V是复数域上的向量空间, 并设存在一个从V3的同构T. 令α1,α2,α3,α4V中向量, 满足Tα1=(1,0,i),Tα2=(2,1+i,0),Tα3=(1,1,1),Tα4=(2,i,3).
  1. α1α2α3张成的子空间中吗?
  2. W1α1α2张成的子空间, 令W2α3α4张成的子空间, 那么W1W2的交是什么呢?
  3. 找出一个这四个向量αj张成的V的子空间的基.
练习3.W是所有2×2的复Hermite矩阵构成的集合. 正如我们在第2章的例子6中所指出的, 在通常的运算下, W是一个实数域上的向量空间. 验证(x,y,z,t)[t+xy+izyiztx]是一个从4W的同构.
练习4. 表明Fm×n同构于Fmn.
练习5.V是复数集, 其可以被视为实数域上的向量空间 (练习1). 我们按照以下方式定义一个从V2×2实矩阵空间的函数T. 如果z=x+iy, 其中xy是实数, 那么T(z)=[x+7y5y10yx7y].
  1. 验证T是一个单射的(实)线性变换.
  2. 验证T(z1z2)=T(z1)T(z2).
  3. 你如何描述T的像?
练习6.VW是域F上的有限维向量空间. 证明VW同构当且仅当dimV=dimW.
练习7.VW是域F上的向量空间, U是一个从VW的同构. 证明TUTU1是一个从L(V,V)L(W,W)的同构.

第3.4节 通过矩阵表示变换

V是域F上的n维向量空间, 令W是域F上的m维向量空间. 令𝔅={α1,,αn}V的一个有序基, 令𝔅={β1,,βm}W的一个有序基. 如果T是任意的从VW的线性变换, 那么T由其施加于向量αj的作用决定. 每个向量Tαj皆可唯一地表示为βi的线性组合Tαj=i=1mAi,jβi其中A1,j,,Am,jTαj在有序基𝔅下的坐标. 于是, 变换T可由mn个标量Ai,j决定. 由A(i,j)=Ai,j定义的m×n矩阵A被称为T相对于有序基𝔅𝔅的矩阵. 我们即时的任务在于显式地理解矩阵A是如何决定线性变换T的.

如果α=x1α1++xnαnV中的一个向量, 那么Tα=T(j=1nxjαj)=j=1nxj(Tαj)=j=1nxji=1mAi,jβi=i=1m(j=1nAi,jxj)βi如果Xα在有序基𝔅下的坐标矩阵, 那么以上的计算表明AX是向量Tα在有序基𝔅下的坐标矩阵, 因为标量j=1nAi,jxj是列矩阵AXi行的元素. 让我们也观察到如果A是域F上任意的m×n矩阵, 那么T(j=1nxjαj)=i=1m(j=1nAi,jxj)βi定义了一个从VW的线性变换T, 并且其相对于𝔅𝔅的矩阵是A. 我们形式地总结如下:

定理11.V是域F上的n维向量空间, 令W是域F上的m维向量空间. 令𝔅={α1,,αn}V的一个有序基, 令𝔅={β1,,βm}W的一个有序基. 对于每个从VW的线性变换T, 存在一个域F上的m×n矩阵A满足[Tα]𝔅=A[α]𝔅对于每个V中向量α成立. 并且, TA是一个从所有从VW的线性变换构成的集合到所有域F上的m×n矩阵构成的集合的一一对应.

定理11中与T相关联着的矩阵A被称为T相对于有序基𝔅𝔅的矩阵. 注意到式子Tαj=i=1mAi,jβi是说矩阵A的列A1,,AnAj=[Tαj]𝔅,j=1,,n给出. 如果U是另一个从VW的线性变换, 并且B=[B1,,Bn]U相对于有序基𝔅𝔅的矩阵, 那么cA+BcT+U相对于有序基𝔅𝔅矩阵. 这是显然的, 因为cAj+Bj=c[Tαj]𝔅+[Uαj]𝔅=[cTαj+Uαj]𝔅=[(cT+U)αj]𝔅

定理12.V是域F上的n维向量空间, 令W是域F上的m维向量空间. 对于VW相应的每对有序基𝔅𝔅, 为线性变换T赋予其相对于𝔅𝔅的矩阵的函数是一个空间L(V,W)Fm×n之间的同构.
证明. 我们观察到这个函数是线性的 [译注: 就是上一段], 并且如定理11所言, 这个函数是L(V,W)Fm×n之间的双射.

我们将特别关心从一个空间到自身的线性变换的矩阵表示, 也就是线性算子的矩阵表示. 在这种情况下使用相同的基是方便的, 即取𝔅=𝔅. 我们将称这个表示矩阵为T相对于有序基𝔅的矩阵. 因为这个概念是如此重要, 以至于我们将重复这个定义. 如果T是有限维向量空间V上的一个线性算子而𝔅={α1,,αn}V的一个有序基, 那么T相对于𝔅的矩阵 (或者说, T在有序基𝔅下的矩阵) 是一个n×n矩阵A, 其元素Ai,j由式子Tαj=i=1nAi,jαi,j=1,,n定义. 读者必须记住这个表示T的矩阵依赖于有序基𝔅, 而V的每个有序基下都有一个T的表示矩阵. (如果是从一个空间V到另一个空间W的线性变换, 那就是依赖于两个有序基, 一个是V的有序基, 另一个是W的有序基.) 为了不忘记这个依赖关系, 我们将使用记号[T]𝔅表示线性算子T在有序基𝔅下的矩阵. 这个矩阵以及相关的有序基刻画T的方式在于对于每个V中的α[Tα]𝔅=[T]𝔅[α]𝔅.

例子13.V是域F上的n×1列矩阵构成的空间, 令W是域F上的m×1列矩阵构成的空间, 令A是域F上一个固定的m×n矩阵. 令T是一个从VW的线性变换, 由T(X)=AX定义. 令𝔅V的有序基, 其类似于Fn的标准有序基, 也就是说, 𝔅的第i个向量是n×1矩阵Xi, 其第i行是1, 而其他元素为0. 令𝔅W的有序基, 其定义方式与V的这个有序基类似. 那么, T相对于𝔅𝔅的矩阵就是A本身. 这是显然的, 因为矩阵AXj就是A的第j列.
例子14.F是一个域, 令TF2上的一个线性算子, 由T(x1x2)=(x1,0)定义. 令𝔅F2的标准有序基, 𝔅=(ε1,ε2). 既然Tε1=T(1,0)=(1,0)=1ε1+0ε2,Tε2=T(0,1)=(0,0)=0ε1+0ε2,那么T在有序基𝔅下的矩阵是[T]𝔅=[1000].
例子15.V是所有具有形式f(x)=c0+c1x+c2x2+c3x3的从的多项式函数构成的向量空间, 即次数小于等于三的多项式函数的空间. 例子2的微分算子D映射VV, 鉴于D是"降次的". 令𝔅V的有序基, 其由四个函数f1,f2,f3,f4构成, 通过fj(x)=xj1定义, 那么(Df1)(x)=0,Df1=0f1+0f2+0f3+0f4(Df2)(x)=1,Df2=1f1+0f2+0f3+0f4(Df3)(x)=2x,Df3=0f1+2f2+0f3+0f4(Df4)(x)=3x2,Df4=0f1+0f2+3f3+0f4于是D在有序基𝔅下的矩阵是[D]𝔅=[0100002000030000].

我们已经见过把变换相加时表示矩阵会怎么变化了, 即把矩阵相加. 现在我们想问把变换复合起来时会发生些什么. 更准确地说, 令V,W,Z是域F上相应维数为n,m,p的向量空间. 令T是一个从VW的线性变换, 令U是一个从WZ的线性变换. 设V,W,Z相应的有序基分别为𝔅={α1,,αn},𝔅={β1,,βm},𝔅={γ1,,γp}.AT相对于𝔅𝔅的矩阵, 令BU相对于𝔅𝔅的矩阵. 那么, 很容易看出来变换UT相对于𝔅𝔅的矩阵C就是BA的积. 这是因为, 如果αV中任意的向量, 那么[Tα]𝔅=A[α]𝔅,[U(Tα)]𝔅=B[Tα]𝔅于是[(UT)(α)]𝔅=(BA)[α]𝔅根据表示矩阵的定义和唯一性, 我们必有C=BA. 读者也可通过施行以下计算来看出这点.(UT)(αj)=U(Tαj)=U(k=1mAk,jβk)=k=1mAk,j(Uβk)=k=1mAk,ji=1pBi,kγi=i=1p(k=1mBi,kAk,j)γi于是我们必有Ci,j=k=1mBi,kAk,j.之前我们定义矩阵乘法的动机在于矩阵行上的操作. 这里我们看到线性变换的复合也提供了强烈的动机. 让我们形式化地总结一下这个结果.

定理13.V,W,Z是域F上的有限维向量空间. 令T是从VW的线性变换, U是从WZ的线性变换. 如果𝔅,𝔅,𝔅分别是V,W,Z的有序基, 如果AT相对于𝔅𝔅的矩阵, BU相对于𝔅𝔅的矩阵, 那么变换的复合UT相对于𝔅𝔅的矩阵是积C=BA.

注意到定理13给我们了一个矩阵乘法是结合运算的证明, 这个证明不需要计算, 并且独立于我们在第1章给出的证明. 我们还应该指出我们在例子10中证明了定理13的特殊情况. [译注: 原文是例子12, 疑似应该是例子10.]

如果TU是空间V上的线性算子, 并且我们以单一的有序基𝔅表示这两个变换, 那么定理13呈现出特别简单的形式[UT]𝔅=[U]𝔅[T]𝔅. 因此, 在这种情况下由𝔅所决定的算子和矩阵之间的对应不仅是向量空间的同构, 还保持乘法. 这个事实的一个简单推论是线性算子T可逆当且仅当矩阵[T]𝔅可逆. 这是因为恒等算子I在任意的有序基下都由恒等矩阵表示, 于是UT=TU=I等价于[U]𝔅[T]𝔅=[T]𝔅[U]𝔅=I.当然, T可逆时有[T1]𝔅=[T]𝔅1.

现在我们想要探究当有序基改变时表示矩阵会怎样变化. 为了简单起见, 我们将只考虑空间V上的线性算子, 于是我们可以只使用一个有序基. 我们想问的特定问题如下. 令T是有限维向量空间V上的一个线性算子, 并令𝔅={α1,,αn}𝔅={α1,,αn}V的两个有序基. 矩阵[T]𝔅[T]𝔅之间有什么联系呢? 正如我们在第2章所观察到的那样, 存在一个唯一的n×n(可逆)矩阵P满足对于每个V的向量α[α]𝔅=P[α]𝔅.这个矩阵即P=[P1,,Pn], 其中Pj=[αj]𝔅. 根据定义,[Tα]𝔅=[T]𝔅[α]𝔅.将坐标变换公式应用于Tα, 我们就得到[Tα]𝔅=P[Tα]𝔅.结合这三个式子, 我们有[T]𝔅P[α]𝔅=P[Tα]𝔅或是P1[T]𝔅P[α]𝔅=[Tα]𝔅因此就得到[T]𝔅=P1[T]𝔅P.这回答了我们的问题.

在形式化陈述这个结果之前, 让我们观察一下以下事实. 存在唯一的一个线性算子U将有序基𝔅映射成𝔅, 其由Uαj=αj,j=1,,n定义. 这个算子U是可逆的, 因为它将V的一个基映射至V的另一个基. 上面的矩阵P恰是U在有序基𝔅下的表示, 因为P是由αj=i=1nPi,jαi定义的, 既然Uαj=αj, 这个式子也可以写成Uαj=i=1nPi,jαi于是P=[U]𝔅, 根据定义.

定理14.V是一个域F上的有限维向量空间. 令𝔅={α1,,αn}𝔅={α1,,αn}V的有序基. 设TV上的一个线性算子. 如果P=[P1,,Pn]是一个以Pj=[αj]𝔅为列的n×n矩阵, 那么[T]𝔅=P1[T]𝔅P.或者说, 如果U是由Uαj=αj,j=1,,n定义的V上的可逆线性算子, 那么[T]𝔅=[U]𝔅1[T]𝔅[U]𝔅.
例子16.T2上由T(x1,x2)=(x1,0)定义的线性算子. 在例子14中我们表明T在标准有序基𝔅={ε1,ε2}下的矩阵是[T]𝔅=[1000].𝔅2的有序基, 其由向量ε1=(1,1)ε2=(2,1)构成, 那么ε1=ε1+ε2,ε2=2ε1+ε2于是P是矩阵P=[1211].根据简单的计算P1=[1211].因此[T]𝔅=P1[T]𝔅P=[1211][1000][1211]=[1211][1200]=[1212]我们很容易验证这是正确的, 因为Tε1=(1,0)=ε1+ε2,Tε2=(2,0)=2ε1+2ε2.
例子17.V是从的次数小于等于3的多项式函数构成的向量空间. 如例子15, 令DV上的微分算子, 并令𝔅={f1,f2,f3,f4}V的有序基, 其由fi(x)=xi1定义. 令t是一个实数, 定义gi(x)=(x+t)i1, 即g1=f1g2=tf1+f2g3=t2f1+2tf2+f3g4=t3f1+3t2f2+3tf3+f4既然矩阵P=[1tt2t3012t3t20013t0001]很容易看出来是可逆的, 并有P1=[1tt2t3012t3t20013t0001]从中我们得知𝔅={g1,g2,g3,g4}V的一个有序基. 在例子15里, 我们发现D在有序基𝔅下的矩阵为[D]𝔅=[0100002000030000].因此D相对于有序基𝔅的矩阵为P1[D]𝔅P=[1tt2t3012t3t20013t0001][0100002000030000][1tt2t3012t3t20013t0001]=[1tt2t3012t3t20013t0001][012t3t20026t00030000]=[0100002000030000]于是D在有序基𝔅𝔅下由相同的矩阵表示. 当然, 或许我们可以更直接地看出这点来, 因为Dg1=0,Dg2=g1,Dg3=2g2,Dg4=3g3.这个例子刻画了很好的一点. 如果读者已知一个线性算子在某个有序基𝔅下的矩阵, 并想要找出其在另一个有序基𝔅下的矩阵, 经常的情况是使用可逆矩阵P施行坐标变换是最方便的. 然而, 有时直接诉诸定义来寻找表示矩阵可能要简单得多.
定义.AB是域F上的n×n矩阵. 我们称BF上相似于A, 如果存在一个域F上的可逆矩阵P满足B=P1AP.

根据定理14, 我们知道: 如果V是一个域F上的n维向量空间而𝔅𝔅V的两个有序基, 那么对于每个V上的线性算子T, 矩阵B=[T]𝔅相似于矩阵A=[T]𝔅. 我们也可以从另一个方向看待这个事情. 设AB是域F上的n×n矩阵, 令𝔅V的一个有序基. 令TV上的线性算子, 其在基𝔅下由A表示. 如果B=P1AP, 令𝔅是经P𝔅得到的V的有序基, 即αj=i=1nPi,jαi,那么T在有序基𝔅下的矩阵就是B.

因此, 陈述B相似于A意味着在每个域F上的n维空间上, 矩阵AB在两个(可能)不同的有序基下表示着相同的线性变换.

注意到每个n×n矩阵A都相似于自身, 只需令P=I; 如果B相似于A, 那么A相似于B, 因为B=P1AP可以推出A=(P1)1BP1; 如果B相似于AC相似于B, 那么C相似于A, 因为B=P1APC=Q1BQ可以推出C=(PQ)1A(PQ). 因此, 相似性是域F上的n×n矩阵的集合上的一个等价关系. 读者还应该注意到唯一与恒等矩阵I相似的矩阵就是I本身, 唯一与零矩阵相似的矩阵就是零矩阵本身.

练习1.T2上由T(x1,x2)=(x1,x2)定义的线性算子. 令𝔅2的标准有序基而𝔅={α1,α2}是由α1=(1,i),α2=(i,2)定义的有序基.
  1. T相对于𝔅𝔅的矩阵是什么?
  2. T相对于𝔅𝔅的矩阵是什么?
  3. T在有序基𝔅下的矩阵是什么?
  4. T在有序基{α2,α1}下的矩阵是什么?
练习2.T是从32的线性变换, 其由T(x1,x2,x3)=(x1+x2,2x3x1)定义.
  1. 如果𝔅3的标准有序基而𝔅2的标准有序基, 那么T相对于𝔅𝔅的矩阵是什么?
  2. 如果𝔅={α1,α2,α3}𝔅=(β1,β2), 其中α1=(1,0,1),α2=(1,1,1),α3=(1,0,0),β1=(0,1),β2=(1,0)T相对于𝔅𝔅的矩阵是什么?
练习3.TFn上的线性算子, 令ATFn的标准基下的矩阵, 令W是由A的列向量张成的Fn的子空间. 请问WT有何关系?
练习4.V是域F上的一个二维向量空间, 令𝔅V的一个有序基. 如果TV上的一个线性算子, 并且[T]𝔅=[abcd]证明T2(a+d)T+(adbc)I=0.
练习5.T3上的线性算子, 其在标准有序基下的矩阵为A=[121011134].找出T的像的一个基和T的零空间的一个基.
练习6.T2上由T(x1,x2)=(x2,x1)定义的线性算子.
  1. T2的标准基下的矩阵是什么?
  2. T在有序基𝔅={α1,α2}下的矩阵是什么, 其中α1=(1,2)α2=(1,1)?
  3. 证明对于每个实数c, 算子(TcI)都是可逆的.
  4. 证明如果𝔅2任意的有序基并且[T]𝔅=A, 那么A1,2A2,10.
练习7.T3上的线性算子, 由T(x1,x2,x3)=(3x1+x3,2x1+x2,x1+2x2+4x3)定义.
  1. T3的标准有序基下的矩阵是什么?
  2. T在有序基{α1,α2,α3}下的矩阵是什么, 其中α1=(1,0,1),α2=(1,2,1),α3=(2,1,1)?
  3. 证明T是可逆的, 并如定义T一样给出T1的规则.
练习8.θ是一个实数. 证明以下两个矩阵在复数域上是相似的:[cosθsinθsinθcosθ],[eiθ00eiθ](提示: 令T2上的线性算子, 其在标准有序基下由第一个矩阵表示. 接着, 找出向量α1α2使得Tα1=eiθα1,Tα2=eiθα2并且{α1,α2}是一个基.)
练习9.V是域F上的一个有限维向量空间. 令STV上的线性算子. 我们问: 什么时候存在V的有序基𝔅𝔅使得[S]𝔅=[T]𝔅? 证明这样的基存在当且仅当存在一个V上的可逆线性算子U使得T=USU1. (证明大纲: 如果[S]𝔅=[T]𝔅, 令U是将𝔅映射成𝔅的线性算子, 然后表明S=UTU1. 反过来, 如果对于某个可逆的UT=USU1, 令𝔅V任意的有序基, 令𝔅是其在U下的像 [译注: 当然要保持顺序], 然后表明[S]𝔅=[T]𝔅.)
练习10. 我们已经知道由T(x1,x2)=(x1,0)定义的2上的线性算子T在标准有序基下由矩阵A=[1000]表示. 这个算子满足T2=T. 证明如果S是一个2上满足S2=S的线性算子, 那么S=0, 或者S=I, 或者存在2的一个有序基使得[S]𝔅=A.
练习11.W是域F上所有n×1矩阵构成的空间. 如果A是域F上的一个n×n矩阵, 那么A通过左乘定义了一个W上的线性算子LA: LA(X)=AX. 证明每个W上的线性算子都是左乘某个n×n矩阵, 即是对于某个矩阵A而言的LA.
现在设V是域F上的一个n维向量空间, 令𝔅V的一个有序基. 对于每个V中的α, 定义Uα=[α]𝔅. 证明U是一个从VW的线性算子. 如果T是一个V的线性算子, 那么UTU1是一个W上的线性算子. 于是, UTU1是一个左乘某个n×n矩阵A的变换, 那么A是什么呢?
练习12.V是域F上的一个n维向量空间, 令𝔅={α1,,αn}V的一个有序基.
  1. 根据定理1, 存在唯一的V上的线性算子T满足Tαj=αj+1,j=1,,n1,Tαn=0.T在有序基𝔅下的矩阵A是什么?
  2. 证明Tn=0但是Tn10.
  3. SV上任意的满足Sn=0但是Sn10的线性算子. 证明存在V的有序基𝔅使得S𝔅下的表示是a里的矩阵A.
  4. 证明如果MN是域F上满足Mn=Nn=0但是Mn10Nn10n×n矩阵, 那么MN是相似的.
练习13.VW是域F上的有限维向量空间. 令T是一个从VW的线性变换. 如果𝔅={α1,,αn}𝔅={β1,,βm}分别是VW的有序基, 如定理5的证明一样定义线性变换Ep,q: Ep,q(αi)=δi,qβp, 那么Ep,q,1pm,1qn构成了L(V,W)的一个基, 并且对于特定的标量Ap,qT=p=1mq=1nAp,qEp,q.Ap,qT在这个L(V,W)的基下的坐标. 证明以A(p,q)=Ap,q为元素的矩阵A就恰是T相对于𝔅𝔅的表示矩阵.

第3.5节 线性泛函

如果V是一个域F上的向量空间, 那么从V到标量域F的线性变换f也被称为V上的线性泛函. 如果我们从头开始, 那么这意味着f是一个从VF的函数, 并且满足f(cα+β)=cf(α)+f(β)对于所有V中的αβ以及所有F中的标量c成立. 线性泛函这个概念的重要性在于它有助于组织和澄清关于子空间, 线性方程和坐标的讨论.

例子18.F是一个域而a1,,anF中标量, 我们根据f(x1,,xn)=a1x1++anxn定义一个Fn上的函数f, 那么fFn上的一个线性泛函. 它是这样的泛函, 其在Fn的标准有序基和F的基{1}下由矩阵[a1an]表示:aj=f(εj),j=1,,n.[译注: 其实{1}就是F的标准有序基.] 每个Fn上的线性泛函都具有这种形式, 对于某些标量a1,,an而言. 这是由线性泛函的定义立即得到的, 因为如果我们定义aj=f(εj)并使用线性性质, 那么f(x1,,xn)=f(j=1nxjεj)=j=1nxjf(εj)=j=1najxj
例子19. 这里给出一个线性泛函的重要例子. 令n是一个正整数而F是一个域, 如果A是一个以F中标量为元素的n×n矩阵, 那么A的迹是标量tr(A)=A1,1+A2,2++An,n.迹函数是一个矩阵空间Fn×n上的线性泛函, 因为tr(cA+B)=i=1n(cAi,i+Bi,i)=ci=1nAi,i+i=1nBi,i=ctr(A)+tr(B)
例子20.V是所有从域F到自身的多项式函数构成的空间. 令tF的一个元素. 如果我们定义Lt(p)=p(t)那么Lt是一个V上的线性泛函. 人们经常这样描述这个泛函, 对于每个t, "在t处求值"是一个多项式函数空间上的线性泛函. 或许我们应该指出, 在这个例子里多项式函数实际上并不发挥任何作用, 对于所有从FF的函数构成的空间, 在t处求值同样也是一个线性泛函.
例子21. 这或许是数学中最重要的线性泛函. 令[a,b]是实轴上的一个闭区间, C([a,b])[a,b]上的连续实值函数构成的空间, 那么L(g)=abg(t)dt定义了一个C([a,b])上的线性泛函L.

如果V是一个向量空间, 那么所有V上的线性泛函自然地构成了一个向量空间, 此即L(V,F), 我们记作V并将其称为V的对偶空间:V=L(V,F).

如果V是有限维的, 那么我们可以得到一个对于对偶空间V相当显式的描述. 从定理5我们知道了一件关于V的事情, 即dimV=dimV.𝔅={α1,,αn}V的一个基. 根据定理1, (对于每个i)存在唯一的V上的线性泛函fi满足fi(αj)=δi,j.用这种方法我们从𝔅得到了n个不同的V上的线性泛函f1,,fn. 这些泛函也是线性无关的, 因为若设f=i=1ncifi那么f(αj)=i=1ncifi(αj)=i=1nciδi,j=cj特别地, 如果f是零泛函, 那么对于每个jf(αj)=0, 因此标量cj都是0. 现在f1,,fnn个线性无关的泛函, 而且我们知道V的维数是n, 那么𝔅={f1,,fn}必然是V的一个基, 其被称为𝔅的对偶基.

定理15.V是域F上的一个有限维向量空间, 令𝔅={α1,,αn}V的一个基. 那么, 存在唯一的V的对偶基𝔅={f1,,fn}, 其满足fi(αj)=δi,j. 对于每个V上的线性泛函f, 我们有f=i=1nf(αi)fi以及对于每个V中的α, 我们有α=i=1nfi(α)αi.
证明. 上面我们已经说明了存在唯一的基与𝔅"对偶". 如果f是一个V上的线性泛函, 那么f即是fi的某个线性组合, 并且我们观察到标量cj必然由cj=f(αj)给出. 类似地, 如果α=i=1nxiαiV的一个向量, 那么fj(α)=i=1nxifj(αi)=i=1nxiδi,j=xj因此α作为αi的线性组合的唯一表达为α=i=1nfi(α)αi.

上面这个式子给我们提供了一种刻画对偶基的绝佳方式. 它是说, 如果𝔅={α1,,αn}V的一个有序基, 并且𝔅={f1,,fn}是其对偶基, 那么fi就恰是那个赋予V中的向量α相对于有序基𝔅的第i个坐标的函数. 因此, 我们也可以将fi称为𝔅的坐标函数. 定理15实际上告诉了我们以下事实: 如果fV中而令f(αi)=ai, 那么当α=x1α1++xnαn时, 我们有f(α)=a1x1++anxn.换言之, 如果我们选定了V的一个有序基𝔅并描述V中的每个向量以其相对于𝔅n元坐标组(x1,,xn), 那么每个V上的线性泛函都具有f(α)=a1x1++anxn的形式. 这是例子18的自然泛化, 其为V=Fn𝔅={ε1,,εn}的特别情形.

例子22.V是所有从的次数小于等于2的多项式函数构成的向量空间, 令t1,t2,t3是三个不同的实数, 令Li(p)=p(ti).那么, L1,L2,L3V上的线性泛函. 这些线性泛函是线性无关的, 因为若设L=c1L1+c2L2+c3L3L=0时, 即对于每个V中的p都有L(p)=0, 那么应用L于特定的多项式"函数"1,x,x2, 我们就得到{c1+c2+c3=0t1c1+t2c2+t3c3=0t12c1+t22c2+t32c3=0从中我们得到c1=c2=c3=0, 因为(根据简单的计算可知)矩阵[111t1t2t3t12t22t32]t1,t2,t3互异时是可逆的. 既然Li是线性无关的并且V的维数是3, 这些泛函构成了V的一个基. 它是什么V的基的对偶呢? 这样一个V的基{p1,p2,p3}必然满足Li(pj)=δi,j或者说pj(ti)=δi,j.很容易看出这些多项式函数应该是p1(x)=(xt2)(xt3)(t1t2)(t1t3),p2(x)=(xt1)(xt3)(t2t1)(t2t3),p3(x)=(xt1)(xt2)(t3t1)(t3t2).V的基{p1,p2,p3}是有趣的, 因为根据定理15, 对于每个V中的p我们有p=p(t1)p1+p(t2)p2+p(t3)p3.因此, 如果c1,c2,c3是任意的实数, 那么恰存在唯一的上的次数至多为2的多项式函数p满足p(tj)=cj,j=1,2,3. 这个多项式函数为p=c1p1+c2p2+c3p3.

现在让我们来讨论线性泛函和子空间之间的关系. 如果f是一个非零的线性泛函, 那么f的秩就是1, 因为其像是标量域的非零子空间, 必然是标量域本身. 如果潜在的空间V是有限维的, 那么秩加零化度定理 (定理2) 告诉我们零空间Nf的维数dimNf=dimV1.

在一个n维空间中, 具有n1维的子空间被称为超空间. 这样的空间有时也被称为超平面或者余维数为1的子空间. 每个超空间都是某个线性泛函的零空间吗? 答案很容易看出来是yes. 而且, 证明以下事实也并不更加困难. n维空间的每个d维子空间都是(nd)个线性泛函的零空间之交. (下面的定理16)

定义. 如果V是域F上的向量空间而SV的一个子集, S的零化子S0V上所有这样的线性泛函f构成的集合, 其对于每个S中的αf(α)=0.

读者应该很容易看出S0V的子空间, 不论S是否是V的子空间. 如果S仅包含零向量, 那么S0=V. 如果S=V, 那么S0V的零子空间. (在V是有限维的情况下很容易看出来.)

定理16.V是域F上的有限维向量空间, 令WV的子空间, 那么dimW+dimW0=dimV.
证明.kW的维数而{α1,,αk}W的一个基. 选择V中向量αk+1,,αn使得{α1,,αn}V的一个基. 令{f1,,fn}V的基, 其对偶于这个V的基. 我们现在证明{fk+1,,fn}是零化子W0的一个基. 显然对于ik+1我们知道fi属于W0, 因为fi(αj)=δi,j于是当ik+1jk时有δi,j=0. 从中我们可知当αα1,,αk的线性组合时, 对于ik+1fi(α)=0. 因为泛函{fk+1,,fn}是线性无关的, 所以剩下来我们必须要做的就是证明它们可以张成W0. 设fV中, 既然f=i=1nf(αi)fi,于是若fW0中, 我们有f(αi)=0对于ik成立, 那么f=i=k+1nf(αi)fi.我们证明了如果dimW=kdimV=n, 那么dimW0=nk.
推论. 如果Wn维向量空间Vk维子空间, 那么WV(nk)个超空间之交.
证明. 这是定理16证明的推论而不是定理16本身的推论. 在这个证明的记号下, W恰是满足fi(α)=0,i=k+1,,n的所有向量α的集合. 在k=n1的情形, W即是fn的零空间.
推论. 如果W1W2是某个有限维向量空间的子空间, 那么W1=W2当且仅当W10=W20.
证明. 如果W1=W2, 那么显然有W10=W20. 如果W1W2, 那么其中之一的子空间包含有不在另一个子空间的向量. 不妨设向量αW2之中但不在W1中. 根据前面的推论 (或者定理16的证明), 存在一个线性泛函f满足对于所有的W1βf(β)=0f(α)0, 那么fW10之中但不在W20中, 即W10W20.

接下来的一节我们将给出这两个推论的不同的证明. 第一个推论是说, 如果我们挑选了空间的某个有序基, 那么每个k维的子空间都可以由(nk)个相对于基的坐标上的齐次线性条件刻画.

让我们从线性泛函的视角简要看看齐次线性方程组. 设我们有一个想要求解的齐次线性方程组{A1,1x1++A1,nxn=0Am,1x1++Am,nxn=0如果我们令fi,i=1,,m是由fi(x1,,xn)=Ai,1x1++Ai,nxn定义的Fn上的线性泛函, 那么其实我们就是在寻找一个Fn的子空间, 其由所有满足fi(α)=0,i=1,,mα构成. 换言之, 我们在寻找被f1,,fm零化的子空间. 对于系数矩阵进行行规约为我们提供了找出这个子空间的系统方法. n元组(Ai,1,,Ai,n)给出了线性泛函fi相对于与Fn的标准基对偶的基的坐标. 系数矩阵的行空间因此可被视为由f1,,fm张成的线性泛函的空间, 而解空间是被这个泛函的空间零化的子空间.

现在我们或许可以从"对偶"的角度看待线性方程组, 即给定Fn中的m个向量αi=(Ai,1,,Ai,n)我们希望寻找由这些向量张成的子空间的零化子. 既然Fn上一个典型的线性泛函具有形式f(x1,,xn)=c1x1++cnxn那么f在这个零化子之中的条件即j=1nAi,jcj=0,i=1,,m换言之, (c1,,cn)是线性方程组AX=0的一个解. 从此观点来看, 行规约为我们提供了一种系统性的方法来寻找由给定的Fn的有限子集张成的子空间的零化子.

例子23. 现在我们给出4上的三个线性泛函:f1(x1,x2,x3,x4)=x1+2x2+2x3+x4f2(x1,x2,x3,x4)=2x2+x4f3(x1,x2,x3,x4)=2x14x3+3x4它们所零化的子空间可以通过显式寻找矩阵A=[122102012043]的行简化阶梯形式得到. 经过简单的计算, 或者看看第2章的例子21, 我们知道R=[102001000001].因此, 线性泛函g1(x1,x2,x3,x4)=x1+2x3g2(x1,x2,x3,x4)=x2g3(x1,x2,x3,x4)=x4f1,f2,f3张成了相同的(4)的子空间, 并且零化了相同的4的子空间. 被零化的子空间由所有满足x1=2x3,x2=x4=0的向量构成.
例子24.W是由α1=(2,2,3,4,1),α2=(1,1,2,5,2),α3=(0,0,1,2,3),α4=(1,1,2,3,0)张成的5的子空间. 人们该如何描述W0, 即W的零化子呢? 让我们构造一个以α1,α2,α3,α4为行向量的矩阵A, 并找出行等价于A的行简化阶梯矩阵R:A=[22341112520012311230]R=[11010001200000100000].如果f5上的一个线性泛函:f(x1,,x5)=j=15cjxj那么fW0中当且仅当f(αi)=0,i=1,2,3,4, 即当且仅当j=15Ai,jcj=0,1i4.这等价于j=15Ri,jcj=0,1i3或者c1c2c4=0c3+2c4=0c5=0我们可以通过给c2c4赋任意的值以得到所有这样的线性泛函f, 例如令c2=ac4=b, 然后找出相应的c1=a+b,c3=2b,c5=0. 于是, W0由所有具有形式f(x1,x2,x3,x4,x5)=(a+b)x1+ax22bx3+bx4的线性泛函f构成. W0的维数是2, 而W0的一个基{f1,f2}可由先令a=1,b=0再令a=0,b=1得到:f1(x1,,x5)=x1+x2f2(x1,,x5)=x12x3+x4上面W0中一般的ff=af1+bf2.
练习1.3中, 令α1=(1,0,1),α2=(0,1,2),α3=(1,1,0).
  1. 如果f3上满足f(α1)=1,f(α2)=1,f(α3)=3的线性泛函, 并且α=(a,b,c), 找出f(α).
  2. 显式描述3上满足f(α1)=f(α2)=0但是f(α3)0的线性泛函f.
  3. f是任意的满足f(α1)=f(α2)=0并且f(α3)0的线性泛函. 如果α=(2,3,1), 表明f(α)0.
练习2.𝔅={α1,α2,α3}3的基, 其由α1=(1,0,1),α2=(1,1,1),α3=(2,2,0)定义. 找出𝔅的对偶基.
练习3. 如果AB是域F上的n×n矩阵, 证明trace(AB)=trace(BA), 接着证明相似矩阵有着相同的迹.
练习4.V是从的所有次数小于等于2的多项式函数p:p(x)=c0+c1x+c2x2构成的向量空间. 定义三个V上的线性泛函如下:f1(p)=01p(x)dx,f2(p)=02p(x)dx,f3(p)=01p(x)dx.证明{f1,f2,f3}V的基, 通过找出以其为对偶的V的基.
练习5. 如果ABn×n的复矩阵, 证明ABBA=I是不可能的.
练习6.mn是正整数而F是一个域. 令f1,,fmFn上的线性泛函. 对于Fn中的α, 定义Tα=(f1(α),,fm(α)).证明T是一个从FnFm的线性变换, 接着表明每个从FnFm的线性变换都具有以上形式, 对于特定的f1,,fm而言.
练习7.α1=(1,0,1,2)α2=(2,3,1,1), 令Wα1α2张成的4的子空间. 哪些线性泛函f:f(x1,x2,x3,x4)=c1x1+c2x2+c3x3+c4x4W的零化子之中呢?
练习8.W5的子空间, 其由下列向量张成:α1=ε1+2ε2+ε3,α2=ε2+3ε3+3ε4+ε5,α3=ε1+4ε2+6ε3+4ε4+ε5.找出W0的一个基.
练习9.V是实数域上的所有2×2矩阵的向量空间, 令B=[2211].WV的子空间, 其由所有满足AB=0的矩阵A构成. 令fV上的线性泛函, 其在W的零化子之中. 设f(I)=0f(C)=3, 其中I2×2的恒等矩阵而C=[0001].找出f(B).
练习10.F是复数域的一个子域. 我们通过fk(x1,,xn)=j=1n(kj)xj,1kn定义Fn上的n个线性泛函, 其中n2. 由f1,,fn零化的子空间维数是多少呢?
练习11.W1W2是有限维向量空间V的子空间.
  1. 证明(W1+W2)0=W10W20.
  2. 证明(W1W2)0=W10+W20.
练习12.V是域F上的一个有限维向量空间. 令WV的一个子空间. 如果fW上的线性泛函, 证明存在一个V上的线性泛函g满足对于每个W中的αg(α)=f(α).
练习13.F是复数域的一个子域. 令V是域F上任意的向量空间. 设fgV上的线性泛函, 并且满足由h(α)=f(α)g(α)定义的函数h仍然是V上的线性泛函. 证明f=0g=0.
练习14.F是特征为零的域. 令V是域F上的一个有限维向量空间. 如果α1,,αmV中有限多个向量, 并且每个都异于零向量, 证明存在V上的线性泛函f满足f(αi)0,i=1,,m.
练习15. 根据练习3, 相似的矩阵拥有相同的迹. 因此, 我们可以将有限维空间上的线性算子的迹定义为其在任意有序基下的矩阵的迹. 这是良定的, 因为所有这样的表示矩阵都是相似的.
现在令V是域F上的2×2矩阵的向量空间, 令P是一个固定的2×2矩阵. 令T是由T(A)=PA定义的V上的线性算子. 证明trace(T)=2trace(P).
练习16. 证明n×n矩阵上的迹泛函在以下意义上唯一. 如果W是域F上的n×n矩阵的空间, 如果fW上满足对于W中的每个ABf(AB)=f(BA)的线性泛函, 那么f是迹函数的标量倍数. 另外, 如果f(I)=n, 那么f就是迹函数.
练习17.W是域F上的n×n矩阵的空间. 令W0是由所有具有形式C=ABBA的矩阵C张成的子空间. 证明W0恰好就是迹为零的矩阵构成的子空间. (提示: 迹为零的矩阵的空间的维数是什么? 使用矩阵"单元", 即恰具有一个非零元素的矩阵, 来构造足够多具有ABBA形式的线性无关的矩阵.)

第3.6节 二次对偶

上一节我们还有一个没有回答的问题, 即是否每个V的基都是某个V的基的对偶. 一种回答这个问题的方式是考虑V⁎⁎, 即V的对偶空间.

如果αV中的一个向量, 那么α导出了一个V上的线性泛函, 即Lα(f)=f(α),fV.Lα是线性的这一事实不过就是对于V中的线性泛函的定义的重述:Lα(cf+g)=(cf+g)(α)=(cf)(α)+g(α)=cf(α)+g(α)=cLα(f)+Lα(g)如果V是有限维的并且α0, 那么Lα0. 换言之, 存在线性泛函f满足f(α)0. 证明非常简单, 在第3.5节已经给过了: 选择一个V的有序基𝔅={α1,,αn}, 其中α1=α, 令f是赋予每个V中向量其在有序基𝔅下的坐标的第一分量的线性泛函. [译注: 换句话说, f即满足f(α1)=1f(αi)=0,2in的存在且唯一的那个线性泛函.]

定理17.V是域F上的一个有限维向量空间. 对于每个V中的向量α, 定义Lα(f)=f(α),fV.映射αLα是一个从VV⁎⁎的同构.
证明. 我们已经证明过对于每个α函数Lα是线性的了. 设αβV中而cF中, 令γ=cα+β, 那么对于V中的每个fLγ(f)=f(γ)=f(cα+β)=cf(α)+f(β)=cLα(f)+Lβ(f)=(cLα+Lβ)(f)于是Lγ=cLα+Lβ.这表明映射αLα是一个从VV⁎⁎的线性变换. 这个变换是非奇异的, 因为根据之前的评注, Lα=0当且仅当α=0. 既然αLα是从VV⁎⁎的非奇异的线性变换, 并且dimV⁎⁎=dimV=dimV定理9告诉我们这个变换是可逆的, 因而是一个从VV⁎⁎的同构.
推论.V是域F上的一个有限维向量空间. 如果LV的对偶空间V上的一个线性泛函, 那么V中存在唯一的向量α满足L(f)=f(α)对于V中的每个f成立.
推论.V是域F上的一个有限维向量空间. 每个V的基都是某个V的基的对偶.
证明.𝔅={f1,,fn}V的一个基. 根据定理15, 存在V⁎⁎的一个基{L1,,Ln}满足Li(fj)=δi,j.使用上面的推论, 对于每个i存在V中唯一的向量αi满足Li(f)=f(αi)对于V中的每个f成立, 即Li=Lαi. 立刻就能得到{α1,,αn}V的一个基, 并且𝔅是这个基的对偶.

在定理17的观点下, 我们通常将αLα视为等同的, 并称V"是"V的对偶空间或者说空间VV自然地相互对偶. 上面的推论中, 我们描述了该定理是怎样可能有用的. 下面我们给出更进一步的刻画.

如果EV的一个子集, 那么零化子E0(从技术上说)是V⁎⁎的一个子集. 如果我们选择如定理17那样将VV⁎⁎视为等同的, 那么E0是一个V的一个子空间, 即所有满足对于每个E中的ff(α)=0V中向量α构成的集合. 在定理16的一个推论中我们注意到每个子空间W是由其零化子W0决定的. 然而是怎样决定的呢? 答案是W是被所有W0中的f零化的子空间 [译注: 这个也是定理16的推论], 即所有W0中的f的零空间之交. 在我们现有的零化子的记号下, 这个定理可以被简单地陈述为: W=(W0)0.

定理18. 如果S是有限维向量空间V的子集, 那么(S0)0是由S张成的子空间.
证明.W是由S张成的子空间. 显然W0=S0. 因此, 我们要证明的是W=W00. 我们已经给出了一个证明, 现在我们给出另一个. 根据定理16, 我们有dimW+dimW0=dimV,dimW0+dimW00=dimV既然dimV=dimV, 于是dimW=dimW00.因为WW00的子空间, 所以我们知道W=W00.

本节的结果对于任意的向量空间也是成立的. 然而, 证明就需要使用所谓的选择公理 (Axiom of Choice). 我们想避免被卷入对于这个公理的冗长讨论之中, 所以我们不会对于一般的向量空间处理零化子的结果. 然而, 有两个关于一般向量空间上的线性泛函的结果是如此基本, 以至于我们要涵盖它们.

V是一个向量空间. 我们想要定义V中的超空间. 除非V是有限维的, 否则我们不能通过维数来定义超空间. 但是, 我们可以用以下的方式来表达一个空间N差一个维度就能填满V的想法:

  1. NV的一个真子空间;
  2. 如果W是一个包含N的子空间, 那么要么W=N要么W=V.
条件1和2表达了N是一个真子空间并且没有更大的真子空间, 换言之, N是极大的真子空间.

定义. 如果V是一个向量空间, 那么V中的一个超空间就是V的一个极大的真子空间.
定理19. 如果f是向量空间V上的一个非零的线性泛函, 那么f的零空间就是V中的一个超空间. 反过来说, 每个V中的超空间都是某个V上(并不唯一的)非零的线性泛函的零空间.
证明.fV上一个非零的线性泛函, 并且Nf是其零空间. 我们令α是一个不在Nf中的V的向量, 即一个满足f(α)0的向量. 我们将证明V中的每个向量都在Nfα张成的子空间之中. 这个子空间由所有具有形式γ+cα,γNf,cF的向量构成. 令βV中的向量, 定义c=f(β)f(α)这个定义是合理的, 因为f(α)0. 那么, γ=βcαNf之中, 因为f(γ)=f(βcα)=f(β)cf(α)=0于是β在由Nfα张成的子空间中.
现在令NV中的一个超空间. 固定α为某个不在N中的向量. 既然N是极大的真子空间, 那么由Nα张成的子空间就是整个空间V. 因此, 每个V中的向量β都具有形式β=γ+cα,γN,cF.向量γ和标量c是由β唯一确定的. 如果我们也有β=γ+cα,γN,cF,那么(cc)α=γγ.如果cc0, 那么α就应该在N中了, 因而有c=cγ=γ. 另一种表述这个结论的方式如下: 如果βV中, 那么存在唯一的标量c使得βcαN中. 称这个标量为g(β). 很容易看出来gV上的一个线性泛函并且Ng的零空间.
引理. 如果fg是一个向量空间V上的线性泛函, 那么gf的标量倍数当且仅当g的零空间包含f的零空间, 即当且仅当f(α)=0可以推出g(α)=0.
证明. 如果f=0, 那么也有g=0, g平凡地是f的标量倍数. 设f0, 于是其零空间NfV中的一个超空间. 选择V中的某个向量α使得f(α)0, 并且令c=g(α)f(α).线性泛函h=gcfNf上是0, 因为fg在其上都是0. 并且, 我们还有h(α)=g(α)cf(α)=0. 因此, h在由Nfα张成的子空间上都是0, 而这个子空间就是V. 于是, 我们得出结论h=0, 即g=cf.
定理20.g,f1,,fr是向量空间V上的线性泛函, 设其相应的零空间分别为N,N1,,Nr. 那么, gf1,,fr的线性组合当且仅当 (if and only if) N包含交集N1Nr.
证明. 如果g=c1f1++crfr且对于每个ifi(α)=0, 那么显然g(α)=0. 因此, N包含N,N1,,Nr.
我们将通过数字r上的归纳证明另一个方向 (定理的"if"一半). 之前的引理处理了r=1的情况. 设我们已知结果对于r=k1成立, 并且令f1,,fk是分别以N1,,Nk为零空间的线性泛函, 满足N1NkN的子集, Ng的零空间. 令g,f1,,fk1分别是g,f1,,fk1于子空间Nk上的限制, 那么g,f1,,fk1是向量空间Nk上的线性泛函. 而且, 如果α是一个Nk中的向量并有fi(α)=0,i=1,,k1, 那么αN1Nk之中, 因而有g(α)=0. 根据归纳 (r=k1的情形), 存在标量ci满足g=c1f1++ck1fk1.现在令h=gi=1k1cifi,那么h是一个V上的线性泛函, 并且h的定义告诉我们对于每个Nk中的αh(α)=0. 根据之前的引理, hfk的一个标量倍数. 如果h=ckfk, 那么g=i=1kcifi.
练习1.n是一个正整数而F是一个域. 令WFn中所有满足x1++xn=0(x1,,xn)构成的集合.
  1. 证明W0由所有具有形式f(x1,,xn)=cj=1nxj的线性泛函f构成.
  2. 证明W的对偶空间W可被"自然地"等同为Fn上所有满足c1++cn=0的线性泛函f(x1,,xn)=c1x1++cnxn构成的集合.
练习2. 运用定理20来证明以下事实. 如果W是一个有限维向量空间V的子空间, 并且如果{g1,,gr}W0任意的基, 那么W=i=1rNgi.
练习3.S是一个集合, F是一个域, 以及V(S;F)是所有从SF的函数构成的空间:(f+g)(x)=f(x)+g(x),(cf)(x)=cf(x).WV(S;F)任意的n维子空间. 证明存在S中的点x1,,xnW中的函数f1,,fn满足fi(xj)=δi,j.

第3.7节 线性变换的转置

设我们有两个域F上的向量空间VW, 以及一个从VW的线性变换T, 那么T按照以下方式导出了一个从WV的线性变换. 设gW上的一个线性泛函, 对于每个V中的α, 令f(α)=g(Tα)那么这就定义了一个从VF的函数f, 即T (一个从VW的函数) 与g (一个从WF的函数) 相复合. 既然Tg都是线性的, 那么定理6告诉我们f也是线性的, 即f是一个V上的线性泛函. 因此, T给我们提供了一个规则Tt, 其为每个W上的线性泛函g赋一个V上的线性泛函f=Ttg, 如上面的式子所定义的那样. 读者也应该注意到Tt实际上是一个从WV的线性变换, 因为如果g1g2W中而c是一个标量, 那么[Tt(cg1+g2)](α)=(cg1+g2)(Tα)=cg1(Tα)+g2(Tα)=c(Ttg1)(α)+(Ttg2)(α)于是Tt(cg1+g2)=cTtg1+Ttg2. 让我们总结一下.

定理21.VW是域F上的向量空间. 对于每个从VW的线性变换, 存在唯一的从WV的线性变换Tt满足(Ttg)(α)=g(Tα)对于每个W中的gV中的α成立.

我们将称TtT转置. 这个变换Tt也常被称作T的伴随. 然而, 我们不会使用这个术语.

定理22.VW是域F上的向量空间, T是一个从VW的线性变换. Tt的零空间是T的像的零化子. 如果VW是有限维的, 那么
  1. rank(Tt)=rank(T);
  2. Tt的像是T的零空间的零化子.
证明. 如果gW中, 那么根据定义有(Ttg)(α)=g(Tα)对于每个V中的α成立. gTt的零空间之中的意思是对于每个V中的αg(Tα)=0. 因此, Tt的零空间就恰是T的像的零化子.
VW是有限维的, 比如说dimV=ndimW=m. 对于i: 令rT的秩, 即T的像的维数. 根据定理16, T的像的零化子的维数是(mr). 根据这个定理的第一条陈述, 我们知道Tt的零化度必然是(mr). 但是如果这样的话, 既然Tt是一个m维空间上的线性变换, 那么Tt的秩就应该是m(mr)=r, 于是TTt有着相同的秩. 对于ii: 令NT的零空间. 每个Tt的像之中的线性泛函都在N的零化子之中, 因为若设对于某个W中的gf=Ttg, 那么如果αN中, 有f(α)=(Ttg)(α)=g(Tα)=g(0)=0.现在我们知道Tt的像是空间N0的一个子空间, 并且dimN0=ndimN=rank(T)=rank(Tt)于是Tt的像必然就恰是N0.
定理23.VW是域F上的有限维向量空间. 令𝔅V的一个有序基, 其对偶基是𝔅. 令𝔅W的一个有序基, 其对偶基是𝔅. 令T是一个从VW的线性变换, 令AT相对于𝔅𝔅的矩阵. 令BTt相对于𝔅𝔅的矩阵, 那么Bi,j=Aj,i.
证明.𝔅={α1,,αn},𝔅={β1,,βm},𝔅={f1,,fn},𝔅={g1,,gm}.根据定义,Tαj=i=1mAi,jβi,j=1,,n,Ttgj=i=1nBi,jfi,j=1,,m.另一方面,(Ttgj)(αi)=gj(Tαi)=gj(k=1mAk,iβk)=k=1mAk,igj(βk)=k=1mAk,iδj,k=Aj,i对于V上任意的线性泛函f我们有f=i=1nf(αi)fi.如果我们将此公式应用于泛函f=Ttgj并运用(Ttgj)(αi)=Aj,i的事实, 那么我们有Ttgj=i=1nAj,ifi从中立即可以得出Bi,j=Aj,i.
定义. 如果A是域F上的一个m×n矩阵, 那么A的转置At是由Ai,jt=Aj,i定义的n×m矩阵.

定理23是说如果T是一个从VW的线性变换, 其在某对有序基下的矩阵是A, 那么转置变换Tt在与之对偶的一对有序基下由转置矩阵At表示.

定理24.A是域F上任意的m×n矩阵, 那么A的行秩等于A的列秩.
证明.𝔅Fn的标准有序基, 𝔅Fm的标准有序基. 令T是从FnFm的线性变换, 其相对于𝔅𝔅的矩阵是A, 即T(x1,,xn)=(y1,,ym)其中yi=j=1nAi,jxj.A的列秩等于变换T的秩, 因为T的像由所有这样的m元组构成, 其是A的列向量的线性组合. [译注: 在同构的意义下]
相对于对偶基𝔅𝔅, 转置变换Tt由矩阵At表示. 既然At的列即A的行, 以相同的推理我们看出A的行秩 (At的列秩) 等于Tt的秩. 根据定理22, TTt有着相同的秩, 因此A的行秩等于A的列秩.

现在我们知道如果A是一个域Fm×n矩阵而T是一个按照以上方式定义的从FnFm的线性变换, 那么rank(T)=row-rank(A)=column-rank(A).我们将简单地称这个数字为A的秩.

例子25. 这个例子是一般性质的——与其说是例子, 不如说是讨论. 令V是域F上的一个n维向量空间, 令TV上的一个线性变换. 设𝔅={α1,,αn}V的一个有序基. T在有序基𝔅下的矩阵被定义为n×n矩阵A, 即Tαj=i=1nAi,jαi.换言之, Ai,j是向量Tαj在有序基𝔅下的第i个坐标. 如果{f1,,fn}𝔅的对偶基的话, 这可以被简单地陈述为Ai,j=fi(Tαj).让我们看看若改变基会发生什么. 设𝔅={α1,,αn}V的另一个有序基, 其对偶基是{f1,,fn}. 如果BT在有序基𝔅下的矩阵, 那么Bi,j=fi(Tαj).U是满足Uαj=αj的可逆线性算子, 那么U的转置由Utfi=fi给出. 读者很容易验证如果U是可逆的, 那么Ut(Ut)1=(U1)t也是可逆的. 因此, fi=(U1)tfi,i=1,,n. 于是,Bi,j=fi(Tαj)=[(U1)tfi](Tαj)=fi(U1Tαj)=fi(U1TUαj)那么这说明了什么呢? 嗯, fi(U1TUαj)U1TU在有序基𝔅下的矩阵的第ij列元素. 上面的计算表明这个标量也是T在有序基𝔅下的第ij列元素. 换句话说,[T]𝔅=[U1TU]𝔅=[U1]𝔅[T]𝔅[U]𝔅=[U]𝔅1[T]𝔅[U]𝔅而这恰好就是我们之前推导出来的基变换公式.
练习1.F是一个域, 令fF2上由f(x1,x2)=ax1+bx2定义的线性泛函. 对于以下的每个线性算子T, 令g=Ttf, 找出g(x1,x2).
  1. T(x1,x2)=(x1,0);
  2. T(x1,x2)=(x2,x1);
  3. T(x1,x2)=(x1x2,x1+x2).
练习2.V是实数域上的多项式函数的向量空间. 令ab是固定的实数, 令fV上由f(p)=abp(x)dx定义的线性泛函. 如果DV上的微分算子, 那么Dtf是什么呢?
练习3.A是域Fn×n矩阵的向量空间, 令B是一个固定的n×n矩阵. 如果TV上由T(A)=ABBA定义的线性算子, f是迹函数, 那么Ttf是什么呢?
练习4.V是域F上的一个有限维向量空间, 令TV上的一个线性算子. 令c是一个标量, 设V中存在非零的向量α使得Tα=cα. 证明V上存在一个非零的线性泛函f使得Ttf=cf.
练习5.A上的m×n矩阵. 证明A=0当且仅当trace(AtA)=0.
练习6.n是一个正整数, 令V是实数域上次数不超过n的多项式函数构成的向量空间, 即所有具有形式f(x)=c0+c1x++cnxn的函数构成的空间. 令DV上的微分算子. 找出转置算子Dt的零空间的一个基.
练习7.V是域F上的一个有限维向量空间. 证明TTt是一个从L(V,V)L(V,V)的同构.
练习8.V是域F上的n×n矩阵构成的向量空间.
  1. 如果B是一个固定的n×n矩阵, 以fB(A)=trace(BtA)定义一个V上的函数fB. 证明fBV上的一个线性泛函.
  2. 证明每个V上的线性泛函都具有以上形式, 即是某个B下的fB.
  3. 证明BfB是一个从VV的同构.

第4章 多项式

第4.1节 代数

本章的目的在于建立域上的多项式代数的一些基本性质. 如果我们先引入域上的线性代数的概念的话, 讨论会更加容易.

定义.F是一个域, 域F上的一个线性代数是一个F上的向量空间V, 其带有一个额外的被称为向量的乘法的运算. 它将每对V中的向量αβ联系以一个V中的向量αβ, 其被称为αβ的积, 满足
  1. 乘法是结合的,α(βγ)=(αβ)γ;
  2. 乘法对于加法是分配的,α(β+γ)=αβ+αγ(α+β)γ=αγ+βγ;
  3. 对于每个F中的标量c,c(αβ)=(cα)β=α(cβ).
如果V中存在元素1满足1α=α1=α对于每个V中的α均成立, 那么我们就称V是域F上一个含幺元的线性代数, 并称1V的幺元. 代数V被称为是交换的, 如果对于所有V中的αβαβ=βα.
例子1.F上的n×n矩阵的集合, 在通常的运算下, 是一个含幺元的线性代数. 特别地, 域本身就是一个含幺元的线性代数. 这个代数在n2时不交换, 域本身当然是交换的.
例子2. 一个向量空间上的所有线性算子的空间, 以复合为积, 是一个含幺元的线性代数. 它是交换的当且仅当空间是一维的. [译注: 零维其实也是.]

读者或许对于3中的点积和叉积已经有了一些经验. 如果确是如此的话, 那么他应该观察到这两种积和上面的线性代数的定义中所描述的向量乘法均不是一种类型的运算. 点积是一种"标量积", 也就是说, 它将一对向量联系以一个标量, 因此它当然不是我们现在所讨论的那种乘法. 叉积的确联系每对3中的向量以一个3中的向量, 然而它不是一种结合运算.

本节的剩余部分将致力于构造一种与之前的两个例子截然不同的代数. 令F是一个域, S是非负整数的集合. 根据第2章的例子3, 所有从SF的函数构成了一个域F上的向量空间. 我们将其记作F. 因此, F中的向量是F中的标量fi的无穷序列f=(f0,f1,f2,). 如果g=(g0,g1,g2,),giF并且abF中的标量, 那么af+bg是由af+bg=(af0+bg0,af1+bg1,af2+bg2,)给出的无穷序列. 我们这样定义F中的积, 对于F中的向量fg, 向量fg(fg)n=i=0nfigni,n=0,1,2,给出, 因而fg=(f0g0,f0g1+f1g0,f0g2+f1g1+f2g0,)并且因为对于n=0,1,2,(gf)n=i=0ngifni=i=0nfigni=(fg)n所以乘法是交换的 [译注: 这里用到了域的乘法的交换性质], 即fg=gf. 如果h也属于F, 那么对于n=0,1,2,我们有[(fg)h]n=i=0n(fg)ihni=i=0n(j=0ifjgij)hni=i=0nj=0ifjgijhni=j=0ni=jnfjgijhni=j=0ni=0njfjgihnij=j=0nfj(i=0njgihnji)=j=0nfj(gh)nj=[f(gh)]n[译注: 以上的计算不单纯是指标体操, 还蕴含了"按照两种方式数(i,j)格点"的想法.] 于是f(gh)=(fg)h.我们将验证该乘法满足上述线性代数定义中的b和c的工作留给读者, 并且读者还应该发现向量1=(1,0,0,)充当了F的幺元. 因此, F在上述定义的运算下, 构成了一个域F上含幺元的交换线性代数.

向量(0,1,0,,0,)在接下来起到了突出的作用, 于是我们将一致地记其为x. 在这整整一章里, x从不会被用来表示域F的元素. x自乘n次的结果被记为xn, 并且我们置x0=1, 那么x2=(0,0,1,0,),x3=(0,0,0,1,0,)而一般地, 对于每个整数k0, (xk)k=1, 对于所有非负整数nk, 有(xk)n=0. 本节我们以这样的观察结束, 由1,x,x2,构成的集合是线性无关的且是无限的, 于是代数F不是有限维的.

代数F有时也被称为域F上的形式幂级数代数. 元素f=(f0,f1,f2,)常被记为f=n=0fnxn.这个记号对于处理代数运算而言是十分便利的. 然而在使用时, 必须要记住这是全然形式上的. 代数中并不存在"无限的和", 幂级数记号并不意图传达任何有关收敛性的想法, 如果读者知道那是什么的话. 通过使用序列, 我们得以谨慎地定义了一个代数, 其行为与形式幂级数的加法和乘法一致, 但不会引起将其当作无穷和的困惑.

第4.2节 多项式代数

我们现在准备定义域F上的多项式.

定义.F[x]是由1,x,x2,张成的F的子空间. F[x]的元素被称为域F上的多项式.

既然F[x]x及其幂的所有线性组合构成, 那么F中的非零向量f是多项式当且仅当存在一个整数n0使得fn0并且对于所有整数k>nfk=0. 这个整数显然是唯一的, 其被称为f的次数 (degree). 我们用degf代表多项式f的次数, 而0多项式的次数是没有定义的. 如果f是一个次数为n的非零多项式, 那么f=f0x0+f1x1+f2x2++fnxn,fn0.标量f0,f1,,fn有时也被称为f的系数, 而且我们也可以说f是一个系数在F之中的多项式. 我们称具有形式cx0的多项式为标量多项式, 并且经常将cx0记作c. 一个次数为n的非零多项式f, 如果fn=1, 那么就称其为首项系数为一 (monic) 的多项式.

读者应该注意多项式和我们之前已经讨论甚多的F上的多项式函数不是同一种对象. 如果F包含无限的元素, 那么F[x]F上的多项式函数的代数之间有一个自然的同构. 我们将在下一节讨论这个事情. 现在让我们来验证F[x]是一个代数.

定理1.fg是域F上非零的多项式, 那么
  1. fg是一个非零的多项式;
  2. deg(fg)=degf+degg;
  3. 如果fg都是首项系数为一的多项式, 那么fg也是首项系数为一的多项式;
  4. fg是标量多项式当且仅当fg都是标量多项式;
  5. 如果f+g0, 那么deg(f+g)max(degf,degg).
证明.f的次数为m, g的次数为n. 如果k是一个非负整数, 那么(fg)m+n+k=i=0m+n+kfigm+n+ki.为了使得figm+n+ki0, imm+n+kin是必要的. 因此m+kim是必要的, 这推出了k=0然后i=m, 于是(fg)m+n=fmgn(fg)m+n+k=0,k>0.陈述i, ii, iii立即可由以上两个结果得到, 而iv是i和ii的推论. 我们将v的验证留给读者.
推论1. 一个给定域F上所有多项式的集合, 装备以上定义的线性组合和乘法运算后, 成为域F上的一个含幺元的交换线性代数.
证明. 既然线性组合和乘法运算是对于F定义的而F[x]F的一个子空间, 那么只需证明两个多项式之积仍然是多项式就够了. 当其中一个因子是0时这是平凡的, 而剩下来的部分可从i得出.
推论2.f,g,h是域F上的多项式满足f0fg=fh, 那么g=h.
证明. 既然fg=fh, 那么f(gh)=0. 鉴于f0, 从i立即可以得到gh=0.

特定的额外事实可由定理1的证明简单推得, 我们将总结其中一些.

f=i=0mfixig=j=0ngjxj那么从(fg)m+n+k=0,k>0中我们可以得到fg=s=0m+n(r=0sfrgsr)xs.读者应当验证, 在f=cxm,g=dxn的特殊情形下, 其中c,dF中的标量, 上式可被规约为(cxm)(dxn)=cdxm+n.据此, 以及F[x]的分配律, 我们知道两多项式相乘的积也可由i,jfigjxi+j给出, 该求和布于所有满足0im0jn的整数序对i,j之上.

定义.V是一个域F上的含幺元的线性代数. 我们用1表示V的幺元, 并对于V的每个元素α作出α0=1的约定. 那么, 对于每个域F上的多项式f=i=0nfixiV中的α, 我们联系以一个V中的元素f(α), 由以下规则定义f(α)=i=0nfiαi
例子3.是复数域, 令f=x2+2.
  1. 如果V=z, 那么f(z)=z2+2. 特别地, f(2)=6f(1+i1i)=1.
  2. 如果V=2×2B=[1012]那么f(B)=2[1001]+[1012]2=[3036].
  3. 如果V3上的所有线性算子构成的代数, T是由T(c1,c2,c3)=(i2c1,c2,i2c3)给定的V的元素, 那么f(T)是由f(T)(c1,c2,c3)=(0,3c2,0)定义的3上的线性算子.
  4. 如果V是所有上的多项式的代数, 并且g=x4+3i, 那么f(g)也是一个V中的多项式, 由f(g)=7+6ix4+x8给定.
机敏的读者可能会发现与这最后一个例子相关联的一个事实, 即如果f是任意的域上的一个多项式而x是多项式(0,1,0,), 那么f=f(x), 不过我们建议他忘掉这个事实.
定理2.F是一个域, V是域F上的一个含幺元的线性代数. 设fg是域F上的多项式, αV的一个元素, c属于域F, 那么
  1. (cf+g)(α)=cf(α)+g(α);
  2. (fg)(α)=f(α)g(α).
证明. 因为i的结果很容易建立, 我们将只证明ii. 设f=i=0mfixig=j=0ngjxj之前我们已经证明了fg=i,jfigjxi+j那么根据i,(fg)(α)=i,jfigjαi+j=(i=0mfiαi)(j=0ngjαj)=f(α)g(α)
练习1.F是复数域的子域, 令A是如下F上的2×2矩阵A=[2113].对于下列F上的多项式f, 计算f(A).
  1. f=x2x+2;
  2. f=x31;
  3. f=x25x+7.
练习2.T3上由T(x1,x2,x3)=(x1,x3,2x2x3)定义的线性算子. 令f上的多项式, 由f=x3+2定义. 找出f(T).
练习3.A是域F上的一个n×n对角矩阵, 即对于ijAi,j=0的矩阵. 令fF上的多项式, 由f=(xA1,1)(xAn,n)定义. 矩阵f(A)是什么?
练习4. 如果fg是域F上线性无关的多项式, h是域F上一个非零的多项式, 证明fhgh是线性无关的.
练习5. 如果F是一个域, 证明F的两个非零元素之积仍然是非零的.
练习6.S是域F上的某些非零多项式的集合. 如果S中没有两个元素具有相同的次数, 证明SF[x]中是一个线性无关的集合.
练习7. 如果ab是域F的元素并且a0, 证明多项式1,ax+b,(ax+b)2,(ax+b)3,构成了F[x]的一个基.
练习8. 如果F是一个域, hF上一个满足degh1的多项式, 证明映射ff(h)F[x]上的一个非奇异的线性算子. 证明这个算子是从F[x]到自身的同构当且仅当degh=1.
练习9.F是复数域的一个子域, 定义F[x]上的变换T,DT(i=0ncixi)=i=0nci1+ixi+1D(i=0ncixi)=i=1nicixi1.
  1. 证明TF[x]上的非奇异线性算子, 并表明T不是可逆的.
  2. 证明DF[x]上满射的线性算子, 并找出其零空间.
  3. 证明DT=I但是TDI.
  4. 证明对于所有F[x]中的fgT[(Tf)g]=(Tf)(Tg)T[f(Tg)].
  5. 陈述并证明一条与d中为T给出的类似的D的规律.
  6. VF[x]的一个非零的子空间, 其满足对于每个fV, TfV. 证明V不是有限维的.
  7. VF[x]的一个有限维子空间. 证明存在整数m0使得对于每个fVDmf=0.

第4.3节 Lagrange插值

整节我们将默认F是一个固定的域并且t0,t1,,tnFn+1个不同的元素. 令VF[x]的子空间, 其由所有次数小于等于n的多项式构成 (并包括0多项式). 令Li是由Li(f)=f(ti),0in定义的从VF的函数. 根据定理2的i, 每个Li都是V上的线性泛函, 而我们想要证明的事实之一是由L0,L1,,Ln构成的集合是V的一个基, VV的对偶空间.

当然为了达成这个目的, 实际上只需要说明 (参见第3章的定理15) {L0,L1,,Ln}是某个V的基{P0,P1,,Pn}的对偶就足够了. 最多只存在一个这样的基, 而且若存在的话则其由Lj(Pi)=Pi(tj)=δi,j刻画. 多项式Pi=(xt0)(xti1)(xti+1)(xtn)(tit0)(titi1)(titi+1)(titn)=ji(xtjtitj)的次数均为n, 因而属于V. 根据定理2, 它们满足上述刻画.

如果f=iciPi, 那么对于每个jf(tj)=iciPi(tj)=cj.既然0多项式有着对于每个tF, 0(t)=0的性质, 于是多项式P0,P1,,Pn是线性无关的. 鉴于多项式1,x,,xn构成了V的一个基, V的维数是(n+1). 因此, 线性无关集合{P0,P1,,Pn}必然也是V的一个基, 于是对于每个fVf=i=0nf(ti)Pi.上述表达式被称为Lagrange插值公式, 置f=xj我们得到xj=i=0n(ti)jPi.现在根据第2章的定理7, 我们知道矩阵[1t0t02t0n1t1t12t1n1tntn2tnn]是可逆的. 该矩阵被称为Vandermonde矩阵. 直接证明这样的矩阵是可逆的或许是一个有趣的练习, 其中t0,t1,,tnFn+1个不同的元素.

如果f是域F上任意的多项式, 在我们当下的讨论中, 我们将用f~表示将每个tF映射到f(t)的从FF的多项式函数. 根据定义 (参见第2章的例子4), 每个多项式函数都以这样的方式产生. 然而, 对于两个多项式fg, 即便fg, 也可能出现f~=g~的情况. 幸运的是, 我们将看到这种令人不快的情况只会在F是有限域的时候发生. 为了精确地刻画多项式与多项式函数之间的关系, 我们需要定义两个多项式函数的积. 如果fg是域F上的多项式, f~g~的积是从FF的函数f~g~, 由(f~g~)(t)=f~(t)g~(t),tF给出. 根据定理2的ii, (fg)(t)=f(t)g(t), 因而对于每个tF(fg)~(t)=f~(t)g~(t).于是, f~g~=(fg)~是一个多项式函数. 此时, 尽管是相当直接的, 我们将验证F上的所有多项式函数构成的向量空间在上述定义的乘法下构成了一个域F上的含幺元的交换线性代数的事情留给读者完成.

定义.F是一个域, VV~F上的线性代数. 称代数VV~是同构的, 如果存在一个从VV~的双射满足
  1. (cα+dβ)~=cα~+dβ~
  2. (αβ)~=α~β~
对于所有α,βV和所有c,dF成立. 映射αα~被称为从VV~的同构. 因此, 一个从VV~的同构是一个"保持"乘积的向量空间的同构.
例子4.V是域F上的一个n维向量空间. 根据第3章的定理13及其之后的评注, 每个V的有序基𝔅都确定了一个从V上的线性算子的代数到域F上的n×n矩阵的代数的同构T[T]𝔅. 设UV上一个固定的线性算子, 并给定多项式 [译注: 这个nn×n里的n是两个毫不相关的数字]f=i=0ncixi其中系数ciF, 那么f(U)=i=0nciUi既然T[T]𝔅是一个线性映射, 于是[f(U)]𝔅=i=0nci[Ui]𝔅.现在我们还知道[T1T2]𝔅=[T1]𝔅[T2]𝔅对于所有T1,T2L(V,V)成立, 于是[Ui]𝔅=([U]𝔅)i,2in.这个关系对于i=0,1也是成立的, 因而我们得到结果[f(U)]𝔅=f([U]𝔅).用自然语言说, 如果UV上的一个线性算子, 那么一个多项式应用于U的结果的矩阵, 和该多项式应用于U的矩阵的结果是相等的.
定理3. 如果F是一个无限域, 那么映射ff~是从域F上的多项式代数到域F上的多项式函数代数的同构.
证明. 根据定义, 这个映射是一个满射. 如果f,gF[x], 对于所有的标量cd显然有(cf+dg)~=cf~+dg~.之前我们已经说明了(fg)~=f~g~, 所以我们需要做的仅仅是证明该映射是一个单射. 根据线性性质, 实际上证明f~=0能够推出f=0就足够了. 设f是一个次数小于等于n的多项式 [译注: 实际上还包括零多项式] 并且满足f~=0. 令t0,t1,,tnFn+1个不同的元素. 既然f~=0, 那么对于i=0,1,,nf(ti)=0, 根据Lagrange插值公式就立即得到f=0.

根据下一节的结果, 我们将得到该定理的一个完全不同的证明.

练习1. 使用Lagrange插值公式找出这样一个实系数的多项式f, 其次数小于等于3, 并且满足f(1)=6,f(0)=2,f(1)=2,f(2)=6.
练习2.α,β,γ,δ是实数. 我们问何时能够找到一个域上的次数不高于2的多项式f满足f(1)=α,f(1)=β,f(3)=γ,f(0)=δ. 证明当且仅当3α+6βγ8δ=0的时候这是可能的.
练习3.F是实数域,A=[2000020000300001],p=(x2)(x3)(x1).
  1. 证明p(A)=0.
  2. P1,P2,P3是对于t1=2,t2=3,t3=1的Lagrange多项式, 计算Ei=Pi(A),i=1,2,3.
  3. 证明E1+E2+E3=I; 如果ij, EiEj=0; Ei2=Ei.
  4. 证明A=2E1+3E2+E3.
练习4.p=(x2)(x3)(x1), 令T4上任意的满足p(T)=0的线性算子. 令P1,P2,P3是练习3的Lagrange多项式. 令Ei=Pi(T),i=1,2,3. 证明E1+E2+E3=I; 如果ij, EiEj=0; Ei2=Ei; T=2E1+3E2+E3.
练习5.n是一个正整数, F是一个域. 设A是域F上的一个n×n矩阵, P是域F上一个可逆的n×n矩阵. 如果f是域F上任意的多项式, 证明f(P1AP)=P1f(A)P.
练习6.F是一个域. 我们已经考虑了由"在t处求值"得到的F[x]上的相当特殊的线性泛函:L(f)=f(t).这样的线性泛函不仅是线性的, 还具有L(fg)=L(f)L(g)的性质. 证明如果LF[x]上的线性泛函, 并且满足L(fg)=L(f)L(g)对于所有的域F上的多项式fg成立, 那么要么L=0, 要么存在tF使得对于每个多项式fL(f)=f(t).

第4.4节 多项式理想

本节我们关心主要依赖于域上的多项式代数的乘性结构的结果.

引理.fd是域F上的非零多项式并且满足degddegf, 那么存在gF[x]使得fdg=0或者deg(fdg)<degf.
证明.f=amxm+i=0m1aixi,am0以及d=bnxn+i=0n1bixi,bn0,那么mn, 并且f(ambn)xmnd=0或者deg[f(ambn)xmnd]<degf.因此, 我们可以取g=(ambn)xmn.

使用该引理我们可以表明众所周知的实或复系数多项式的"长除"过程在任意的域上都是可能的.

定理4. 如果fd是域F上的多项式并且d0, 那么存在q,rF[x]满足
  1. f=dq+r;
  2. 要么r=0要么degr<degd.
满足i和ii的多项式qr是唯一的.
证明. 如果f0或者degf<degd, 那么取q=0r=f即可. 在f0并且degfdegd的情况下, 上述引理告诉我们存在多项式g使得fdg=0或者deg(fdg)<degf. 如果fdg0并且deg(fdg)degd, 那么我们可以选择一个多项式h使得(fdg)dh=0或者deg[fd(g+h)]<deg(fdg).若有必要则继续施行这个过程, 最终我们可以得到多项式qr满足r=0或者degr<degd, 并且f=dq+r. 现在设我们也有f=dq1+r1, 其中r1=0或者degr1<degd, 那么dq+r=dq1+r1, 于是d(qq1)=r1r. 如果qq10, 那么d(qq1)0, 并有degd+deg(qq1)=deg(r1r).但是鉴于r1r的次数是小于d的次数的, 这是不可能的. 因而qq1=0, 随之亦有r1r=0.
定义.d是域F上的一个非零多项式. 如果fF[x], 之前的定理告诉我们至多存在一个多项式qF[x]满足f=dq. 如果这样的q存在, 那么我们称d整除f, 或者fd整除, 或者fd的倍数, 并称qfd的商. 我们也记q=f/d.
推论1.f是域F上的一个多项式, 令cF的一个元素, 那么fxc整除当且仅当f(c)=0.
证明. 根据定理, f=(xc)q+r, 其中r是一个标量多项式. 又根据定理2,f(c)=0q(c)+r(c)=r(c).于是, r=0当且仅当f(c)=0.
定义.F是一个域, cF被称为是多项式fF[x]的根或者零点, 如果f(c)=0.
推论2.F上的n次多项式在F中至多只有n个根.
证明. 这个结果对于0次和1次多项式而言显然是真的. 我们假设其对于n1次的多项式而言是真的. 如果an次多项式f的一个根, 那么f=(xa)q, 其中q的次数是n1. 既然f(b)=0当且仅当a=b或者q(b)=0, 根据归纳假设我们可以得到f至多只有n个根.

读者应该观察到定理3的证明的主要步骤可由该推论立即得到. [译注: 原本的证明用的是Lagrange插值.]

多项式的形式导数在讨论多重根的时候是很有用的. 多项式f=c0+c1x++cnxn的导数是多项式f=c1+2c2x++ncnxn1.我们也使用记号Df=f. [译注: 实际上, 形式导数由fn=(n+1)fn+1刻画.] 微分是线性的, 也就是说, DF[x]上的一个线性算子. 我们也有高阶形式导数f=D2f, f(3)=D3f, 等等.

定理5. Taylor公式.F是一个特征为零的域, cF的一个元素, n是一个正整数. 如果f是域F上一个满足degfn的多项式, 那么f=k=0n(Dkf)k!(c)(xc)k.
证明. Taylor公式是二项式定理和算子D,D2,,Dn的线性性质的推论. 二项式定理很容易通过归纳证明, 并断言(a+b)m=k=0m(mk)amkbk其中(mk)=m!k!(mk)!=m(m1)(mk+1)12k是我们熟悉的二项式系数, 其给出了从m个物品中一次取k个的组合数. 根据二项式定理,xm=[c+(xc)]m=k=0m(mk)cmk(xc)k=cm+mcm1(xc)++(xc)m而这就是在f=xm的情形下Taylor公式的陈述. 如果f=m=0namxm那么(Dkf)(c)=m=0nam(Dkxm)(c)因此k=0n(Dkf)(c)k!(xc)k=k=0nm=0nam(Dkxm)k!(c)(xc)k=m=0nam(k=0n(Dkxm)k!(c)(xc)k)=m=0namxm=f

读者应该注意到, 因为多项式1,(xc),,(xc)n是线性无关的 (参见4.2节的练习7), 所以Taylor公式为f写成多项式(xc)k,0kn唯一的线性组合提供了方法.

尽管我们不会给出任何细节, 但是在这个点上或许值得提及Taylor公式的正当解释使得其也适用于非零特征域上的多项式. 如果域F的特征不为零, 那么在F中我们可以有k!=0, 那么这就使得(Dkf)(c)除以k!毫无意义. 然而, 我们也可以赋予(Dkf)(c)除以k!一种意义, 因为Dkf的每个系数都是F的一个元素乘上某个可以被k!整除的整数. [译注: 不过, 在这种观点下, Dkf就是相当不同的对象了, 因为你不能仅从这个多项式对象本身还原出那些整数来, 还要考虑Dkf的内涵.] 如果这些话使你感到困惑, 那么我们建议读者把自己的注意力限制于特征为零的域, 或者复数域的子域.

如果c是非零多项式f的一个根, 那么c作为f的根的重数是满足(xc)r整除f的最大正整数r.

一个根的重数显然小于等于f的次数. 对于特征为零的域上的多项式而言, c作为f的根的重数与f的高阶导数有关.

定理6.F是一个特征为零的域, 令f是域F上的一个多项式并且满足degfn, 那么标量cf的一个r重根当且仅当(Dkf)(c)=0,0kr1并且(Drf)(c)0.
证明.rc作为f的根的重数, 那么存在多项式g满足f=(xc)rgg(c)0. 如果g(c)=0, 那么根据定理4的推论1, f就会被(xc)r+1整除. 将Taylor公式应用于g, 我们得到f=(xc)r[m=0nr(Dmg)m!(c)(xc)m]=m=0nr(Dmg)m!(c)(xc)r+m既然f写成幂(xc)k,0kn的线性组合的方式是唯一的, 于是(Dkf)(c)k!={0, 如果0kr1(Dkrg)(c)(kr)!, 如果rkn因此, (Dkf)(c)=0,0kr1并且(Drf)(c)=r!g(c)0. 反过来说, 如果这些条件被满足了, 那么根据Taylor公式就能立即得出存在多项式g满足f=(xc)rg并且g(c)0. 现在设r不是满足(xc)r整除f的最大正整数, 那么存在多项式h满足f=(xc)r+1h. 然而, 根据定理1的推论2, 这将推出g=(xc)h, 于是g(c)=0, 一个矛盾.
定义.F是一个域. F[x]中的一个理想是F[x]的一个子空间M满足对于每个fF[x]gMfgM.
例子5. 如果F是一个域, 并且dF上的一个多项式, 那么集合M=dF[x]是一个理想, 其由所有d乘上F[x]中任意的f得到的倍数df构成. 鉴于M事实上包含d, M是非空的. 如果f,gF[x]c是一个标量, 那么c(df)dg=d(cfg)属于M, 于是M是一个子空间. 最后, M也包含(df)g=d(fg). 理想M被称为由d生成的主理想.
例子6.d1,,dnF上有限多个多项式, 那么子空间diF[x]之和M也是一个理想. 这是因为若设pM, 那么存在F[x]中的多项式f1,,fn满足p=d1f1++dnfn. 如果g是域F上任意的多项式, 那么pg=d1(f1g)++dn(fng)于是pg也属于M, 因此M是一个理想. 我们称M为由多项式d1,,dn生成的理想.
例子7.F是复数域的一个子域, 考虑理想M=(x+2)F[x]+(x2+8x+16)F[x].我们断言M=F[x]. 这是因为M包含(x2+8x+16)x(x+2)=6x+16因而M也包含(6x+16)6(x+2)=4, 于是标量多项式1M, 那么其倍数自然是整个F[x].
定理7. 如果F是一个域, 并且MF[x]任意的非零理想, 那么存在唯一的首项系数为一的多项式dF[x]使得M是由d生成的主理想.
证明. 根据假设, M包含一个非零的多项式. M所有的非零多项式中, 存在多项式d具有最低的次数. [译注: 这依赖于自然数集的良序原理.] 我们不妨假设d的首项系数为一, 因为不然的话我们可以给d乘上一个标量使其变成首项系数为一的. 现在如果fM, 定理4表明f=dq+r, 其中r=0或者degr<degd. 既然dM, 也有fdq=rM. 因为dM中具有最低次数的元素, 所以我们不可能有degr<degd, 于是r=0, 因此M=dF[x]. 如果g是另一个满足M=gF[x]的首项系数为一的多项式, 那么存在非零的多项式pq满足d=gpg=dq, 因而d=dpq, 然后degd=degd+degp+degq.于是, degp=degq=0. 鉴于dg的首项系数为一, p=q=1, 即d=g. [译注: 这段证明也表明多项式g是某个非零理想的生成元当且仅当其为唯一的首项系数为一的生成元d的非零标量倍数.]

值得注意的是, 在刚才的证明中我们运用了一个更加一般且相当有用的事实的一种特殊情形, 这个事实即如果p是某个理想M中的非零多项式而fM不被p整除, 那么f=pq+r, 其中"余项 (remainder)"rM, 它异于0, 且次数比p小. 我们已经在例子7中利用了这个事实来表明标量多项式1是那里考虑的理想的首项系数为一的生成元. 从原则上说, 找出生成给定的非零理想的首项系数为一的多项式总是可能的. 这是因为人们通过有限步骤内的辗转相除最终可以得到理想中具有最低次数的多项式.

推论. 如果p1,,pn是域F上的不全为零的多项式, 那么F[x]中存在唯一的首项系数为一的多项式d满足
  1. d在由p1,,pn生成的理想之中;
  2. d整除每个多项式pi;
任何满足a和b的多项式也必然满足
  1. 每个整除多项式p1,,pn的多项式也整除d.
证明.d是理想p1F[x]++pnF[x]的首项系数为一的生成元. 每个该理想的成员都被d整除, 因此每个多项式pi也被d整除. 现在设f是整除多项式p1,,pn的多项式, 那么存在多项式g1,,gn满足pi=fgi,1in. 并且, 既然d在理想p1F[x]++pnF[x]之中, 那么存在多项式q1,,qnF[x]使得d=p1q1++pnqn于是d=f(g1q1++gnqn).我们已经表明了d是满足a, b, c的首项系数为一的多项式. 如果d是满足a和b的多项式, 根据a和d的定义, 我们知道dd的标量倍数, 于是也满足c. [译注: 不太能理解这句话的推理过程和想法, 可能存在笔误.] 最终, 当d是首项系数为一的多项式时, 我们有d=d.
[译注: 以上的证明似乎有些混乱. 实际上, 如果d是满足a和b的多项式, 那么它就是理想p1F[x]++pnF[x]的生成元. 在首项系数为一的情况下, 这个多项式至多只有一个. 很容易验证首项系数为一的生成元的确满足a和b. 另外, 条件a即可推出条件c, 不论首项系数是否为一.]
定义. 如果p1,,pn是域F上的不全为零的多项式, 那么理想p1F[x]++pnF[x]唯一的首项系数为一的生成元被称为p1,,pn的最大公因子 (greatest common divisor, g.c.d.). 这个术语可由之前的推论澄清. [译注: 实际上, 更像是由条件b和c澄清, 但是条件c和条件a是等价的. 另外, 它也澄清了辗转相除法求最大公因子的原理.] 我们称多项式p1,,pn互素, 如果其最大公因子为1, 或者等价地, 它们生成的理想是整个F[x].
例子8.F是复数域, 那么 [译注: 本书对于最大公因子所用的记号是g.c.d., 但是我们将其改成现在更加通行的gcd.]
  1. gcd(x+2,x2+8x+16)=1 (见例子7);
  2. gcd((x2)2(x+i),(x2)(x2+1))=(x2)(x+i). 这是因为, 理想(x2)2(x+i)F[x]+(x2)(x2+1)F[x]包含(x2)2(x+i)(x2)(x2+1)=(x2)(x+i)(i2)因而也包含(x2)(x+i), 其首项系数为一, 且整除(x2)2(x+i)(x2)(x2+1).
例子9.F是有理数域, 并且在F[x]中令M是由(x1)(x+2)2,(x+2)2(x3),(x3)生成的理想, 那么M包含12(x+2)2[(x1)(x3)]=(x+2)2并且既然(x+2)2=(x3)(x+7)+25[译注: 原文是17而不是+25, 应该是笔误.] 那么M包含标量多项式1, 于是M=F[x]而多项式(x1)(x+2)2,(x+2)2(x3),(x3)是互素的.
练习1.是有理数域, 判断以下[x]的子集是否是理想. 若是理想, 则找出其首项系数为一的生成元.
  1. 所有偶数次的f;
  2. 所有次数大于等于5f;
  3. 所有满足f(0)=0f;
  4. 所有满足f(2)=f(4)=0f;
  5. 所有线性算子T的像中的f, 其中TT(i=0ncixi)=i=0ncii+1xi+1定义.
练习2. 找出以下每对多项式的最大公因子
  1. 2x5x33x26x+4,x4+x3x22x2;
  2. 3x4+8x23,x3+2x2+3x+6;
  3. x42x32x22x3,x3+6x2+7x+1.
练习3.A是域F上的一个n×n矩阵. 证明所有满足f(A)=0的多项式fF[x]构成了一个理想.
练习4.F是复数域的一个子域, 令A=[1203].找出使得f(A)=0的所有多项式fF[x]构成的理想的首项系数为一的生成元.
练习5.F是一个域, 证明F[x]中任意数目的理想之交仍然是一个理想.
练习6.F是一个域, 证明由f1,,fnF[x]生成的理想是所有包含f1,,fn的理想之交.
练习7.K是域F的一个子域, 设多项式f,gK[x]. 令MKK[x]中由fg生成的理想, MFF[x]中由fg生成的理想. 证明MKMF有着相同的首项系数为一的生成元.

第4.5节 多项式的素因子分解

本节我们将要证明每个域F上的多项式都可以写成"素"多项式之积. 这种分解为我们提供了寻找有限多个多项式的最大公因子的有效工具, 并且特别地, 提供了判断多项式是否互素的有效手段.

定义.F是一个域. 一个多项式fF[x]被称为在F上可约, 如果存在多项式g,hF[x], 它们的次数大于等于1, 并且满足f=gh. 在不存在的情况下, 我们称fF上不可约. 域F上不可约的非标量多项式被称为域F上的素多项式 (prime polynomial over F), 或者有时称其是F[x]中的一个prime.
例子10. 多项式x2+1在域上是可约的, 因为x2+1=(x+i)(xi)而多项式x+ixi属于[x]. 另一方面, x2+1在域上是不可约的, 因为如果x2+1=(ax+b)(ax+b)其中a,a,b,b, 那么aa=1,ab+ba=0,bb=1.这些关系可以推出a2+b2=0, 这对于实数是不可能的, 除非a=b=0. [译注: 但是我们需要a0.]
定理8.p,f,g是域F上的多项式, 设p是素多项式, 并且p整除fg, 那么要么p整除f, 要么p整除g.
证明. 不失一般性, 假定p是首项系数为一的素多项式. 那么, p是素的就是在说p仅有的首项系数为一的因子是1p. 令dfp的最大公因子, 那么要么d=1, 要么d=p, 既然d是整除p的首项系数为一的多项式. 如果d=p, 那么p整除f, 工作就结束了. 于是, 设d=1, 即fp是互素的. 我们将证明p整除g. 既然gcd(f,p)=1, 存在多项式f0p0满足1=f0f+p0p. 两边乘上g, 我们得到g=f0fg+p0pg=(fg)f0+p(p0g)既然p整除fg, 它也整除(fg)f0, 并且p当然整除p(p0g), 因此p整除g.
推论. 如果p是素多项式并且整除f1fn, 那么p至少整除多项式f1,,fn其中一个.
证明. 通过归纳进行证明. 当n=2时, 该结果就是定理8. 设我们对于推论已经证明了n=k的情形, 并设p整除(k+1)个多项式之积f1fk+1. 既然p整除(f1fk)fk+1, 要么p整除fk+1, 要么p整除f1fk. 根据归纳假设, 如果p整除f1fk, 那么对于某个j,1jkp整除fj. 于是, 我们看到不论什么情况下必然都有对于某个j,1jk+1, p整除fj.
定理9. 如果F是一个域, 那么F[x]中的非标量首项系数为一多项式, 在不计顺序的情况下, 有且仅有一种将其分解为F[x]中的首项系数为一的素因子之积的方式.
证明.f是域F上的一个非标量首项系数为一多项式. 因为次数为一的多项式是不可约的, 因此在degf=1的情况下没有什么好证明的东西. 设f的次数n>1. 根据归纳, 我们可以假定该定理对于所有次数小于n的非标量首项系数为一多项式均成立. 如果f是不可约的, 那么它就已经被分解为首项系数为一的素因子之积了. 若f可约, 则f=gh, 其中gh是次数小于n的非标量首项系数为一多项式. 因此, gh可以被分解为F[x]中的首项系数为一的素因子之积, 于是f也可以. 现在设f=p1pm=q1qn其中p1,,pmq1,,qnF[x]中的首项系数为一的素多项式. 那么, pm整除q1qn. 根据上述推论, pm必然整除某个qi. 鉴于qipm都是首项系数为一的素多项式, 这意味着qi=pm.从中我们看出, 如果m=1或者n=1, 那么m=n=1, 因为degf=i=1mdegpi=j=1ndegqj.m=n=1的情况下没有什么好证明的东西, 所以我们不妨设m>1n>1. 通过重排q的下标, 我们可以假定pm=qn, 并有p1pm1pm=q1qn1pm.根据定理1的推论2, 我们有p1pm1=q1qn1.因为多项式p1pm1的次数小于n, 可以应用归纳假设表明序列q1,,qn1最多只是p1,,pm1的重排. 这个事实和pm=qn一起告诉我们f作为首项系数为一的素因子之积的分解, 在不计因子的顺序的情况下是唯一的.
[译注: 以上证明有一个小的混乱, 就是作为多项式f的次数的n和作为多项式序列q1,,qn的长度的n之间是毫无关系的.]

在以上对于一个给定非标量首项系数为一的多项式f的分解中, 某些首项系数为一的素因子是可以重复的. 如果p1,,pr是对于这个f的分解中所有不同的素因子, 那么f=p1n1p2n2prnr幂次ni是素因子pi在分解中出现的次数. 这样的分解显然也是唯一的, 其被称为f的主分解 (primary decomposition). 很容易验证每个f的首项系数为一的因子都具有p1m1p2m2prmr,0mini的形式. 这告诉我们有限数目的非标量首项系数为一多项式f1,,fs的最大公因子可由联合所有那些同时出现在每个f1,,fs的分解中的首项系数为一的素因子获得, 而其幂次取相应的幂能够整除每个fi的最大值. [译注: 这等价于取每个 fi与之对应的素因子的幂次的最小值.] 若无素因子的(非平凡)幂次是每个fi的因子, 那么这些多项式是互素的. [译注: 这等价于若没有素因子出现在每个fi的分解中, 那么这些多项式是互素的.]

例子11.F是一个域, 令a,b,cF的不同元素, 那么多项式xa,xb,xcF[x]中不同的首项系数为一的素多项式. 如果m,n,s是正整数, 那么(xc)s是多项式(xb)n(xc)s(xa)m(xc)s的最大公因子, 尽管这三个多项式(xb)n(xc)s,(xa)m(xc)s,(xa)m(xb)n是互素的.
定理10.f是域F上的一个非标量首项系数为一多项式, 并且令f=p1n1pknkf的素因子分解. [译注: 按照上面的说法, 这里的prime factorization应该写成primary decomposition. 当然了, 有基本理解能力的读者应该明白primary decompostion不过就是prime factorization的一种形式而已.] 对于每个j,1jk, 令fj=f/pjnj=ijpini那么f1,,fk是互素的. [译注: 这里需要定义多项式除法, 不过这是显然的.]
证明. 我们将这个(简单的)证明留给读者. 我们陈述这个定理很大程度上是因为我们想要在之后引用它. [译注: 第6章的定理12的证明引用了该定理.]
证明. 鉴于证明的确十分简单, 译者在此拟一个证明. 考虑刻画最大公因子定义的定理7的推论, 若首项系数为一的多项式d满足条件b, 那么其仅可能为1. 但是, 既然这个刻画与非零理想存在且唯一的首项系数为一的生成元是等价的, 所以说1就是f1,,fk的最大公因子, 即f1,,fk互素.
注意: 此黄色背景标注内容将被删去.
定理11.f是一个域F上的多项式, 其导数是f, 那么f是域F上的不同的不可约多项式之积当且仅当ff互素.
证明. 设域F上对于f的素因子分解中某个(非标量)素多项式p是重复的 [译注: 原文之所以给非标量加上括号, 是因为素多项式按照定义本来就是非标量多项式], 那么f=p2h, 其中hF[x], 于是f=p2h+2pph所以p也是f的一个因子, 因此ff不是互素的.
现在设f=p1pk, 其中p1,,pk是域F上不同的非标量不可约多项式. 令fj=f/pj, 那么f=p1f1+p2f2++pkfk.p是一个整除ff的素多项式, 那么对于某个ip=pi. 既然若ji, 则pi整除fj, 并且pi也整除f=j=1kpjfj我们看出来pi也必然整除pifi, 因而pi整除fipi. 但是, pi并不整除fi, 鉴于p1,,pk都是不同的, 于是pi整除pi. 这是不可能的, 因为pi的次数比pi的次数少一. 我们总结一下, 就是没有素多项式能够同时整除ff, 即ff是互素的.

[译注: 定理11的陈述和证明都有些粗糙. 如果根据之前给出的定义稍加打磨一下, 定理11应该是"令f是域F上的首项系数为一的多项式, 那么f的素因子分解中每个因子仅出现一次当且仅当ff互素". 其中1的素因子分解应该是"空白", 因为"空白"的积定义为乘法的单位元 (也就是多项式1) 是很合理的. 至于证明, 许多地方应该加上"首项系数为一", 不然的话是不正确的. 另外, 这个证明中还用到了形式导数类似于导数的性质却没有另加证明, 尽管证明起来并不困难.]

定理11. 对于域F上的一个首项系数为一的多项式f, 设其素因子分解为f=p1pk, 那么p1,,pk互异当且仅当ff互素.
证明.p1,,pk互异. 若ff不互素, 存在i使得pi整除ff. 令fj=f/pj, 那么f=p1f1++pkfk.对于ji, 我们知道pi整除fj. 又因为pi整除f, 所以pi整除pifi, 这等价于pi整除pifi. 但是, pi不可能整除pi, 鉴于pi的次数小于pi的次数. 而且, pi也不可能整除fi, 鉴于p1,,pk是互异的. 这就推导出了一个矛盾, 于是ff必然是互素的.
反过来, 设ff互素. 若f的素因子分解中出现重复的因子p, 那么存在多项式h使得f=p2h, 于是f=p2h+2pph=p(ph+2ph).因此, p也整除f, 但这与ff矛盾. 换言之, p1,,pk互异.
证明的最后, 我们想要澄清一下f=1的极端情况. 此时, f的素因子分解应该理解为"空积", 因而互异的条件得到满足. 鉴于1=0, gcd(1,0)=1, ff也是互素的. 我们看到, 即便是f=1, 定理也是成立的.
译者注记. 刚才这个证明中用到了形式导数的性质而未加说明, 即对于多项式f,gF[x], 我们有(fg)=fg+fg.并且, 使用归纳法, 我们很容易将其推广至任意多项的版本, 而刚才的证明中也要用到. 鉴于其并非一眼即得的结果, 我们将其表述为定理并进行证明.
定理. 给定域F, 对于任意的多项式f,gF[x], 其乘积的形式导数可以被表示为(fg)=fg+fg.
证明. 显然, 此定理成立当且仅当对于每个自然数n, 我们有(fg)n=(fg+fg)n.对于左边, 我们可知(fg)n=(n+1)(fg)n+1=(n+1)k=0n+1fkgn+1k对于(fg)n, 我们可知(fg)n=k=0nfkgnk=k=0n(k+1)fk+1gnk=k=1n+1kfkgn+1k=k=0n+1kfkgn+1k对于(fg)n, 我们可知(fg)n=k=0nfkgnk=k=0n(n+1k)fkgn+1k=(n+1)k=0nfkgn+1k+k=0n(k)fkgn+1k因此, 我们得到(fg+fg)n=(fg)n+(fg)n=k=0n+1kfkgn+1k+(n+1)k=0nfkgn+1k+k=0n(k)fkgn+1k=(n+1)k=0nfkgn+1k+(n+1)fn+1g0=(n+1)k=0n+1fkgn+1k=(fg)n证明也就结束了. 这个证明的优点在于其可以直接被推广至形式幂级数的情形而无需修改.
推论. 给定域F, 对于任意的多项式f1,f2,,fnF[x], 其乘积的形式导数可以被表示为(f1f2fn)=f1f2fn+f1f2fn++f1fn1fn.
定义.F被称为代数封闭的 (algebraically closed), 如果每个域F上的素多项式的次数都是1.

F是代数封闭的意味着每个F上的非标量不可约的首项系数为一多项式均具有(xc)的形式. 我们已经观察到每个这样的多项式对于任意的F都是不可约的. 据此, 代数闭域的一个等价定义是F[x]中的每个非标量多项式f都可以被表达为f=c(xc1)n1(xck)nk的形式, 其中c是一个标量, c1,,ckF的不同元素, n1,,nk是正整数. 另一种对于代数闭域的刻画是如果f是域F上的非标量多项式, 那么存在cF使得f(c)=0.

实数域不是代数封闭的, 因为多项式(x2+1)上是不可约的且次数不为1, 或是因为不存在实数c满足c2+1=0. 所谓的代数基本定理陈述了复数域是代数闭域的事实. 我们将不会证明这个定理, 尽管我们之后将在本书中稍微使用一下它. 省略这个定理的证明的一部分原因在于时间的限制, 一部分原因在于此证明依赖于实数系的一个"非代数"性质. 至于一种可能的证明, 感兴趣的读者可以阅读参考文献中Schreier和Sperner所写的书.

代数基本定理也使得实系数多项式的素因子分解的可能性明晰化. 如果f是一个实系数多项式而cf的一个复根, 那么其复共轭c也是f的一个根. 因此, 那些非实的复根必然以共轭对偶的形式出现, 而整个根的集合具有{t1,,tk,c1,c1,,cr,cr}的形式, 其中t1,,tk是实数而c1,,cr是非实的复数, 因此f可以被分解为f=c(xt1)(xtk)p1pr其中pi是二次多项式pi=(xci)(xci).这些多项式pi具有实系数. 我们总结一下, 实数域上的每个非标量不可约多项式的次数都是12. 上的每个非标量多项式都是特定的线性因子 (从f的实根中得到) 和特定的不可约二次多项式之积 [译注: 还要考虑一下最后再乘上一个系数].

练习1.p是域F上一个首项系数为一的多项式. 令fg是域F上互素的多项式. 证明pfpg的最大公因子是p.
练习2. 默认代数基本定理成立, 证明以下事实. 如果fg是复数域上的多项式, 那么gcd(f,g)=1当且仅当fg没有共同的根.
练习3.D[x]上的微分算子. 令f是复数域上的首项系数为一多项式. 证明f=(xc1)(xck)其中c1,,ck是不同的复数, 当且仅当fDf互素. 换言之, f没有重复的根当且仅当fDf没有相同的根. (默认代数基本定理成立.)
练习4. 证明以下Taylor公式的推广. 令f,g,h是某个复数域的子域上的多项式, 并且degfn, 那么f(g)=k=0n1k!f(k)(h)(gh)k.(这里f(g)代表"应用fg".)

对于剩余的练习, 我们需要如下定义. 如果f,g,p是域F上的多项式并且p0, 那么我们称模pfg同余, 如果(fg)p整除. 如果模pf同余于g, 那么我们记fg(modp).

练习5. 对于任意的非零多项式p, 证明模p同余是一个等价关系.
  1. 自反: ff(modp).
  2. 对称: 如果fg(modp), 那么gf(modp).
  3. 传递: 如果fg(modp)并且gh(modp), 那么fh(modp).
练习6.fg(modp)f1g1(modp).
  1. 证明f+f1g+g1(modp).
  2. 证明ff1gg1(modp).
练习7. 使用练习6证明以下结果. 如果f,g,h,p是域F上的多项式而p0, 若fg(modp), 则h(f)h(g)(modp). [译注: 原文是练习7, 应该是练习6. 或许其他地方这样的编号引用错误还有很多, 因为我没有一一检查.]
练习8. 如果p是一个 [译注: 非标量] 不可约多项式而fg0(modp), 那么f0(modp)或者g0(modp). 给出反例说明在p可约的情况下这是错误的.

第5章 行列式

第5.1节 交换环

本章我们将证明与方阵的行列式有关的基本事实. 我们不仅对于域上的矩阵这么做, 矩阵的元素还可能是更一般类型的"标量". 这种一般化有两个理由. 首先, 在下一章, 我们将会发现不得不处理元素是多项式的矩阵的行列式. 其次, 在我们呈现的对于行列式的处理中, 有一条公理是不发挥作用的, 也就是保证每个非零元素都拥有乘法逆元的那条公理. 出于这些原因, 建立含幺交换环上的矩阵的行列式理论是合适的.

定义. 一个环是一个集合K, 带有两种运算(x,y)x+y(x,y)xy满足
  1. K在运算(x,y)x+y下是一个交换群;
  2. (xy)z=x(yz);
  3. x(y+z)=xy+xz; (y+z)x=yx+zx.
如果xy=yx对于所有K中的xy成立, 那么我们称环K是交换的. 如果K中存在一个元素1满足对于每个x1x=x1=x, 那么K就被称为含幺环, 而1就被称为K的幺元.

这里我们感兴趣的是含幺交换环. 这样的环, 可以被简要地描述为一个集合K带有两种运算, 满足第1章给出的域公理, 除了公理8和条件10. 因此, 域是含有非零幺元的交换环, 并且每个非零元都可逆. 整数集, 带有通常的运算, 就是一个含幺交换环, 但不是域. 另一个含幺交换环的例子是域上的多项式.

如果K是一个含幺交换环, 我们定义K上的m×n矩阵是一个从整数序对(i,j),1im,1jn的集合到K的函数. 像往常一样, 我们将这样的矩阵表示为mn列的矩形阵列. K上的矩阵的和与积定义恰如域上的矩阵(A+B)i,j=Ai,j+Bi,j(AB)i,j=kAi,kBk,jAB具有相同的行数和列数时, 和有定义. 当A的列数等于B的行数时, 积有定义. 这些运算的基本代数性质当然仍然成立, 例如A(B+C)=AB+AC,A(BC)=(AB)C,等等.

和域的情况一样, 我们将称K的元素为标量. 接着, 我们可以像之前一样定义矩阵的行或列的线性组合. 粗略说来, 我们对于域上的矩阵所做的事情, 对于K上的矩阵一样合法, 除了那些需要"除法"的结果.

第5.2节 行列式函数

K是一个含幺交换环. 我们希望为每个K上的n×n矩阵赋一个被称为行列式的标量. 将行列式定义为基于矩阵元素的公式是可能的, 接着人们可以从这个公式里推导出行列式的性质. 然而, 这样的公式是相当复杂的, 为了获得一些技术性优势, 我们将按以下方式处理. 我们将Kn×n上的"行列式函数"定义为一种具有如下特别性质的函数. 它对于矩阵的每一行都是线性的; 若矩阵具有两个相等的行, 那么其值为0; 对于恒等矩阵, 其值为1. 我们将证明这样的函数存在, 并且唯一, 也就是恰有一个这样的函数. 随着我们证明唯一性, 就得到了一个行列式的显式公式, 以及许多有用的性质.

本节我们将致力于"行列式函数"的定义, 以及证明至少有一个这样的函数存在.

定义.K是一个含幺交换环, 令n是一个正整数, 令D是一个函数, 其赋每个K上的n×n矩阵A以一个K中标量D(A). 我们称Dn线性的, 如果对于每个i,1in, 在其他(n1)行固定的情况下, D对于第i行是一个线性函数.

这个定义需要一些澄清. 如果D是一个从Kn×nK的函数, 并且如果α1,,αn是矩阵A的行, 那么我们也记D(A)=D(α1,,αn)即是说, 我们也将D想成是A的行的函数. Dn线性的陈述意味着D(α1,,cαi+αi,,αn)=cD(α1,,αi,,αn)+D(α1,,αi,,αn)如果我们固定除了第i行之外的所有行并将D视为第i行的函数, 那么将D(A)写成D(αi)是更方便的. 因此, 我们可以将上式简写成D(cαi+αi)=cD(αi)+D(αi)只要意思足够清楚即可.

例子1.k1,,kn是正整数, 其中1kin, 并令aK的一个元素. 对于每个K上的n×n矩阵A, 定义D(A)=aA(1,k1)A(n,kn)那么函数D就是n线性的. 这是因为如果我们将D视为第i行的函数, 而其他行固定, 我们可以将其写作D(αi)=A(i,ki)b其中b是一个K的固定元素. 令αi=(Ai,1,,Ai,n), 那么我们有D(cαi+αi)=[cA(i,ki)+A(i,ki)]b=cD(αi)+D(αi)因此D对于A的每一行都是一个线性函数.
这种类型的n线性函数的一个特别例子是D(A)=A1,1A2,2An,n换言之, "对角线元素之积"是一个Kn×n上的n线性函数.
例子2. 让我们找出所有K上的2×2矩阵上的2线性函数. 令D是这样一个函数. 如果我们用ε1,ε2代表2×2的恒等矩阵的行, 那么我们有D(A)=D(A1,1ε1+A1,2ε2,A2,1ε1+A2,2ε2)因为D2线性的, 我们有D(A)=A1,1D(ε1,A2,1ε1+A2,2ε2)+A1,2D(ε2,A2,1ε1+A2,2ε2)=A1,1A2,1D(ε1,ε1)+A1,1A2,2D(ε1,ε2)+A1,2A2,1D(ε2,ε1)+A1,2A2,2D(ε2,ε2)因此, D完全由四个标量D(ε1,ε1),D(ε1,ε2),D(ε2,ε1),D(ε2,ε2)决定. 读者应该很容易验证, 如果a,b,c,dK中四个标量, 定义D(A)=A1,1A2,1a+A1,1A2,2b+A1,2A2,1c+A1,2A2,2d那么D是一个K上的2×2矩阵上的2线性函数, 并且D(ε1,ε1)=a,D(ε1,ε2)=b,D(ε2,ε1)=c,D(ε2,ε2)=d
引理. n线性函数之线性组合亦是n线性函数.
证明. 证明两个n线性函数的线性组合是n线性函数足矣. 令DEn线性函数. 如果ab属于K, 那么aD+bE当然由(aD+bE)(A)=aD(A)+bE(A)定义. 因此, 如果我们固定除了第i行之外的所有行(aD+bE)(cαi+αi)=aD(cαi+αi)+bE(cαi+αi)=acD(αi)+aD(αi)+bcE(αi)+bE(αi)=c(aD+bE)(αi)+(aD+bE)(αi)

如果K是一个域而VK上的n×n矩阵的集合, 那么以上引理是说, V上的n线性函数的集合是从VK的所有函数的空间的子空间.

例子3.DK上的2×2矩阵上的函数, 由D(A)=A1,1A2,2A1,2A2,1定义. 现在D是两个函数之和, 它们具有例子1所刻画的类型:D=D1+D2D1(A)=A1,1A2,2D2(A)=A1,2A2,1根据以上引理, D是一个2线性函数. 对于行列式有任何一点经验的读者都不会对此感到惊讶, 因为他会识别出来这就是2×2矩阵的行列式的通常定义. 当然了, 我们刚才定义的函数D不是一个普通的2线性函数. 它拥有许多特别的性质. 让我们注意到其中一些. 首先, 如果I2×2的恒等矩阵, 那么D(I)=1, 即D(ε1,ε2)=1. 其次, 如果A的两行是相等的, 那么D(A)=A1,1A2,2A1,2A2,1=0最后, 如果A是由一个2×2的矩阵A交换其行得到的, 那么D(A)=D(A), 因为D(A)=A1,1A2,2A1,2A2,1=A2,1A1,2A2,2A1,1=D(A)
定义.D是一个n线性函数, 称D是交错的, 如果其下两个条件满足:
  1. A有两行相等, 则D(A)=0.
  2. 如果AA交换两行获得, 那么D(A)=D(A).

我们将在之后证明任何满足条件a的n线性函数自动地满足条件b. 我们将两种条件放在交错n线性函数的定义里主要是为了方便. 读者可能也会注意到如果D满足b, 而A是一个有着相等两行的矩阵, 那么D(A)=D(A). 这让人忍不住断言D也满足条件a. 这在某些时候是对的, 例如K是一个满足1+10的域, 但在一般情况下a不是b的推论.

定义.K是一个含幺交换环, 令n是一个正整数. 设D是一个从K上的n×n矩阵到K的函数. 我们称D是一个行列式函数, 如果Dn线性的, 交错的, 并且D(I)=1.

正如我们之前所说的, 我们最终要证明K上的n×n矩阵上恰存在一个行列式函数. 这对于K上的1×1矩阵A=[a]而言是显然的. 由D(A)=a给定的函数D是一个行列式函数, 并且很明显这就是1×1的矩阵上唯一的行列式函数. 现在我们来处理n=2的情况. 我们已经在例子3中表明了D(A)=A1,1A2,2A1,2A2,1是一个行列式函数. 而且, 例子2中呈现的公式表明D2×2矩阵上唯一的行列式函数. 这是因为, 我们已经证明了对于任何2线性函数DD(A)=A1,1A2,1D(ε1,ε1)+A1,1A2,2D(ε1,ε2)+A1,2A2,1D(ε2,ε1)+A1,2A2,2D(ε2,ε2)如果D是交错的, 那么D(ε1,ε1)=D(ε2,ε2)=0D(ε2,ε1)=D(ε1,ε2)=D(I)如果D还满足D(I)=1, 那么D(A)=A1,1A2,2A1,2A2,1

例子4.F是一个域, 令D是多项式环F[x]上的3×3矩阵上的任意一个交错的3线性函数. 令A=[x0x201010x3]如果我们将3×3的恒等矩阵的行表示为ε1,ε2,ε3, 那么D(A)=D(xε1x2ε3,ε2,ε1+x3ε3)既然D对于每一行都是线性的,D(A)=xD(ε1,ε2,ε1+x3ε3)x2D(ε3,ε2,ε1+x3ε3)=xD(ε1,ε2,ε1)+x4D(ε1,ε2,ε3)x2D(ε3,ε2,ε1)x5D(ε3,ε2,ε3)因为D是交错的, 于是D(A)=(x4+x2)D(ε1,ε2,ε3)
引理.D是一个2线性函数, 并且对于K上具有相同的行的2×2矩阵AD(A)=0, 那么D是交错的.
证明. 我们必须证明的是, 如果A是一个2×2的矩阵而A是由A交换两行得到的, 那么D(A)=D(A). 如果A的行是αβ, 这意味着我们必须证明的是D(β,α)=D(α,β). 既然D2线性的,D(α+β,α+β)=D(α,α)+D(α,β)+D(β,α)+D(β,β)根据我们的假设, D(α+β,α+β)=D(α,α)=D(β,β)=0, 于是0=D(α,β)+D(β,α)
引理.D是一个K上的n×n矩阵上的n线性函数. 设D满足凡A两相邻行相等时即有D(A)=0, 那么D是交错的.
证明. 我们必须证明, 每当A的两行相等时, D(A)=0, 以及若A是由A交换某两行得到的, 那么D(A)=D(A). 首先, 让我们设A是由A交换两个相邻的行得到的. 读者应该能够看出来, 前一个引理的证明中使用的论证可以扩展到目前的情形, 并告诉我们D(A)=D(A).
现在令BA交换第i行和第j行得到, 其中i<j. 我们可以由A通过一系列交换相邻行的操作得到B. 我们首先交换第i行和第(i+1)行, 如此反复直至行的排列呈现α1,,αi1,αi+1,,αj,αi,αj+1,,αn的顺序. 这需要交换k=ji次交换相邻的行. 现在我们用(k1)次交换相邻的行将αj移到第i行的位置. 因此, 我们通过k+(k1)=2k1次交换相邻行的操作由A获得了B, 于是D(B)=(1)2k1D(A)=D(A)A是任意拥有相等两行的n×n矩阵, 即有αi=αj, 其中i<j. 如果j=i+1, 那么A有相等的邻行, 于是D(A)=0. 如果j>i+1, 我们交换αi+1αj, 其结果B拥有相等的邻行, 于是D(B)=0. 从另一方面说, D(B)=D(A), 因此D(A)=0.
定义. 如果n>1并且A是一个K上的n×n矩阵, 我们令A(i|j)代表删去A的第i行和第j列得到的(n1)×(n1)矩阵. 如果D是一个(n1)线性函数, 而A是一个n×n矩阵, 我们记Di,j(A)=D[A(i|j)].
定理1.n>1, 令DK上的(n1)×(n1)矩阵上的一个交错的(n1)线性函数. 对于每个j,1jn, 由Ej(A)=i=1n(1)i+jAi,jDi,j(A)定义的函数Ejn×n矩阵A上的一个交错的n线性函数. 如果D是一个行列式函数, 那么每个Ej也是行列式函数.
证明. 如果A是一个n×n矩阵, 那么Di,j(A)独立于A的第i行. 既然D(n1)线性的, 那么显然Di,j对于除了第i行之外的行都是线性的. 因此, Ai,jDi,j(A)A的一个n线性函数. n线性函数的线性组合仍是n线性的, 于是Ejn线性的. 为了证明Ej是交错的, 只需证明凡A有相等的邻行则Ej(A)=0就够了. 设αk=αk+1, 如果ikik+1, 那么矩阵A(i|j)拥有相等的两行, 于是Di,j(A)=0, 因此Ej(A)=(1)k+jAk,jDk,j(A)+(1)k+1+jAk+1,jDk+1,j(A)既然αk=αk+1, 那么Ak,j=Ak+1,jA(k|j)=A(k+1|j)显然有Ej(A)=0.
现在设D是一个行列式函数. 如果I(n)n×n的恒等矩阵, 那么I(n)(j|j)(n1)×(n1)的恒等矩阵I(n1). 既然I(n)i,j=δi,j, 那么根据Ej的定义有Ej(I(n))=D(I(n1))因为D(I(n1))=1, 所以Ej(I(n))=1, 即Ej是一个行列式函数.
推论.K是一个含幺交换环而n是一个正整数, 那么至少存在一个Kn×n上的行列式函数.
证明. 我们已经证明了K上的1×1矩阵上行列式函数的存在性, 甚至2×2的矩阵上也证明了. 定理1告诉我们如何从(n1)×(n1)矩阵上的行列式函数构造出n×n矩阵上的行列式函数, 根据归纳可得推论.
例子5. 如果BK上的一个2×2矩阵, 我们令|B|=B1,1B2,2B1,2B2,1那么|B|=D(B), 其中D2×2矩阵上的行列式函数. 我们已经证明过K2×2上这样的函数是唯一的了. 令A=[A1,1A1,2A1,3A2,1A2,2A2,3A3,1A3,2A3,3]K上的一个3×3矩阵. 如果我们如定理1中对于Ej的定义一样定义了E1,E2,E3, 那么E1(A)=A1,1|A2,2A2,3A3,2A3,3|A2,1|A1,2A1,3A3,2A3,3|+A3,1|A1,2A1,3A2,2A2,3|E2(A)=A1,2|A2,1A2,3A3,1A3,3|+A2,2|A1,1A1,3A3,1A3,3|A3,2|A1,1A1,3A2,1A2,3|E3(A)=A1,3|A2,1A2,2A3,1A3,2|A2,3|A1,1A1,2A3,1A3,2|+A3,3|A1,1A1,2A2,1A2,2|从定理1可知E1,E2,E3都是行列式函数. 实际上, 我们之后将证明E1=E2=E3, 但即便在此简单情形之下这也并非显然. 然而, 这可以直接地通过展开以上每个表达式进行验证. 我们不做这种事情, 转而给出一些特定的例子.
  1. K=[x]并且A=[x1x2x30x2100x3]那么E1(A)=(x1)|x210x3|=(x1)(x2)(x3)E2(A)=x2|010x3|+(x2)|x1x30x3|=(x1)(x2)(x3)E3(A)=x3|0x200||x1x200|+(x3)|x1x20x2|=(x1)(x2)(x3)
  2. K=并且A=[010001100]那么E1(A)=|1001|=1E2(A)=|0110|=1E3(A)=|0110|=1
练习1. 下列每个表达式都定义了一个实数域上的3×3矩阵上的函数D, 其中哪些D3线性函数?
  1. D(A)=A1,1+A2,2+A3,3;
  2. D(A)=(A1,1)2+3A1,1A2,2;
  3. D(A)=A1,1A1,2A3,3;
  4. D(A)=A1,3A2,2A3,2+5A1,2A2,2A3,2;
  5. D(A)=0;
  6. D(A)=1.
练习2. 直接验证前文中的E1,E2,E3是等同的.
练习3.K是一个含幺交换环. 如果AK上的一个2×2矩阵, 那么A的古典伴随adjAadjA=[A2,2A1,2A2,1A1,1]定义. 如果det代表K上的2×2矩阵上唯一的行列式函数, 证明
  1. (adjA)A=A(adjA)=(detA)I;
  2. det(adjA)=det(A);
  3. adj(At)=(adjA)t.
(At代表A的转置.)
练习4.A是一个域F上的2×2矩阵. 证明A可逆当且仅当det(A)0. 当A可逆时, 给出一个A1的公式.
练习5.A是一个域F上的2×2矩阵, 设A2=0. 证明对于每个标量cdet(cIA)=c2.
练习6.K是一个复数域的子域, 并且n是一个正整数. 令j1,,jnk1,,kn是不超过n的正整数. 对于一个K上的n×n的矩阵A而言定义D(A)=A(j1,k1)A(j2,k2)A(jn,kn)证明Dn线性的当且仅当整数j1,,jn是互异的.
练习7.K是一个含幺交换环. 证明K上的2×2矩阵上的行列式函数对于列是2线性的和交错的.
练习8.K是一个含幺交换环. 通过规则D(A)=A1,1|A2,2A2,3A3,2A3,3|A1,2|A2,1A2,3A3,1A3,3|+A1,3|A2,1A2,2A3,1A3,2|定义了一个K上的3×3矩阵上的函数D. 证明D对于列而言是交错的和3线性的.
练习9.K是一个含幺交换环而DK上的n×n矩阵上的交错的n线性函数, 证明
  1. 如果A有一行为0, 那么D(A)=0;
  2. 如果B是由A通过将一行的倍数加到另一行上去得到的, 那么D(B)=D(A).
练习10.F是一个域, A是一个域F上的2×3矩阵. (c1,c2,c3)是一个F3中的向量, 由c1=|A1,2A1,3A2,2A2,3|,c2=|A1,3A1,1A2,3A2,1|,c3=|A1,1A1,2A2,1A2,2|定义. 证明
  1. rank(A)=2当且仅当(c1,c2,c3)0;
  2. 如果A的秩为2, 那么(c1,c2,c3)是线性方程组AX=0的解空间的一个基.
练习11.K是一个含幺交换环而DK上的2×2矩阵上的一个交错的2线性函数. 证明对于每个A而言有D(A)=(detA)D(I). 现在使用这个结果, 在不对于矩阵的元素进行计算的情况下, 证明det(AB)=(detA)(detB)对于K上任意的2×2矩阵AB成立.
练习12.F是一个域, D是一个F上的n×n矩阵上的函数. 设D(AB)=D(A)D(B)对于所有AB成立. 证明要么对于所有的AD(A)=0, 要么D(I)=1. 在后一种情况, 证明凡A可逆即有D(A)0.
练习13.是实数域, 令D是一个上的2×2矩阵上的函数, 满足D(AB)=D(A)D(B)对于所有AB成立, 并设D([0110])D([1001])证明以下命题.
  1. D(0)=0;
  2. 如果A2=0, 那么D(A)=0;
  3. 如果BA交换两行 (或交换两列) 获得, 那么D(B)=D(A);
  4. 如果A有一行 (或一列) 为零, 那么D(A)=0;
  5. A是奇异的, 那么D(A)=0.
练习14.A是域F上的一个2×2矩阵, 那么所有具有形式f(A)的矩阵, 其中fF上的一个多项式, 构成了一个含幺交换环K. 如果BK上的一个2×2矩阵, 那么B的行列式是F上的一个2×2矩阵. 设IF上的2×2的恒等矩阵, K上的2×2矩阵BB=[AA1,1IA1,2IA2,1IAA2,2I]证明det(B)=f(A), 其中f=x2(A1,1+A2,2)x+det(A), 并证明f(A)=0.

第5.3节 置换和行列式的唯一性

本节我们将证明K上的n×n矩阵上的行列式函数的唯一性. 这个证明相当自然地将我们引向考虑置换及其一些基本性质.

DK上的n×n矩阵上的一个交错的n线性函数. 令A是一个K上的n×n矩阵, 其行分别为α1,,αn. 如果我们用ε1,ε2,,εn表示K上的n×n恒等矩阵的行, 那么αi=j=1nA(i,j)εj,1in因此D(A)=D(jA(1,j)εj,α2,,αn)=jA(1,j)D(εj,α2,,αn)如果我们现在替换α2kA(2,k)εk, 那么我们看到D(εj,α2,,αn)=kA(2,k)D(εj,εk,,αn)因此D(A)=j,kA(1,j)A(2,k)D(εj,εk,,αn)对于D(εj,εk,,αn)我们接着替换α3lA(3,l)εl, 如此反复. 最终我们得到了一个D(A)的表达式, 其复杂但在理论上十分重要, 即D(A)=k1,k2,,knA(1,k1)A(2,k2)A(n,kn)D(εk1,εk2,,εkn)此和布于所有不超过n的正整数的有限序列(k1,k2,,kn)之上. 这表明D是一系列函数的有限之和, 它们具有例子1所刻画的类型. 应该注意到此式仅是Dn线性之推论, 而例子2是其一个特殊情形. 既然D是交错的, 那么每当下标ki之中有两个相等时, 有D(εk1,εk2,,εkn)=0不超过n的正整数的一个有限序列(k1,k2,,kn), 若其没有两个相等的分量, 则被称为一个n阶置换. 因此, 在这D的复杂表达式之中, 我们只需要将(k1,k2,,kn)算是n阶置换的部分加起来即可.

既然一个有限的序列, 或者说n元组, 是一个定义于前n个正整数上的函数, 一个n阶置换可以被定义为从集合{1,2,,n}到自身的双射. 这样一个函数σ对应于n元组(σ1,σ2,,σn), 因此实际上它不过就是一个以某种良定的方式排列1,2,,n的规则.

如果D是一个交错的n线性函数, 而AK上的一个n×n矩阵, 那么D(A)=σA(1,σ1)A(n,σn)D(εσ1,,εσn)此和布于所有n阶置换σ之上.

接着我们将证明D(εσ1,,εσn)=±D(ε1,,εn)其中符号±仅依赖于排列σ. 理由如下. 序列(σ1,σ2,,σn)可由(1,2,,n)通过有限次交换元素得到. 例如, 如果σ11, 那么我们可以交换1σ1的位置, 获得(σ1,,1,). 继行此法, 我们将在n次或更少这样的交换之后抵达序列(σ1,σ2,,σn). [译注: 实际上最多仅需(n1)次这样的交换. 另外, 交换也可以被视为一种特殊的置换, 那么这是说任何置换都可以被表示为交换的复合.] 既然D是交错的, 那么每当我们交换行εiεj其值的符号就会改变. 因此, 如果我们通过m次交换从(1,2,,n)得到了(σ1,σ2,,σn), 我们有D(εσ1,,εσn)=(1)mD(ε1,,εn)特别地, 如果D是一个行列式函数,D(εσ1,,εσn)=(1)m其中m仅依赖于σ而不依赖于D. 因此, 所有的行列式函数为以εσ1,,εσn为行的矩阵赋相同的值, 该值要么是1要么是1.

现在我们给出一个关于置换的基本事实. 如果σ是一个n阶置换, 读者可以通过一系列交换由(1,2,,n)得到(σ1,σ2,,σn), 而且这可以按照各种不同的方式进行. 尽管如此, 不论以何种方式进行, 交换的次数要么总是偶数, 要么总是奇数. 于是, 置换也就相应地被称为偶的或奇的. 我们以sgnσ={1,如果σ是偶置换1,如果σ是奇置换定义置换的符号 (sign), 其中符号 (symbol) "1"代表整数1. [译注: 实际上, 我们需要定义整数和环/域的元素的乘法, 当然它只依赖于加法群的结构.]

我们将在之后表明置换的这个基本性质可从我们已经知道的关于行列式函数的东西推导出来. 让我们暂时假设这个性质成立, 那么整数mσ是偶置换的情况下总是偶数, 在σ是奇置换的情况下总是奇数. 那么, 对于任何一个交错的n线性函数D我们有D(εσ1,,εσn)=(sgnσ)D(ε1,,εn)那么根据我们已经得到的公式,D(A)=[σ(sgnσ)A(1,σ1)A(n,σn)]D(I)当然I代表n×n的恒等矩阵.

从此结果之中我们可以看出来K上的n×n矩阵上恰存在唯一的行列式函数. 如果我们用det代表这个函数, 那么它由det(A)=σ(sgnσ)A(1,σ1)A(n,σn)给出, 其中和布于所有n阶置换之上. 我们可以将其形式化地总结如下.

定理2.K是一个含幺交换环, 令n是一个正整数. K上的n×n矩阵上恰存在唯一的行列式函数, 即由det(A)=σ(sgnσ)A(1,σ1)A(n,σn)给定的函数det. 如果D是一个Kn×n上的交错的n线性函数, 那么对于每个n×n的矩阵A,D(A)=(detA)D(I)

这就是我们一直在寻求的定理, 不过证明中我们留下了一个gap. 这个gap就是证明对于一个给定的σ, 当我们从(1,2,,n)经过交换得到(σ1,σ2,,σn)时, 交换的次数要么总是偶数, 要么总是奇数. 这个基本的组合学事实当然可以不借助于行列式来证明. 然而, 我们乐意指出如何从n×n矩阵上的行列式函数的存在性中得到这个事实.

K是整数环, 令DK上的n×n矩阵上的一个行列式函数. 令σ是一个n阶置换, 设我们通过m次交换从(1,2,,n)得到(σ1,σ2,,σn). 之前我们已经知道的(1)m=D(εσ1,,εσn)也就是说, (1)m必须是D在以εσ1,,εσn为行的矩阵上的值. 如果D(εσ1,,εσn)=1那么m必须是偶数. 如果D(εσ1,,εσn)=1那么m必须是奇数. [译注: 若m可能为奇可能为偶, 那么D就不是良定的了.]

既然我们有了n×n矩阵的行列式的显式公式, 并且这个公式牵扯到n阶置换, 让我们对于置换的一些观察为本节作结. 首先, 我们注意到恰存在n!=12nn阶置换. 这是因为, 如果σ是一个置换, σ1存在n种可能的选择. 当作出这个选择之后, σ2(n1)种选择, 然后σ3(n2)种选择, 诸如此类. 因此, 存在n(n1)(n2)21=n!种置换σ. 于是, det(A)的公式是n!个项的和, 每一项对应于一个n阶置换. 每个项都是An个元素之积A(1,σ1)A(n,σn)其中每个元素都来自于不同的每一行和不同的每一列, 并且根据σ是偶置换还是奇置换, 前面带着符号"+"或者"".

当置换被认为是从集合{1,2,,n}到自身的双射时, 我们可以定义置换的积. στ之积被简单地定义为复合函数στ, 其由(στ)(i)=σ(τ(i))定义. 如果ε代表恒等置换, 即由ε(i)=i定义的置换, 那么对于每个置换σ存在一个逆σ1满足σσ1=σ1σ=ε我们可以这样总结我们的观察, 即是说所有n阶置换构成的集合, 在函数复合之下, 是一个群. 这个群一般被称为n阶对称群.

从置换的积的角度来看, 置换的符号的基本性质是sgn(στ)=(sgnσ)(sgnτ)换句话说, στ是偶置换, 如果στ都是偶置换或都是奇置换; στ是奇置换, 如果其中有一个是奇置换, 另一个是偶置换. 读者可以基于交换操作的相继从符号的定义中看出来这个结果. [译注: 如果σ可以被表示为m个交换的复合, 而τ可以被表示为l个交换的复合, 那么显然στ可以被表示为(m+l)个交换的复合, 由此看出这基本性质.] 如果我们指出如何从行列式的一个基本性质中得到sgn(στ)=(sgnσ)(sgnτ), 那也是很有好处的.

K是整数环, 令στn阶置换. 令ε1,,εnK上的n×n恒等矩阵的行, 令A是以ετ1,,ετn为行的矩阵, 令B是以εσ1,,εσn为行的矩阵. A的第i行仅包含一个非零元素, 那就是在第τi列的1. 从这点很容易看出εστi是积矩阵AB的第i行, 那么现在有det(A)=sgnτ,det(B)=sgnσ,det(AB)=sgn(στ)只要我们证明了以下定理, 就能立刻得出sgn(στ)=(sgnσ)(sgnτ).

定理3.K是一个含幺交换环, 令ABK上的n×n矩阵, 那么det(AB)=(detA)(detB)
证明.BK上一个固定的n×n矩阵, 并且对于每个n×n矩阵A, 定义D(A)=det(AB). 如果我们用α1,,αn代表矩阵A的行, 那么D(α1,,αn)=det(α1B,,αnB)这里αjB代表一个1×n矩阵, 其是1×n矩阵αjn×n矩阵B之积. 既然(cαi+αi)B=cαiB+αiB并且detn线性的, 那么很容易看出Dn线性的. 如果αi=αj, 那么αiB=αjB, 鉴于det是交错的,D(α1,,αn)=0因此, D是交错的, 现在D是一个交错的n线性函数. 根据定理2,D(A)=(detA)D(I)但是D(I)=det(IB)=det(B), 那么det(AB)=D(A)=(detA)(detB)

sgn(στ)=(sgnσ)(sgnτ)仅是定理3的众多推论之一. 我们将在下一节考虑其中一些推论.

练习1. 如果K是一个含幺交换环, 而K上的矩阵A=[0aba0cbc0]证明det(A)=0.
练习2. 证明Vandermonde矩阵[1aa21bb21cc2]的行列式为(ba)(ca)(cb).
练习3. 显式列出所有的六个3阶置换, 判断它们是奇是偶, 然后给出3×3行列式的完整公式.
练习4.στ4阶置换, 其由σ1=2,σ2=3,σ3=4,σ4=1τ1=3,τ2=1,τ3=2,τ4=4定义.
  1. 判断στ奇偶性.
  2. 找出σττσ.
练习5. 如果A是一个n×n的可逆矩阵, 证明det(A)0.
练习6. 如果A是某个域上的2×2矩阵, 证明det(I+A)=1+det(A)当且仅当trace(A)=0.
练习7. 一个n×n的矩阵A被称为三角的, 若每当i>j即有Ai,j=0, 或是每当i<j即有Ai,j=0. 证明三角矩阵的行列式是其对角线元素之积A1,1A2,2An,n.
练习8.A是复数域上的一个3×3矩阵. 我们构造一个矩阵xIA, 其元素是多项式, 该矩阵第ij列的元素是δi,jxAi,j. 如果f=det(xIA), 证明f是一个次数为3的首项次数为一的多项式. 如果我们将多项式写成f=(xc1)(xc2)(xc3)其中c1,c2,c3是复数, 证明c1+c2+c3=trace(A)c1c2c3=det(A)
练习9.n是一个正整数而F是一个域, 如果σ是一个n阶置换, 证明函数T(x1,,xn)=(xσ1,,xσn)是一个Fn上的可逆线性算子.
练习10.F是一个域, n是一个正整数, S是域F上的n×n所有矩阵的集合. 令V是一个从SF的所有函数构成的向量空间, 令WS上交错n线性形式的集合. 证明WV的一个子空间. W的维数又是多少?
练习11.TFn上的一个线性算子. 定义DT(α1,,αn)=det(Tα1,,Tαn)
  1. 证明DT是一个交错的n线性函数.
  2. 如果c=det(Tε1,,Tεn)证明对于任意的n个向量α1,,αn我们有det(Tα1,,Tαn)=cdet(α1,,αn)
  3. 如果𝔅Fn任意的有序基, AT在有序基𝔅下的矩阵, 证明det(A)=c.
  4. 你觉得标量c的合理名字是什么?
练习12. 如果σ是一个n阶置换, A是一个以α1,,αn为行向量的域F上的n×n矩阵, 令σ(A)代表以ασ1,,ασn为行向量的n×n矩阵.
  1. 证明σ(AB)=σ(A)B并且特别地, σ(A)=σ(I)A.
  2. 如果T是练习9中的线性算子, 证明T在标准有序基下的矩阵是σ(I).
  3. σ1(I)σ(I)的逆矩阵吗?
  4. σ(A)相似于A吗?
练习13. 证明置换的符号函数在以下意义上是唯一的. 如果f是一个函数, 其赋每个n阶置换以一个整数, 并且f(στ)=f(σ)f(τ), 那么要么f恒为0, 要么f是符号函数.

第5.4节 行列式的额外性质

本节我们将讲述n×n矩阵上的行列式函数的一些有用性质. 或许首先应该注意到以下事实. 在我们对于det(A)的讨论中, A的行扮演着具有特权的角色. 既然行和列本质上没有区别, 那么读者也会期望det(A)A的列的交错的n线性函数. 诚然如此, 而为了证明它, 仅需要证明det(At)=det(A)就够了, 其中At代表A的转置.

如果σ是一个n阶置换,At(i,σi)=A(σi,i)根据行列式的公式, 我们可以得到det(At)=σ(sgnσ)A(σ1,1)A(σn,n)i=σ1j时, A(σi,i)=A(j,σ1j), 因此A(σ1,1)A(σn,n)=A(1,σ11)A(n,σ1n)既然σσ1是恒等置换, 那么(sgnσ)(sgnσ1)=1sgn(σ1)=sgn(σ)而且, 当σ遍历所有n阶置换时, σ1也遍历了所有的n阶置换. 因此,det(At)=σ(sgnσ1)A(1,σ11)A(n,σ1n)=det(A)证明完毕.

在特定场合, 读者需要计算特定的行列式. 当不得不进行计算时, 以下事实往往是很有用的. 如果B是由A通过将某一行的倍数加到另一行上去 (或者将某一列的倍数加到另一列上去) 得到的, 那么det(B)=det(A)我们将证明关于行的陈述. 令BA由加cαjαi上得到的, 其中ij. [译注: 原文是i<j, 疑有误.] 既然det对于第i行是线性的, 那么det(B)=det(A)+cdet(α1,,αj,,αj,,αn)=det(A)[译注: 当然这也用到交错性.]

另一个有用的事实如下. 设我们拥有一个分块形式的n×n矩阵[AB0C]其中A是一个r×r的矩阵, 而C是一个s×s的矩阵, B是一个r×s矩阵, 0是一个s×r的零矩阵, 那么det[AB0C]=(detA)(detC)为了证明这个, 我们定义D(A,B,C)=det[AB0C]如果我们固定AB, 那么D对于C的行而言是一个交错的s线性函数. 因此, 根据定理2,D(A,B,C)=(detC)D(A,B,I)其中Is×s的恒等矩阵. 通过给B的行减去I的行的倍数, 我们得到了D(A,B,I)=D(A,0,I)现在D(A,0,I)显然对于A的行是一个交错的r线性函数, 因此D(A,0,I)=(detA)D(I,0,I)但是D(I,0,I)=1, 于是D(A,B,C)=(detC)D(A,B,I)=(detC)D(A,0,I)=(detC)(detA)通过类似的论证, 或者通过转置, 可以得到det[A0BC]=(detA)(detC)

例子6.K是有理数域, 我们希望计算4×4矩阵A=[1123220241111230]的行列式.
通过给第2,3,4行减去第1行的适当倍数, 我们就得到了[11230444059130313]我们知道其与A有着相同的行列式. 如果我们给第3行减去54倍的第2行, 给第4行减去34倍的第2行, 就得到了B=[1123044400480040]又一次, 我们知道det(B)=det(A). B的分块形式告诉我们det(A)=det(B)=|1104||4840|=4×32=128

现在我们令n>1, 令AK上的n×n矩阵. 在定理1中, 我们呈现了如何从(n1)×(n1)矩阵上的行列式函数构造n×n矩阵上的行列式函数. 既然现在我们已经证明了行列式的唯一性, 这告诉我们, 如果固定列数j, 那么det(A)=i=1n(1)i+jAi,jdet[A(i|j)]标量(1)i+jdet[A(i|j)]通常被称为Ai,j代数余子式, 或者A的第ij列的代数余子式. [译注: "代数余子式"的英文是"cofactor".] 那么, 以上关于det(A)的公式被称为det(A)按第j列的代数余子式展开 (有的时候也被称为按第j列的余子式 (minor) 展开). 如果我们令Ci,j=(1)i+jdet[A(i|j)]那么以上公式即对于每个j,det(A)=i=1nAi,jCi,j其中代数余子式Ci,j(1)i+j乘上一个(n1)×(n1)矩阵的行列式, 这个矩阵是由A删去第i行和第j列得到的.

如果jk, 那么i=1nAi,kCi,j=0这是因为, 如果将A的第j列替换以第k列, 并称结果为B, 那么B有相等的两列, 于是det(B)=0. 既然B(i|j)=A(i|j), 我们有0=det(B)=i=1n(1)i+jBi,jdet[B(i|j)]=i=1n(1)i+jAi,kdet[A(i|j)]=i=1nAi,kCi,j代数余子式的这些性质可以被总结为i=1nAi,kCi,j=δj,kdet(A)

n×n矩阵adjA, 其是A的代数余子式的矩阵的转置, 被称为A的古典伴随, 因此(adjA)i,j=Cj,i=(1)i+jdet[A(j|i)]那么以上关于代数余子式的性质, 可以被转写成以下形式.(adjA)A=(detA)I我们也希望看到A(adjA)=(detA)I. 既然At(i|j)=[A(j|i)]t, 我们有(1)i+jdet[At(i|j)]=(1)j+idet[A(j|i)]这简单说来就是Ati,j代数余子式等于Aj,i代数余子式. 因此,adj(At)=(adjA)t应用(adjA)A=(detA)IAt, 我们就得到(adjAt)At=(detAt)I=(detA)I再进行转置A[adj(At)]t=(detA)I使用adj(At)=(adjA)t, 我们得到了我们想要的A(adjA)=(detA)I

就像域上的矩阵, 一个K上的n×n矩阵被称为在K上可逆, 如果存在K上的n×n矩阵A1满足AA1=A1A=I. 若逆矩阵存在, 则它是唯一的, 因为第1章使用的相同论证表明当BA=AC=I时我们有B=C. 上面关于古典伴随的公式告诉我们以下关于K上矩阵的可逆性的事实. 如果det(A)K中具有乘法逆元, 那么A是可逆的, 并且A1=(detA)1(adjA)A唯一的逆元. 反过来说, 很容易看出来如果AK上可逆, 那么det(A)K中可逆, 因为如果AB=I, 那么1=det(I)=det(AB)=(detA)(detB)我们已经证明的是以下定理.

定理4.AK上的一个n×n矩阵, 那么AK上的可逆矩阵当且仅当det(A)K中可逆. 当A可逆的时候, A唯一的逆元是A1=(detA)1(adjA)特别地, 域上的n×n矩阵可逆当且仅当其行列式异于零.

我们应该指出这个可逆性的行列式判则也证明了有左逆或右逆的n×n矩阵可逆. 这个证明独立于我们在第1章中为域上的矩阵给出的. 我们还应该指出可逆性对于多项式环上的矩阵意味着什么. 如果K是多项式环F[x], 那么K中仅有的可逆元素是非零的标量多项式, 因为若fg是多项式且有fg=1, 那么degf+degg=0, 于是degf=degg=0, 即fg都是非零的标量多项式. 因此, 一个多项式环F[x]上的n×n矩阵在F[x]上可逆当且仅当其行列式是一个非零的标量多项式.

例子7.K=[x], 即实数域上的多项式环, 令A=[x2+xx+1x11],B=[x21x+2x22x+3x]接着, 根据简单的计算, det(A)=x+1, det(B)=6. 因此, AK上不可逆, 而BK上可逆. 注意到adj(A)=[1x1x+1x2+x],adj(B)=[xx2x2+2x3x21]并且(adjA)A=(x+1)I, (adjB)B=6I. 当然,B1=16[xx2x2+2x3x21][译注: 原文将x21写成了1x2, 应该是笔误.]
例子8.K是整数环, 并且A=[1234]那么det(A)=2,adj(A)=[4231]因此, A作为一个整数环上的矩阵是不可逆的. 然而, 我们也可以将A当成有理数域上的矩阵, 那么A就可逆了, 并且A=12[4231]=[213212][译注: 原文将12写成了12, 应该是笔误.]

与可逆矩阵有关, 我们想要提及一个更加初等的事实. 相似矩阵具有相同的行列式, 即若PK上可逆, 并有B=P1AP, 那么det(B)=det(A). 这很显然, 因为det(P1AP)=(detP1)(detA)(detP)=det(A)这个简单的观察使得定义有限维向量空间上的线性算子的行列式是可能的. 如果TV上的一个线性算子, 那么我们定义T的行列式为任何在V的某个有序基下表示Tn×n矩阵的行列式. 因为这样的矩阵都是相似的, 所以我们的定义是有意义的. 在此联系之下, 看看第5.3节的练习11.

现在我们想要讨论以下求解线性方程组的Cramer法则. 设A是一个域F上的n×n矩阵, 我们想要求解线性方程组AX=Y, 对于某个给定的n元组(y1,,yn). 若AX=Y, 那么(adjA)AX=(adjA)Y于是(detA)X=(adjA)Y因此(detA)xj=i=1n(adjA)j,iyi=i=1n(1)i+jyidet[A(i|j)]最后一个表达式的值是由将A的第j列替换为Y得到的n×n矩阵的行列式. 如果det(A)=0, 那么它什么也没有告诉我们. 然而, 若det(A)0, 那么我们就得到了所谓的Cramer法则. 令A是一个域F上的n×n矩阵满足det(A)0, 如果y1,,ynF中任意的标量, 那么线性方程组AX=Y的唯一解X=A1Yxj=det(Bj)det(A),j=1,,n给出, 其中Bj是由将A的第j列替换为Y得到的n×n矩阵.

在本章的末尾, 我们想要作出一些评注, 以将行列式置于我们所认为的适当位置. 我们时常不得不计算一些特定的行列式, 而本节的很大一部分是在处理相关的技巧. 然而, 在本书之中, 行列式的主要地位是理论性的. 这不是要否认某些结果的漂亮, 例如Cramer法则. 但是对于求解线性方程组而言Cramer法则是一个并不有效的工具, 主要是因为它牵扯太多的计算. 因此, 读者应该关注Cramer法则说了什么, 而不是如何利用它进行计算. 的确, 在回顾整个章节的时候, 我们希望读者将更多的精力放在理解行列式函数是什么以及它具有怎样的行为上, 而不是计算特定矩阵的行列式. [译注: 的确这不是本章的末尾, 但是原文的确使用的是"chapter", 这大概是因为后文是之后补充的高级部分.]

练习1. 使用古典伴随公式计算下列3×3实矩阵的逆.[232603411],[cosθ0sinθ010sinθ0cosθ]
练习2. 使用Cramer法则计算下列每个有理数域上的线性方程组的解.
  1. {x+y+z=112x6yz=03x+4y+2z=0
  2. {3x2y=73y2z=63z2x=1
练习3. 一个域F上的n×n矩阵A被称为斜对称的, 如果At=A. 如果A是一个复数域上的n×n的斜对称矩阵, 并且n是奇数, 证明det(A)=0.
练习4. 一个域F上的n×n矩阵A被称为正交的, 如果AAt=I. 如果A是正交的, 证明det(A)=±1. 给出一个正交矩阵A的例子, 其行列式det(A)=1.
练习5. 一个复数域上的n×n矩阵被称为是酉的 (unitary), 如果AA*=I (A*代表A的共轭转置). 如果A是酉矩阵, 证明|det(A)|=1.
练习6.TU是有限维向量空间V上的线性算子, 证明
  1. det(TU)=(detT)(detU);
  2. T可逆当且仅当det(T)0.
练习7.A是一个含幺交换环K上的n×n矩阵, 设A具有分块形式A=[A1000A2000Ak]其中Aj是一个rj×rj矩阵. 证明det(A)=(detA1)(detA2)(detAk)
练习8.V是域F上的n×n矩阵构成的向量空间, 令BV的一个固定元素. 令TB是一个V上的线性算子, 由TB(A)=ABBA定义. 证明det(TB)=0.
练习9.A是域F上的一个n×n矩阵, 并且A0. 如果r是一个1n之间的正整数, 那么Ar×r子矩阵是由A删去(nr)行和(nr)列得到的. A的行列式秩是最大的正整数r, 满足存在A的某个r×r子矩阵其行列式不为零. 证明A的行列式秩等于A的行秩, 当然也等于A的列秩.
练习10.A是一个域F上的n×n矩阵. 证明至多存在n个不同的标量c满足det(cIA)=0.
练习11.AB是域F上的n×n矩阵. 证明如果A可逆, 那么至多存在n个不同的标量c使得矩阵cA+B不可逆.
练习12. 如果V是域F上的n×n矩阵的向量空间, BF上一个固定的n×n矩阵, 令LBRBV上的线性算子, 由LB(A)=BARB(A)=AB定义. 证明
  1. det(LB)=(detB)n;
  2. det(RB)=(detB)n.
练习13.V是复数域上所有的n×n矩阵构成的向量空间, 令B上一个固定的n×n矩阵. 由MB(A)=BAB*定义一个V上的线性算子MB, 其中B*=Bt. 证明det(MB)=|det(B)|2n现在令HV中所有的Hermite矩阵构成的集合, 称A是Hermite的, 如果A=A*, 那么H是实数域上的一个向量空间. 证明由TB(A)=BAB*定义的函数TB实向量空间H上的一个线性算子, 并证明det(TB)=|det(B)|2n. (提示: 计算TB的时候表明V具有一个由Hermite矩阵构成的基, 然后证明det(TB)=det(MB).)
练习14.A,B,C,D是域Fn×n的可交换矩阵, 证明2n×2n矩阵[ABCD]的行列式为det(ADBC).

第5.5节 模

如果K是一个含幺交换环 [译注: 本章的剩余部分, 凡提到含幺交换环, 均默认是非平凡的], 一个K上的模是一种表现得类似于向量空间的代数系统, 其中K扮演着类似于标量域的角色. 为了精确起见, 我们称V是一个K上的模 (或者一个K模) 如果

  1. V上存在一个加法(α,β)α+β, V在其下是一个交换群;
  2. 存在一个乘法(c,α)cα, 其中αV之中, cK之中, 满足(c1+c2)α=c1α+c2αc(α1+α2)=cα1+cα2(c1c2)α=c1(c2α)1α=α

对于我们而言, 最重要的K模是n元组的模Kn. 矩阵模Km×n也很重要. 如果V是一个模, 我们可以讨论线性组合, 线性相关和线性无关, 就像在向量空间里一样. 我们必须小心不将依赖于非零标量的可逆性的向量空间的结果应用于V, 因为在域中可以施行的除法不一定在环K中可以进行. 例如, 如果α1,,αk是线性相关的, 我们不能断言某个αi可以被表示为其他元素的线性组合. 这使得在模中寻找基变得更加困难.

V的一个基是一个线性无关的子集, 其可以张成 (或者说生成) 这个模. 这与我们对于向量空间给出的定义是一样的. 一个基𝔅的重要性质在于每个V的元素都可以被唯一地表示为𝔅的 (有限数目的) 元素的线性组合. 如果承认选择公理 (见附录) 的话, 那么可以证明每个向量空间都拥有一个基. 读者已经很清楚若是一个向量空间可由有限数目的向量张成, 那么它肯定拥有一个基, 但是对于模来说这并非如此. 因此, 对于拥有基的模和可由有限数目的元素张成的模, 我们需要特别的不同名字.

定义. KV被称为一个自由模, 如果它拥有一个基. 如果V拥有一个有限的基, 其包含n个元素, 那么V被称为具有n个生成元的自由K模.
定义.V是有限生成的, 如果它包含一个能够张成V的有限子集. 一个有限生成模的秩是使得某k个元素能够张成V的最小整数k.

我们需要强调一个模在没有有限的基的情况下仍然可能是有限生成的. 如果V是一个具有n个生成元的自由K模, 那么V同构于模Kn. 如果{β1,,βn}V的一个基, 那么存在一个同构, 将向量c1β1++cnβn送至Kn中的n元组(c1,,cn). 我们并不能立即看出来这相同的模V不能也是一个具有k个生成元的自由模, 其中kn. 换句话说, V的任意两个基都必然包含相同数目的元素并非显然的事实, 而其证明是行列式的一个有趣应用.

定理5.K是一个含幺交换环, 如果V是一个具有n个生成元的自由K模, 那么V的秩是n.
证明. 我们要证明的是V不能由少于n个它的元素张成. 既然V同构于Kn, 我们必须证明, 如果m<n, 那么模Kn不能由n元组α1,,αm张成. 令A是以α1,,αm为行的矩阵. 假设标准基向量ε1,,εn都是α1,,αm的线性组合, 那么存在矩阵PKn×m使得PA=I其中In×n的恒等矩阵. 令A~是一个n×n的矩阵, 其由A往底部再填充nm个零行得到. 令P~是任意的以P的列为前m列的n×n矩阵. 那么,P~A~=I.因此, det(A~)0. 但是, 既然m<n, A~至少有一行全为零. 这个矛盾表明α1,,αm不能张成Kn. [译注: 这里的证明用到了01, 也就是说, 排除了平凡环的情况. 另请读者参考维基百科条目invariant basis number.]

有趣的是, 读者应该注意到定理5建立了(有限维)向量空间的维数的唯一性. 而且, 这个基于行列式函数的存在性的证明, 与我们第2章所给出的证明截然不同. 从定理5我们知道"秩为n的自由模"和"具有n个生成元的自由模"是一样的.

如果VK上的一个模, 那么对偶模V由所有从VK的线性函数f构成. 如果V是秩为n的自由模, 那么V也是秩为n的自由模. 这个事实的证明就和向量空间一样. 如果{β1,,βn}V的一个有序基, 那么存在与之对应的V的对偶基{f1,,fn}. 函数fi赋予每个αV以其相对于{β1,,βn}的第i个坐标分量:α=f1(α)β1++fn(α)βn.如果fV上的一个线性函数, 那么f=f(β1)f1++f(βn)fn.

第5.6节 多线性函数

本节的目的在于将关于行列式的讨论置于我们所相信的正确视角之下. 我们将处理模上的交错多线性形式. 这些形式是我们之前呈现的行列式的自然泛化. 还没有阅读 (或者不希望阅读) 第5.5节对于模的简要总结的读者仍可从学习本节中获益良多, 只要一致地将"K上秩为n的自由模"读作"F上维数为n的向量空间"即可.

K是一个含幺交换环, VK上的一个模. 如果r是一个正整数, 那么从Vr=V×V××VK的函数L被称为多线性的, 如果L(α1,,αr)对于每个αi在其他αj的值固定的情况下是线性的函数. 也就是说, 对于每个iL(α1,,cαi+βi,,αr)=cL(α1,,αi,,αr)+L(α1,,βi,,αr).Vr上的多线性函数也被称为V上的r线性形式或者V上的阶数为r的多线性形式. 这样的函数有时也被称为V上的r张量. Vr上所有多线性形式的集合将被记成Mr(V). 如果L,MMr(V), 那么其和L+M:(L+M)(α1,,αr)=L(α1,,αr)+M(α1,,αr)也是多线性的; 并且, 如果cK, 那么积cL:(cL)(α1,,αr)=cL(α1,,αr)是多线性的. 因此, Mr(V)是一个K模——所有从VrK的函数构成的模的一个子模.

如果r=1, 那么我们有M1(V)=V, 即由线性函数构成的V的对偶模. 线性函数也可被用来构造更高阶的多线性形式. 如果f1,,frV上的线性函数, 那么L(α1,,αr)=f1(α1)f2(α2)fr(αr)显然是V上的一个r线性形式.

例子9. 如果V是一个模, 那么V上的2线性形式也常被称为V上的双线性形式 (bilinear form). 令A是一个元素来源于Kn×n矩阵, 那么L(X,Y)=YtAX定义了模Kn×1上的一个双线性形式L. 类似地,M(α,β)=αAβt定义了一个Kn上的双线性形式M. [译注: 你需要将K1×1K通过自然的同构视为等同的.]
例子10. 行列式函数将K上的每个n×n矩阵与元素det(A)K联系起来. 若det(A)被视为A的行的函数:det(A)=D(α1,,αn)那么DKn上的一个n线性形式.
例子11. 很容易得到模Kn上的一般的r线性形式的代数表达式. 如果向量α1,,αrVA是以α1,,αr为行的r×n矩阵, 那么对于任意的函数LMr(Kn)L(α1,,αr)=L(j=1nA1,jεj,α2,,αr)=j=1nA1,jL(εj,α2,,αr)=j=1nA1,jL(εj,k=1nA2,kεk,α3,,αr)=j=1nk=1nA1,jA2,kL(εj,εk,α3,,αr)=j,k=1nA1,jA2,kL(εj,εk,α3,,αr)如果我们将α3,,αr依次替换以其标准基向量下的线性组合, 并且记Ai,jA(i,j), 那么我们得到了以下表达式:L(α1,,αr)=j1,,jr=1nA(1,j1)A(r,jr)L(εj1,,εjr).此表达式中, 每个分量为从1n的正整数的r元组J=(j1,,jr)与一个项相对应. 这样的r元组有nr个. 因此, L完全由该表达式以及赋给nr个元素(εj1,,εjr)的特定值:cJ=L(εj1,,εjr)决定. 也很容易看出以下事实, 如果我们为每个r元组J挑选一个元素cJK, 那么L(α1,,αr)=JA(1,j1)A(r,jr)cJ定义了一个Kn上的r线性形式.

LVr上的一个多线性形式而MVs上的一个多线性形式. 我们定义Vr+s上的函数LM(LM)(α1,,αr+s)=L(α1,,αr)M(αr+1,,αr+s).如果我们将Vr+s想成是Vr×Vs, 那么对于αVrβVs(LM)(α,β)=L(α)M(β).显然LMVr+s是多线性的, 其被称为LM的张量积 (tensor product). 张量积不是可交换的. 实际上, 除非L=0M=0, MLLM. 然而, 张量积的确与MrMs中的模运算漂亮地联系在一起.

引理.L,L1V上的r线性形式, M,M1V上的s线性形式, cK的一个元素.
  1. (cL+L1)M=c(LM)+L1M;
  2. L(cM+M1)=c(LM)+LM1.
证明. 留作练习.

张量积的确是可结合的, 例如, 令L,M,N分别是V上的r,s,t线性形式, 那么(LM)N=L(MN).这从K的乘法的结合律中可立即推出. 因此, 如果L1,,LkVr1,,Vrk上的多线性函数, 那么张量积L=L1Lk无歧义地被定义为Vr上的一个多线性函数, 其中r=r1++rk. 之前我们已经提及了它的一种特殊情形, 即如果f1,,frV上的线性函数, 那么张量积L=f1frL(α1,,αr)=f1(α1)fr(αr)给出.

定理6.K是一个含幺交换环. 如果V是一个秩为n的自由K模, 那么Mr(V)是一个秩为nr的自由K模. 实际上, 如果{f1,,fn}是对偶模V的一个基, 那么nr个张量积fj1fjr,1j1n,,1jrn构成了Mr(V)的一个基.
证明.{f1,,fn}V的一个有序基, 其对偶于V的基{β1,,βn}. 对于每个向量αV, 我们有α=f1(α)β1++fn(α)βn.现在我们进行例子11所施行的计算. 如果LV上的一个r线性形式而α1,,αrV的元素, 那么L(α1,,αr)=j1,,jrfj1(α1)fjr(αr)L(βj1,,βjr).换言之, 即L=j1,,jrL(βj1,,βjr)fj1fjr.这表明由r元组J=(j1,,jr)给出的nr个张量积EJ=fj1fjr可以张成模Mr(V). 我们也可看出这些r形式EJ是线性无关的. 设对于每个J我们有一个元素cJK, 然后我们构造多线性函数L=JcJEJ.注意到如果I=(i1,,ir), 那么EJ(βi1,,βir)={0IJ1I=J因而我们看到cI=L(βi1,,βir).特别地, 如果L=0, 那么对于每个r元组I都有cI=0.
定义.LKV上的一个r线性形式. 我们称L是交错的, 如果每当αi=αj,ij时有L(α1,,αr)=0.

如果LVr上的一个交错多线性函数, 那么L(α1,,αi,,αj,,αr)=L(α1,,αj,,αi,,αr).换言之, 交换r元组(α1,,αr)中两个(不同下标的)向量, 那么与之关联的L的值会改变符号 (sign). 既然每个置换σ都是交换之积, 我们看出L(ασ1,,ασr)=(sgnσ)L(α1,,αr).

我们用Λr(V)表示V上所有交错r线性形式构成的集合. 显然Λr(V)Mr(V)的一个子模.

例子12. 本章的早些时候, 我们证明了模Kn上恰存在一个交错n线性形式D满足性质D(ε1,,εn)=1. 我们也在定理2中证明了如果形式LΛn(Kn), 那么L=L(ε1,,εn)D.换言之, Λn(Kn)是一个秩为1的自由K模. 我们也建立了D的显式公式. 基于我们现在所使用的记号, 其可以记成D=σ(sgnσ)fσ1fσn其中f1,,fnKn上的标准坐标函数而其和布于集合{1,,n}的所有n!个不同置换σ之上. 如果我们将一个矩阵A的行列式写成det(A)=σ(sgnσ)A(σ1,1)A(σn,n)那么我们就得到了D的一个不同的表达式:D(α1,,αn)=σ(sgnσ)f1(ασ1)fn(ασn)=σ(sgnσ)L(ασ1,,ασn)其中L=f1fn.

存在一种一般性的方法将一个交错形式与一个多线性形式联系起来. 如果L是模V上的一个r线性形式, σ{1,,r}的一个置换, 那么通过定义Lσ(α1,,αr)=L(ασ1,,ασr)我们就得到了另一个r线性函数Lσ. 若L碰巧是交错的, 那么Lσ=(sgnσ)L. 现在, 对于每个LMr(V), 我们通过πrL=σ(sgnσ)Lσ定义一个函数πrLMr(V), 即(πrL)(α1,,αr)=σ(sgnσ)L(ασ1,,ασr).

引理. πr是一个从Mr(V)Λr(V)的线性变换. 如果LΛr(V), 那么πrL=r!L.
证明.τ{1,,r}任意的置换, 那么(πrL)(ατ1,,ατr)=σ(sgnσ)L(ατσ1,,ατσr)=(sgnτ)σ(sgnτσ)L(ατσ1,,ατσr)σ遍历所有{1,,r}的置换时, τσ也是如此. 因此, 我们有(πrL)(ατ1,,ατr)=(sgnτ)(πrL)(α1,,αr).于是, πrL是一个交错形式. [译注: 这个论证是有问题的, 因为对于任意的xK, 我们并不总是能够保证2x=0可以推出x=0, 这点本书之前也有提及.]
如果LΛr(V), 那么对于每个σL(ασ1,,ασr)=(sgnσ)L(α1,,αr), 因而πrL=r!L.
证明. 既然以上的论证存在问题, 我们补充一个没有问题的证明. 设对于某ij满足ij, 我们有αi=αj. 考虑{1,,r}的所有置换构成的集合的一个子集A={σ|σi<σj}. 根据简单的组合推理, 我们知道A的元素个数为n!/2. 再考虑子集B={τ|τi>τj}, 我们知道B的元素个数也是n!/2, 并且AB构成了一个划分. 现在我们给出一个对换υ, 其由υi=j,υj=i定义, 那么函数f(σ)=συ是一个从AB的映射. 并且, 实际上它也可以被视为从BA的一个映射, 而ff=id. 那么, 我们知道f:AB是一个双射, 以及(πrL)(α1,,αr)=σ(sgnσ)L(ασ1,,ασr)=σA(sgnσ)L(ασ1,,ασr)+τB(sgnτ)L(ατ1,,ατr)=σA(sgnσ)L(ασ1,,ασr)+σA[sgnf(σ)]L(αf(σ)(1),,αf(σ)(r))=σA(sgnσ)L(ασ1,,ασr)+σA(sgnσ)L(ασ1,,ασr)=0换句话说, 也就是πrL是一个交错形式. 剩下的命题论证和原文一致.

根据(按列的)公式, 我们知道行列式函数DΛn(Kn)D=πn(f1fn)其中f1,,fnKn上的标准坐标函数. 我们还有一个与上面的引理有关的重要评注要说. 如果K是一个特征为零的域, 以至于r!K中是可逆的, 那么π是一个从Mr(V)Λr(V)的满射. 实际上, 在这种情况下从某种角度来说使用映射π1=(1/r!)π而不是π是更自然的, 因为π1是一个从Mr(V)Λr(V)的投影, 即一个从Mr(V)Λr(V)的线性映射满足π1(L)=L当且仅当LΛr(V).

定理7.K是一个含幺交换环, V是一个秩为n的自由K模. 如果r>n, 那么Λr(V)={0}. 如果1rn, 那么Λr(V)是一个秩为(nr)的自由K模.
证明.{β1,,βn}V的一个有序基, 其以{f1,,fn}为对偶基. 如果LMr(V), 我们有L=JL(βj1,,βjr)fj1fjr其中和布于1n之间的整数 [译注: 当然包括1n] 的所有r元组J=(j1,,jr)之上. 如果L是交错的, 那么每当下标ji中存在两个数字相同时, 就有L(βj1,,βjr)=0.如果r>n, 那么每个r元组J中必有整数重复出现, 因此r>n时有Λr(V)={0}.
现在设1rn. 如果LΛr(V), 那么上面的和只需要布于满足j1,,jr两两不同的r元组J之上, 因为其余的项均为0. 每个这样的r元组都是某个满足j1<<jrr元组J=(j1,,jr)的置换, 后者这种特别类型的r元组被称为{1,,n}的一个r-shuffle. 这样的shuffle的数目为(nr)=n!r!(nr)!.设我们固定一个r-shuffle J. 令LJ是与shuffle J的所有置换相对应的项之和. 如果σ{1,,r}的一个置换, 那么L(βjσ1,,βjσr)=(sgnσ)L(βj1,,βjr)因此LJ=σL(βjσ1,,βjσr)fjσ1fjσr=L(βj1,,βjr)DJ其中DJ=σ(sgnσ)fjσ1fjσr=πr(fj1fjr)我们从中看出每个DJ都是交错的, 而对于每个LΛr(V)L=shuffles JL(βj1,,βjr)DJ.我们断言(nr)个形式DJ构成了Λr(V)的一个基, 而我们已经看到它们能够张成Λr(V). 很容易看出来它们也是线性无关的. 如果I=(i1,,ir)J=(j1,,jr)是shuffle, 那么DJ(βi1,,βir)={1I=J0IJ.设对于每个shuffle J我们有一个标量cJ与之对应, 并且定义L=JcJDJ.根据之前的式子, 我们得到cI=L(βi1,,βir).特别地, 如果L=0, 那么对于每个shuffle I, 我们有cI=0.

译者注记. 以上的证明中有一个不大不小的gap, 但至少不算平凡, 即DJ=σ(sgnσ)fjσ1fjσr=πr(fj1fjr)从第一行到第二行并不是直接的, 因为σ(sgnσ)(fjσ1fjσr)(α1,,αr)=σ(sgnσ)fjσ1(α1)fjσr(αr)πr(fj1fjr)(α1,,αr)=σ(sgnσ)fj1(ασ1)fjr(ασr)不过, 如何证明这右边两个式子相等的思路, 其实在第5.4节的开头就有, 那里证明了行列式不论按行展开还是按列展开都是一样的.

推论. 如果V是一个秩为n的自由K模, 那么Λn(V)是一个秩为1的自由K模. 如果TV上的一个线性算子, 那么存在唯一的元素cK使得L(Tα1,,Tαn)=cL(α1,,αn)对于每个V上的交错n线性形式L成立.
证明. 如果LΛn(V), 那么显然LT(α1,,αn)=L(Tα1,,Tαn)定义了一个交错n线性形式LT. 令M是秩1Λn(V)的一个生成元. 每个LΛn(V)都可以被唯一的表达为L=aM, 其中aK. 特别地, 对于某个特定的cMT=cM. 对于L=aM, 我们有LT=(aM)T=aMT=a(cM)=c(aM)=cL

当然, 这个推论中的元素c被称为T的行列式. 从式子DJ=σ(sgnσ)fjσ1fjσr=πr(fj1fjr)我们可以看出在r=n的情形下 (此时仅存在一种shuffle J=(1,,n)) T的行列式就是在有序基{β1,,βn}下表示T的矩阵的行列式. 让我们现在弄明白为什么. 这个表示矩阵的第ij列的元素是 [译注: 原文下面这个式子恰好把ij搞反了]Ai,j=fi(Tβj)于是DJ(Tβ1,,Tβn)=σ(sgnσ)f1(Tβσ1)fn(Tβσn)=σ(sgnσ)A(1,σ1)A(n,σn)=det(A)另一方面,DJ(Tβ1,,Tβn)=(detT)DJ(β1,,βn)=det(T)这些评注的要义在于通过定理7及其推论, 我们获得了一个线性算子的行列式的定义而不需要预先的关于矩阵的行列式的知识. 矩阵的行列式可以基于算子的行列式定义而不是反过来.

关于这特别的交错r线性形式DJ, 其与V的一个基{f1,,fn}相关, 我们还有一点想说的东西. 理解DJ(α1,,αr)是一个特定的r×r矩阵的行列式是很重要的. 如果Ai,j=fj(αi),1ir,1jn即如果αi=Ai,1β1++Ai,nβn,1irJr-shuffle (j1,,jr), 那么DJ(α1,,αr)=σ(sgnσ)A(1,jσ1)A(n,jσr)=det[A(1,j1)A(1,jr)A(r,j1)A(r,jr)][译注: 这里第一行的DJ是按照σ(sgnσ)fjσ1fjσr展开的.] 因此, DJ(α1,,αr)是以α1,,αr的坐标n元组为行的r×n矩阵取第j1,,jr列得到的r×r矩阵的行列式. 有时我们也用另一个记号DJ(α1,,αr)=(α1,,αr)(βj1,,βjr)来表示这个行列式. 在这个记号下, 定理7的证明表明每个交错的r线性形式L都可以相对于某个基{β1,,βn}由式子L(α1,,αr)=j1<<jr(α1,,αr)(βj1,,βjr)L(βj1,,βjr)表达.

第5.7节 Grassman环

许多行列式和交错多线性形式的性质最好基于一种形式 (form) 上的乘法运算进行描述, 这种乘法被称为外积 (exterior product). 如果LM分别是模V上的交错rs线性形式, 我们有一个LM的满足结合律的积, 即张量积LM. 除非L=0或者M=0, 这不是一个交错形式. 然而, 我们有一种自然的方式将其投影于Λr+s(V). 似乎LM=πr+s(LM)应该是交错形式的"自然"乘法, 但果真如此吗?

让我们举一个特定的例子. 设V是模Knf1,,fnKn上的标准坐标函数. 如果ij, 那么fifj=π2(fifj)是之前给出的(行列式)函数 [译注: 注意一下那里要求J是一个shuffle, 也就是i<j, 但是这里并不需要]Di,j=fifjfjfi.现在设k是一个不同于ij的下标, 那么Di,jfk=π3[(fifjfjfi)fk]=π3(fifjfk)π3(fjfifk)前一章的引理的证明表明对于任意的r线性形式L{1,,r}任意的置换σ, 我们有πr(Lσ)=(sgnσ)πr(L)因此, Di,jfk=2π3(fifjfk). 根据类似的计算, fiDj,k=2π3(fifjfk). 因此, 我们有(fifj)fk=fi(fjfk)而所有这一切看起来前途都那么光明. 但是, 这里存在隐藏的陷阱. 尽管刚才我们所完成的计算看起来像是那么回事, 之前提出的这个乘法并不满足结合律. 实际上, 如果l是一个不同于i,j,k的下标, 那么我们可以算出Di,jDk,l=4π4(fifjfkfl)以及 [译注: 原文为6, 应作12](Di,jfk)fl=12π4(fifjfkfl)因此, 在一般情况下(fifj)(fkfl)[(fifj)fk]fl我们看到我们的第一次寻找乘法运算的尝试产生了一个非结合运算.

译者注记. 以上的论证里有一些gap. 首先, 前一章的引理证明的是(πrL)σ=(sgnσ)πr(L)而不是πr(Lσ)=(sgnσ)πr(L)不过这也是正确的, 而且论证方式也和前一章的引理类似, 只是的确需要证明一下:πr(Lσ)(α1,,αr)=τ(sgnτ)Lσ(ατ1,,ατr)=τ(sgnτ)L(ατσ1,,ατσr)=(sgnσ)τ(sgnτσ)L(ατσ1,,ατσr)=(sgnσ)πr(L)(α1,,αr)其实(πrL)σ(α1,,αr)展开之后和πr(Lσ)(α1,,αr)是类似的, 即(πrL)σ(α1,,αr)=τ(sgnτ)L(αστ1,,αστr)其次, 作者由此结果直接得出Di,jfk=2π3(fifjfk)的过程并不是那么显然. 实际上, 我们想要证明一下以下结果:(sgnσ)πr(fσ1fσr)=πr(f1fr)为了证明它, 我们先证明一个引理:fσ1fσr=(f1fr)σ1计算一下(fσ1fσr)(α1,,αr)=fσ1(α1)fσr(αr)然后我们发现fi就应用于ασ1i, 鉴于f1,,fr在这个积中恰好都出现一次, 经过重新排序我们就得到了引理. 现在我们证明刚才陈述的结果:(sgnσ)πr(fσ1fσr)=(sgnσ)πr[(f1fr)σ1]=(sgnσ)(sgnσ1)πr(f1fr)=πr(f1fr)

如果读者发现直接验证表明非结合性的两个式子相当乏味, 那也不必感到惊讶. 这是该主题的典型特征, 并且同样典型的是, 存在一个一般性的事实可以极大地简化工作.

L是模V上的一个r线性形式而M是模V上的一个s线性形式, 那么πr+s((πrL)(πsM))=πr+s(σ,τ(sgnσ)(sgnτ)(LσMτ))=σ,τ(sgnσ)(sgnτ)πr+s(LσMτ)其中σ布于{1,,r}的所有置换构成的对称群Sr之上而τ布于Ss之上. 每对σ,τ都定义了Sr+s的一个元素(σ,τ), 其中{1,,r+s}的前r个元素根据σ进行置换, 而后s个元素根据τ进行置换. 显然我们有sgn(σ,τ)=(sgnσ)(sgnτ)以及(LM)(σ,τ)=LσMτ因此πr+s((πrL)(πsM))=σ,τsgn(σ,τ)πr+s[(LM)(σ,τ)].既然我们已经观察到sgn(σ,τ)πr+s[(LM)(σ,τ)]=πr+s(LM)于是, 我们就有πr+s[(πrL)(πsM)]=r!s!πr+s(LM).这个公式简化了大量的计算. 例如, 设我们有一个r-shuffle I=(i1,,ir)和一个s-shuffle J=(j1,,js). 为了使事情比较简单, 我们额外假设i1<<ir<j1<<js.那么, 我们有与之关联的行列式函数DI=πr(EI),DJ=πs(EJ)其中EI=fi1firEJ=fj1fjs. 使用我们已经得到的结果, 我们立即可以看出DIDJ=πr+s[πr(EI)πs(EJ)]=r!s!πr+s(EIEJ)既然EIEJ=EIJ [译注: 鉴于IJ是元素不重复的递增序列, 所以可以用集合来表示它们, 于是这个记号有其合理性], 我们得到DIDJ=r!s!DIJ.这暗示了乘法的结合性的缺失是由 [译注: 在一般情况下]DIDJDIJ导致的. 毕竟, DIDJ的积应该是DIJ. 为了修复这种情况, 我们应该定义一个新的积. 一个交错r线性形式L和一个交错s线性形式M的外积 (或者楔积) 是LM=1r!s!πr+s(LM)那么, 对于Kn上的行列式函数, 我们有DIDJ=DIJ或许若有公平可言, 那么我们必然已经找到了正确的交错多线性形式的乘法. 不幸的是, 这个定义在我们所考虑的最一般情况下是没有意义的, 因为在环K中我们不一定能够除以r!s!. 不过, 如果K是一个特征为零的域, 那么就没有问题了, 并且我们能够迅速证明楔积是结合的.

定理8.K是一个特征为零的域, VK上的一个向量空间, 那么外积是V上的交错多线性形式上的一个结合运算. 换言之, 如果L,M,N分别是V上阶数为r,s,t的交错多线性形式, 那么(LM)N=L(MN).
证明. 根据楔积的定义, 我们知道对于任意的标量cdcd(LM)=(cL)(dM), 因此r!s!t![(LM)N]=[r!s!(LM)](t!N)既然πt(N)=t!N, 这就导致r!s!t![(LM)N]=πr+s(LM)πt(N)=1(r+s)!1t!πr+s+t[πr+s(LM)πt(N)]根据之前的结果, 我们看出r!s!t![(LM)N]=πr+s+t(LMN)通过类似的计算我们得到r!s!t![L(MN)]=πr+s+t(LMN)因此就有(LM)N=L(MN).

现在我们回到一般情况上来, 其仅假定K是一个含幺交换环. 第一个问题在于将楔积的定义换成能在一般情况下生效的等价版本. 如果LM分别是阶数为rs的交错多线性形式, 那么我们将构造一个阶数为r+s的典范的 [译注: 可以理解成存在且唯一的] 交错多线性形式LM满足r!s!(LM)=πr+s(LM).

让我们回忆一下我们是如何定义πr+s(LM)的. 对于{1,,r+s}的每个置换σ, 我们联系以多线性函数(sgnσ)(LM)σ其中(LM)σ(α1,,αr+s)=(LM)(ασ1,,ασ(r+s))然后我们将布于所有置换σ之上的这些函数加起来. 存在(r+s)!个置换. 然而, 既然LM都是交错的, 许多这样的函数都是相同的. 实际上, 至多存在(r+s)!r!s!个不同的这种函数. 让我们看看为什么. 令Sr+s{1,,r+s}的所有置换构成的集合, 即r+s阶对称群. 如我们之前所做的, 我们区分出一个子集G来, 其由所有这样的置换σ构成, 满足σ{1,,r}{1,,r}σ{r+1,,r+s}{r+1,,r+s}. 换言之, σG, 如果对于每个i满足1ir1σir. (然后就必然也满足对于每个j满足r+1jr+sr+1σjr+s.) 现在GSr+s的一个子群, 即若στG的元素, 那么στ1G. [译注: 当然G还要是非空的, 不过这是明显的.] 显然Gr!s!个元素.

我们定义一个映射ψ:Sr+sMr+s(V),σ(sgnσ)(LM)σ既然LM是交错的, 那么对于每个γGψ(γ)=LM.因此, 既然对于V上任意的(r+s)线性形式N(Nσ)τ=Nτσ, 那么ψ(τγ)=ψ(τ),τSr+s,γG.这是在说映射ψ在子群G的每个(左)陪集τG上都是常函数. 如果τ1,τ2Sr+s, 那么陪集τ1Gτ2G根据τ21τ1G中还是不在G中, 要么相等要么互不相交. 每个陪集都具有r!s!个元素, 因此存在(r+s)!r!s!个不同的陪集. 若用Sr+s/G代表由所有这些陪集构成的集合, 那么ψ导出了Sr+s/G上的一个函数, 即根据我们已知的东西, 存在 [译注: 当然也是唯一的] 函数ψ~满足对于每个τSr+sψ(τ)=ψ~(τG).如果HG的一个左陪集, 那么对于每个τHψ~(H)=ψ(τ).

译者注记. 以上有点小小的gap, 在声称ψ(τγ)=ψ(τ)那里, 我们补充一下证明:ψ(τγ)=sgn(τγ)(LM)τγ=(sgnτ)(sgnγ)[(LM)γ]τ=(sgnτ)(sgnγ)[(sgnγ)(LM)]τ=(sgnτ)(sgnγ)(sgnγ)(LM)τ=(sgnτ)(LM)τ=ψ(τ)以上推导中我们用到了(LM)γ=(sgnγ)(LM), 这可由ψ(γ)=LM两边左乘(sgnγ)得到. 另外, 如果你看不懂上面这一段在说什么, 那么你应该找一本代数入门书籍看一看.

现在我们定义阶数分别为rs的交错多线性形式LM的外积为LM=Hψ~(H)其中H遍历Sr+s/G的每个元素. 另一种陈述LM的定义的方式如下. 令SSr+s的一个子集, 其从每个G的左陪集中恰选一个代表出来, 那么LM=σS(sgnσ)(LM)σ.显然我们有r!s!(LM)=πr+s(LM)于是这个新定义等价于之前我们所给出的在K是特征为零的域的情况下的定义.

定理9.K是一个含幺交换环, VK上的一个模, 那么外积是V上的交错多线性形式上的一个结合运算. 换言之, 如果L,M,N分别是V上阶数为r,s,t的交错多线性形式, 那么(LM)N=L(MN).
证明. 尽管定理8的证明不能直接应用到这里来, 它的确暗示了该如何处理一般的情况. 令G(r,s,t)Sr+s+t的一个子群, 其由所有这样的置换σ构成, 它们满足σ{1,,r}{1,,r}σ{r+1,,r+s}{r+1,,r+s}σ{r+s+1,,r+s+t}{r+s+1,,r+s+t}. 那么, 对于一个给定的G(r,s,t)的左陪集而言, 其每个元素μ给出的(sgnμ)(LMN)μ均是相同的多线性函数. 从G(r,s,t)的每个左陪集中选出一个代表μ来, 令E是这些代表所对应的项(sgnμ)(LMN)μ之和, 那么E独立于代表元μ的选取方式, 并且r!s!t!E=πr+s+t(LMN).我们将证明(LM)NL(MN)均等于E.
G(r+s,t)Sr+s+t的一个子群, 其定义方式与上面相同. 令T是任意的恰从G(r+s,t)的每个左陪集中选取一个元素得到的集合, 那么根据楔积的定义, 我们有(LM)N=τT(sgnτ)[(LM)N]τ.现在令G(r,s)是如上定义的Sr+s的一个子群. 令S是任意的恰从G(r,s)的每个左陪集中选取一个元素得到的集合. 那么, 根据楔积的定义和我们已经知道的结果, 立即可以得出(LM)N=(σ,τ)S×T(sgnσ)(sgnτ)[(LM)σN]τ.如果我们将Sr+s的每个元素σ视为Sr+s+t的元素, 即σ{1,,r+s}上与原来一致, 而在{r+s+1,,r+s+t}上是恒等函数, 那么我们或许可以将以上式子写成(LM)N=(σ,τ)S×Tsgn(στ)[(LMN)σ]τ但是[(LMN)σ]τ=(LMN)τσ因此(LM)N=(σ,τ)S×Tsgn(τσ)(LMN)τσ现在设我们有τ1σ1=τ2σ2γ其中σiS,τiT,γG(r,s,t), 那么τ21τ1=σ2γσ11. 并且, 既然σ2γσ11G(r+s,t), 那么τ1τ2落入了G(r+s,t)的相同的左陪集中. 因此, τ1=τ2 [译注: 虽然T是任意的, 却也是固定的], 然后σ1=σ2γ. 但是, 这将推出σ1σ2 (被视为Sr+s的元素) 落入了G(r,s)的相同的左陪集中, 于是σ1=σ2. [译注: 这句话里, γ被视为 (或者说限制为) G(r,s)的元素.] 因此, 与(r+s+t)!(r+s)!t!(r+s)!r!s!个序对(τ,σ)T×S相对应的积τσ都是不同的, 并且落入了G(r,s,t)的不同的左陪集中. 既然Sr+s+t中恰有(r+s+t)!r!s!t!G(r,s,t)的左陪集, 那么(LM)N=E. 根据类似的论证, 也可说明L(MN)=E.
例子13. 外积与所谓的Laplace展开关系密切, 其可以用来计算行列式的值. 令K是一个含幺交换环, n是一个正整数. 设1r<n, 并且令LKn上的交错r线性形式, 其由 [译注: 作者默认αi=(Ai,1,,Ai,n)]L(α1,,αr)=det[A1,1A1,rAr,1Ar,r]定义. 如果s=nr并且M是交错s线性形式M(α1,,αs)=det[A1,r+1A1,nAs,r+1As,n]那么LM=D, 即Kn上的行列式函数. 这可以从LM是交错n线性形式以及 (可以看出来)(LM)(ε1,,εn)=1立即得出. 如果我们现在以适当的方式描述LM, 那么我们就得到了K上的n×n矩阵的行列式的一种Laplace展开.
在置换群Sn中, 令G=G(r,s)是之前所定义的子群. 每个G的左陪集中都恰包含一个这样的置换σ, 其满足σ1<σ2<<σrσ(r+1)<<σn. 这个置换的符号由 [译注: 原文是[r(r1)/2], 应作[r(r+1)/2], 下同]sgnσ=(1)σ1++σr+[r(r+1)/2]给出, 而楔积LM(LM)(α1,,αn)=σ(sgnσ)L(ασ1,,ασr)M(ασ(r+1),,ασn)给出, 其和中的σ是从G的每个左陪集中挑选出的那个满足上述要求的置换, 因此(LM)(α1,,αn)=j1<<jreJL(αj1,,αjr)M(αk1,,αks)其中 [译注: 实际上, ki就是集合{1,,n}{j1,,jr}中的元素从小到大排列的第i个]eJ=(1)j1++jr+[r(r+1)/2],ki=σ(r+i).换句话说,det(A)=j1<<jreJ|Aj1,1Aj1,rAjr,1Ajr,r||Ak1,r+1Ak1,nAks,1Aks,n|这只是一种Laplace展开. 其他的展开可由将集合{1,,r}{r+1,,n}替换成两个互补的下标集合得到.

译者注记. 我们继续补充一些gap. 虽然看出(LM)(ε1,,εn)=1还算容易, 但也不是那么平凡. 对于σG(r,s), 我们有(sgnσ)(LM)σ(ε1,,εn)=(LM)(ε1,,εn)=L(ε1,,εr)M(εr+1,,εn)=det(I)det(I)=1对于σG(r,s), 存在i满足1ir但是σi>r, 那么矩阵A=[δσ1,1δσ1,rδσr,1δσr,r]的第i行是零行, 于是det(A)=0, 而(sgnσ)(LM)σ(ε1,,εn)=(sgnσ)L(εσ1,,εσr)M(εσ(r+1),,εσn)=(sgnσ)det(A)M(εσ(r+1),,εσn)=0因此, 根据楔积的定义, (LM)(ε1,,εn)的和中只有一项为1而其余项均为0, 所以其值为1. 另外, 作者没有说明置换的符号是怎样计算的. 实际上, 如果考虑更一般的Laplace展开, 也就是说考虑互补的集合{j1,,jr}{k1,,ks}, 其中j1<<jrk1<<ks, 那么我们就需要思考如何计算这样的置换σ的符号, 其满足σj1<<σjrσk1<<σks. 我们先将σj1通过反复交换插入到第1个位置, 这需要j11次交换. 接着, 从小到大依次将σji插入到第i个位置, 这分别需要jii次交换. 然后, 我们将位于第r个位置的σjr插入到它本应该位于的第σjr个位置, 这需要σjrr次交换. 从大到小, 我们依次将σji从第i个位置插入到第σji个位置, 这分别需要σjii次交换. 最终我们得到了恒等置换, 而所用的交换次数为i=1r(jii)+i=1r(σjii)=(j1++jr)+(σj1++σjr)r(r+1)鉴于r(r+1)是偶数, 那么置换σ的符号为sgnσ=(1)(j1++jr)+(σj1++σjr).

如果V是一个K模, 我们可以将各种形式模 (form module) Λr(V)放在一起并使用外积定义一个环. 为了简单性, 我们只考虑秩为n的自由K模的情形. 那么, 在r>n时模Λr(V)是平凡的. 我们定义Λ(V)=Λ0(V)Λ1(V)Λn(V).这是外直和, 某个之前我们还没讨论过的东西. Λ(V)的元素是(n+1)元组(L0,,Ln), 其中LrΛr(V). 加法和乘上K的元素按读者的预想定义. 顺带一提, Λ0(V)=K. 如果我们将LΛr(V)(n+1)元组(0,,0,L,0,,0)等同起来, 其中自零计的第r个分量是L, 那么Λr(V)Λ(V)的一个子模, 而直和分解Λ(V)=Λ0(V)Λn(V)在通常的意义下成立. [译注: 前一句话作者将多处Λr(V)写成了Λr(K).] 既然Λr(V)是一个秩为(nr)的自由K模, 那么我们看到Λ(V)是一个自由K模并且rank[Λ(V)]=r=0n(nr)=2n.外积定义了一个Λ(V)上的乘法: 使用形式 (form) 上的外积并将其线性地扩展至Λ(V)的情形. 它对于Λ(V)上的加法分配并给予了Λ(V)一个环的结构. 这个环是V上的Grassman环. 它不是一个交换环, 例如若LM分别在Λr(V)Λs(V)中, 那么 [译注: 这(1)rs是将前面和后面的参数互换得到的]LM=(1)rs(ML).但是, Grassman环在许多数学领域里是重要的. [译注: 以上所提Grassman环, 现多称Grassman代数, 毕竟它还有个数乘运算.]

第6章 初等标准形式

第6.1节 引论

之前我们已经提过我们的主要目的在于研究有限维向量空间上的线性变换. 到目前为止, 我们已经见过了许多线性变换的特殊例子, 并且证明了一些关于一般线性变换的定理. 在有限维的情形我们利用有序基通过矩阵来表示这样的变换, 这种表示增添了我们对于其行为的直觉. 我们探索了向量空间L(V,W), 其由从一个向量空间到另一个的线性变换构成. 我们也探索了L(V,V), 其由从一个向量空间到自身的线性变换构成.

在接下来的两章中, 我们将主要关心线性算子. 我们的流程是选取一个有限维向量空间V上的单独的一个线性算子T, 将它拆下来, 看看什么使其运转. 在这早期阶段, 将我们的目标以矩阵的语言表述是最为简单的: 给定线性算子T, 找出V的一个有序基使得T的矩阵呈现特别简单的形式.

现在对于我们心中所想作一个基本的刻画. 或许最简单的矩阵, 除了恒等矩阵之外, 就是对角矩阵了:D=[c10000c20000c30000cn]T是一个n维向量空间V上的线性算子. 如果我们能够找到V的一个有序基𝔅={α1,,αn}使得T由上面的对角矩阵D表示, 那么我们能够获得和T有关的相当信息. 例如, 和T有关的简单数字, 比如说T和秩或者T的行列式, 看一眼矩阵D就能出来. 我们可以显式描述T的像和零空间. 既然[T]𝔅=D当且仅当Tαk=ckαk,k=1,,n那么像就是由那些ck0αk张成的子空间, 零空间就是由剩下来的αk张成的. 似乎可以这样说, 如果我们知道了一个基𝔅和一个对角矩阵D满足[T]𝔅=D, 那么我们就能轻易回答一切与T有关的问题.

是否每个线性算子都可以在某个有序基下表示为对角矩阵呢? 如果不是的话, 那么什么样的算子T下这样的基存在呢? 如果存在这样的基的话, 那么我们又该怎么找到它呢? 如果这样的基不存在的话, 那么可以表示T的最简单的矩阵类型是什么样的呢? 这些是我们将在本章 (和下一章) 解决的问题. 随着我们理解到其中的困难, 一些问题的形式也会变得更加复杂.

第6.2节 特征值

前一节的评注为我们提供了尝试分析一般线性算子T的起点. 之前的线索暗示着我们应该研究这样的向量, 其由T送至自身的标量倍数.

定义.V是域F上的向量空间而TV上的线性算子. T的一个特征值是一个F中的标量c, 存在V中非零的向量α使得Tα=cα. 如果cT的特征值, 那么
  1. 任何满足Tα=cα的向量α都被称为T在特征值c下的特征向量.
  2. 所有满足Tα=cα的向量α构成的集合被称为T在特征值c下的特征空间.

特征值 (characteristic value) 也被称为特征根 (characteristic root), 隐式根 (latent root), 特征值 (eigenvalue), 特征值 (proper value) 或者谱值 (spectral value). 本书我们将只使用"特征值 (characteristic value)"这个名字.

如果T是任意的线性算子而c是任意的标量, 所有满足Tα=cα的向量α的集合是V的子空间, 实际上它就是线性变换(TcI)的零空间. 我们称cT的特征值, 如果该子空间异于零子空间, 即(TcI)不是单射的. 在V是有限维的情况下, (TcI)不是单射恰当其行列式等于零.

定理1.T是有限维向量空间V上的一个线性算子, c是一个标量, 那么以下是等价的.
  1. cT的特征值.
  2. 算子(TcI)是奇异的 (不可逆的).
  3. det(TcI)=0.

行列式判则iii是非常重要的, 因为它告诉我们从哪里寻找T的特征值. 既然det(TcI)是对于变量cn次多项式, 那么我们所求的特征值就是该多项式的根. 让我们仔细解释这个想法.

如果𝔅V的基并且A=[T]𝔅, 那么(TcI)可逆当且仅当矩阵(AcI)可逆. 据此, 我们有如下定义.

定义. 如果A是域F上的一个n×n矩阵, 那么A的一个在F中的特征值是一个F中标量c满足矩阵(AcI)是奇异的 (不可逆的).

既然cA的特征值当且仅当det(AcI)=0或者等价地当且仅当det(cIA)=0, 我们构造以多项式为元素的矩阵(xIA)并考虑多项式f=det(xIA). 显然AF中的特征值不过就是F中满足f(c)=0的标量c. 出于这样的原因f被称为A的特征多项式. 注意到f是一个次数恰为n的首项系数为一的多项式是重要的. 这很容易从基于元素的矩阵的行列式公式中看出来.

引理. 相似矩阵拥有相同的特征多项式.
证明. 如果B=P1AP, 那么det(xIB)=det(xIP1AP)=det(P1(xIA)P)=detP1det(xIA)detP=det(xIA)

这条引理允许我们将算子T的特征多项式定义为任意在某个V的有序基下表示Tn×n矩阵的特征多项式. 正如矩阵一样, T特征值就是T的特征多项式的根. 特别地, 这表明T不可能拥有多于n个不同的特征值. 我们也应该指出T可能没有任何特征值.

例子1.T2上的线性算子, 其在标准有序基下由矩阵A=[0110]表示. T (或者A) 的特征多项式为det(xIA)=|x11x|=x2+1.既然这个多项式没有实根, 那么T就没有特征值. 如果U2上的线性算子, 其在标准有序基下由A表示, 那么U就有两个特征值, ii. 这里我们看到了微妙的一点. 在讨论一个矩阵A的特征值时, 我们必须小心地规定所涉及的域. 上面的矩阵A中没有特征值, 但在中有两个特征值ii.
例子2.A3×3的(实)矩阵[311221220].那么A的特征多项式为|x3112x2122x|=x35x2+3x4=(x1)(x2)2.因此A的特征值是12.
T3上的线性算子, 其在标准基下由A表示. 让我们找出T在特征值12下的特征向量. 现在AI=[211211221]显然一眼就可以看出AI的秩等于2 (因此TI的零化度为1). 于是特征值1下的特征向量的空间是一维的. 向量α1=(1,0,2)可以张成TI的零空间. 因此Tα=α当且仅当αα1的标量倍数. 现在考虑A2I=[111201222]显然A2I的秩也是2, 于是在特征值2下的特征向量的空间维数是1. 显然Tα=2α当且仅当αα2=(1,1,2)的标量倍数.
定义.T是有限维向量空间V上的一个线性算子. 我们称T是可对角化的, 如果存在V的一个基满足其中每个向量都是T的特征向量.

为什么要叫这个名字应该是很显然的, 因为如果存在V的一个有序基𝔅={α1,,αn}满足每个αi都是T的特征向量, 那么T在有序基𝔅下的矩阵是对角的. 如果Tαi=ciαi, 那么[T]𝔅=[c1000c2000cn]我们当然并不需要标量c1,,cn互异. 实际上, 它们可以是相同的标量 (当T是恒等算子的标量倍数时).

我们也可以将T可对角化定义为存在T的一集特征向量可以张成V. 这与之前的定义只是表面上不同而已, 因为我们可以从任意能够张成V的一集向量中挑选出一个基.

对于例子1和2我们故意挑选了在n上不可对角化的线性算子T. 在例子1中, 2上的这个线性算子之所以是不可逆的, 是因为它没有特征值. 在例子2中, 线性算子T的确有特征值. 实际上, T的特征多项式可以在实数域上被分解完全: f=(x1)(x2)2. 然而, T并非可对角化的. 在T的两个特征值下每个特征空间都只是一维的, 因此我们并不能构造出一个全由T的特征向量构成的3的基.

T是一个可对角化的线性算子. 令c1,,ckT互异的特征值. 那么存在一个有序基𝔅满足其下T由一个以标量ci为对角元素的对角矩阵表示, 每个标量均重复特定的次数. 如果ci重复了di次, 那么(我们可以重新排列有序基的向量顺序使得)该矩阵具有如下分块形式[T]𝔅=[c1I1000c2I2000ckIk]其中Ijdj×dj的恒等矩阵. 从中我们看出两件事. 首先, T的特征多项式是(可能重复的)线性因子之积:f=(xc1)d1(xck)dk.如果标量域F是代数闭域, 例如复数域, 那么每个F上的多项式都可以被这么分解 (见第4.5节). 然而, 如果F不是代数闭域, 当我们说T的特征多项式有这样一种分解时, 我们是在声明T的一个特别性质. 第二件能看出来的事情是di (ci作为f的重根次数) 等于与特征值ci相关的特征空间的维数. 这是因为对角矩阵的零化度等于其主对角线上零的数目, 而矩阵[TciI]𝔅在其主对角线上拥有di个零. 这个特征空间的维数与特征值作为f的根的重数之间的关系最初看上去并不令人兴奋. 然而, 它为我们提供了一种更简单的判断给定算子是否可对角化的方法.

引理.Tα=cα. 如果f是任意的多项式, 那么f(T)α=f(c)α.
证明. 作为练习.
引理.T是有限维向量空间V上的线性算子. 令c1,,ckT不同的特征值, 而Wi是特征值ci下的特征空间. 如果W=W1++Wk, 那么dimW=dimW1++dimWk.实际上, 如果𝔅iWi的一个有序基, 那么𝔅=(𝔅1,,𝔅k)W的一个有序基.
证明. 空间W=W1++Wk是由T的所有特征向量张成的子空间. 当一个人构造子空间Wi之和W时, 通常会预料dimW<dimW1++dimWk, 因为不同空间的向量之间也可能存在线性关系. 这条引理告诉我们不同特征值下的特征空间是独立的.
设(对于每个i)我们有一个Wi中的向量βi, 并且假定β1++βk=0. 我们将证明对于每个iβi=0. 令f是任意的多项式. 既然Tβi=ciβi, 那么之前的引理告诉我们0=f(T)0=f(T)β1++f(T)βk=f(c1)β1++f(ck)βk选择多项式f1,,fk使得fi(cj)=δi,j={1,i=j0,ij那么0=fi(T)0=j=1kδi,jβj=βi现在令𝔅iWi的一个有序基, 令𝔅是序列𝔅=(𝔅1,,𝔅k), 那么𝔅能够张成子空间W=W1++Wk. 并且, 𝔅也是线性无关的向量序列, 原因如下. 任何𝔅中向量之间的线性关系都具有β1++βk=0的形式, 其中βi𝔅i中的向量的线性组合. 根据我们刚才得到的结果, 我们知道对于每个iβi=0. 既然每个𝔅i都是线性无关的, 那么显然𝔅中的向量之间只存在平凡的线性关系.
定理2.T是有限维向量空间V上的线性算子, 令c1,,ckT不同的特征值, 令Wi(TciI)的零空间, 以下条件是等价的.
  1. T是可对角化的.
  2. T的特征多项式为f=(xc1)d1(xck)dk并且dimWi=di,i=1,,k.
  3. dimW1++dimWk=dimV.
证明. 我们已经观察到i可以推出ii. 如果特征多项式f是如ii所示的线性因子之积, 那么d1++dk=dimV, 因为di之和就是特征多项式的次数, 而这个次数就是dimV. 于是, ii能够推出iii. 设iii成立. 根据引理, 我们必须有V=W1++Wk, 即T的特征向量能够张成V.

定理2的矩阵类比可以按照如下方式陈述. 令A是一个元素来源于域Fn×n矩阵, 令c1,,ckAF中不同的特征值. 对于每个i, 令Wi是满足(AciI)X=0的列矩阵X的空间, 当然X的元素应该来源于F, 令𝔅iWi的一个有序基. 我们将基(𝔅1,,𝔅k)连在一起以构成了一个矩阵P的列的序列:P=[P1,P2,]=(𝔅1,,𝔅k).矩阵A在域F上能够相似于一个对角矩阵当且仅当P是一个方阵. 当P是方阵的时候, P可逆并且P1AP是对角矩阵.

例子3.T3上的线性算子, 其在标准基下由矩阵A=[566142364]表示. 让我们指出读者计算特征多项式的一种可能方式, 使用行变换和列变换:|x5661x4236x+4|=|x5061x2232xx+4|=(x2)|x50611231x+4|=(x2)|x50611220x+2|=(x2)|x562x+2|=(x2)(x23x+2)=(x2)2(x1)在这两个特征值下的特征空间的维数是多少呢? 我们有AI=[466132365],A2I=[366122366]我们知道AI是奇异的, 并且显然有rank(AI)2. 因此, rank(AI)=2. 另外, 显然有rank(A2I)=1.
W1W2分别是特征值12下的特征空间, 我们知道dimW1=1dimW2=2. 根据定理2, T是可对角化的. 很容易找出3的一个基满足其下T由一个对角矩阵表示. (TI)的零空间由向量α1=(3,1,3)张成, 于是{α1}W1的一个基. T2I的零空间 (即空间W2) 由满足x1=2x2+2x3的向量(x1,x2,x3)构成. 因此, W2的基的一个例子是α2=(2,1,0),α3=(2,0,1).如果𝔅={α1,α2,α3}, 那么[T]𝔅是对角矩阵D=[100020002].T可对角化的事实意味着原本的矩阵A(在上)相似于对角矩阵D. 使得我们能够将基𝔅下的坐标转换为标准基下的坐标的矩阵P(当然)以α1,α2,α3的转置为列向量:P=[322110301].而且, AP=PD, 于是P1AP=D.
练习1. 以下的每种情形, 令T2上的线性算子, 其在2的标准有序基下由矩阵A表示. 并且, 令U2上的线性算子, 其在2的标准有序基下也由矩阵A表示. 找出TU的特征多项式, 找出TU的特征值, 以及找出每个特征值所对应的特征空间的一个基.A=[1000],A=[2311],A=[1111].
练习2.V是域F上的一个n维向量空间. V上的恒等算子的特征多项式是什么? V上的零算子的特征多项式是什么?
练习3.A是域F上的一个n×n的三角矩阵. 证明A的特征值就是其对角线的元素, 即标量Ai,i.
练习4.T3上在标准有序基下由矩阵[9448341687]表示的线性算子. 证明T是可对角化的, 通过给出3的一个基, 其每个向量都是T的特征向量.
练习5.A=[6324121053].A是否相似于一个对角矩阵? 域A是否相似于一个对角矩阵?
练习6.T4上在标准有序基下由矩阵[0000a0000b0000c0]表示的线性算子. a,b,c在何种条件下使得T是可对角化的?
练习7.Tn维向量空间V上的一个线性算子. 如果T具有n个不同的特征值, 证明T是可对角化的.
练习8.AB是域F上的n×n矩阵, 证明如果(IAB)是可逆的, 那么(IBA)也是可逆的, 并且(IBA)1=I+B(IAB)1A.
练习9. 使用练习8的结果证明, 如果AB是域F上的n×n矩阵, 那么ABBA在域F中恰好拥有相同的特征值.
练习10.A是一个2×2的实对称矩阵, 证明A上相似于一个对角矩阵.
练习11.N是一个2×2的复矩阵满足N2=0, 证明要么N=0, 要么N上相似于[0010].
练习12. 使用练习11的结果证明, 如果A是一个2×2的复矩阵, 那么A上相似于以下两种类型的矩阵中的一种:[a00b],[a01a].
练习13.V是所有从的连续函数构成的向量空间, 令TV上由(Tf)(x)=0xf(t)dt定义的线性算子, 证明T没有特征值.
练习14.An×n的对角矩阵, 它的特征多项式为(xc1)d1(xck)dk其中c1,,ck是不同的标量. 令V是所有与A交换的n×n矩阵构成的向量空间, 证明V的维数是d12++dk2.
练习15.VFn×n, 矩阵AV, TV上"左乘A"的线性算子, AT具有相同的特征值吗?

第6.3节 零化多项式

在尝试分析一个线性算子T的时候, 知道能够零化T的多项式类是很有用的. 更确切地说, 设T是域F上的向量空间V上的线性算子. 如果p是域F上的多项式, 那么p(T)也是V上的线性算子. 如果q是另一个域F上的多项式, 那么(p+q)(T)=p(T)+q(T),(pq)(T)=p(T)q(T).因此, 零化T的多项式p (意即p(T)=0) 的集合是多项式代数F[x]的理想. 它可能是零理想, 也就是说T可能不由任何非零多项式零化. 但是, 如果V是有限维的, 这种情况是不可能发生的.

T是一个n维空间V上的线性算子. 看看T的前(n2+1)次幂:I,T,T2,,Tn2.这是L(V,V)n2+1个算子的序列, L(V,V)V上的线性算子的空间. 空间L(V,V)n2维的, 因此这n2+1个算子的序列必然是线性相关的, 也就是说存在不是全零的标量ci满足c0I+c1T++cn2Tn2=0.于是, 零化T的多项式理想中有一个非零的多项式, 其次数小于等于n2.

根据第4章的定理7, 每个非零的多项式理想都可由某个首项系数为一的多项式生成. 因此, 存在一个与T相关的首项系数为一的多项式p满足以下性质: 如果f是一个域F上的多项式, 那么f(T)=0当且仅当f=pg, 其中g是某个F上的多项式.

定义.T是一个域F上的有限维向量空间V上的线性算子. T的极小多项式是零化T的域F上的多项式理想的(唯一的)首项系数为一的生成元.

"极小多项式"这个名字来源于这个多项式理想的生成元可由理想中次数最小的首项系数为一多项式刻画. 这意味着线性算子T的极小多项式p由以下三条性质唯一确定:

  1. p是标量域F上的首项系数为一的多项式.
  2. p(T)=0.
  3. 没有能够零化T的域F上的多项式次数比p低.

如果A是域F上的一个n×n矩阵, 我们可以按照类似的方式定义A的极小多项式, 即域F上零化A的多项式理想的那个唯一的首项系数为一的生成元. 如果T在某个有序基下由矩阵A表示, 那么TA有着相同的极小多项式. 这是因为在这个基下f(T)由矩阵f(A)表示, 于是f(T)=0当且仅当f(A)=0.

上面关于算子和矩阵的评注也可说明相似矩阵拥有相同的极小多项式. 从定义看这个事实也是显然的, 因为对于每个多项式ff(P1AP)=P1f(A)P.

关于矩阵的极小多项式的另一个基本评注也是应该说的. 设A是一个n×n矩阵, 其元素来源于域F. 设F1是以F为子域的一个域. (例如, A的元素可能是有理数, 而F1是实数域. 或者, A的元素是实数, 而F1是复数域.) 我们既可以将A当成F上的矩阵, 也可以将其当作F1上的矩阵. 从表面上来看, 似乎我们会得到A的两个不同的极小多项式. 幸运的是, 这并不会发生, 我们必须明白为什么. 当A被视为域F上的n×n矩阵时, 其极小多项式的定义是什么? 我们考虑能够零化A的系数来源于F的首项系数为一的多项式, 并挑选其中次数最小的那个. 如果f是域F上的一个首项系数为一的多项式:f=xk+j=0k1ajxj那么f(A)=0仅仅是说我们有了一个A的幂之间的线性关系:Ak+ak1Ak1++a1A+a0I=0.极小多项式的次数是满足存在以上形式的I,A,,Ak之间的线性关系的最小的正整数k. 而且, 根据极小多项式的唯一性, 对于k而言有且仅有一种这样形式的关系, 即一旦最小的k确定下来了, 存在唯一的F中标量a0,,ak1能够使得以上形式的关系成立. 它们是极小多项式的系数.

现在(对于每个k)我们有一个"未知元"a0,,ak1的具n2个方程的线性方程组. [译注: 也就是考虑An2个元素得到的线性方程组.] 既然A的元素都在F中, 那么该线性方程组的系数也都在F中. 因此, 如果该方程组有F1中的a0,,ak1的解, 那么它就有F中的a0,,ak1的解. (见第1.4节末.) 现在读者显然可以看出两个极小多项式应该是相同的. [译注: 而且, 这是因为此时解是唯一的.]

到目前为止, 关于n维空间上的线性算子的极小多项式, 我们知道什么呢? 我们只知道它的次数不超过n2. 这实际上是一个相当糟糕的估计, 因为它的次数不可能超过n. 我们将简短地证明该算子由其特征多项式零化. 首先, 让我们观察到一个基本事实.

定理3.Tn维向量空间V上的一个线性算子 (或者, 令A是一个n×n矩阵), 那么T (或者A) 的特征多项式和极小多项式具有相同的根, 不计重数.
证明.pT的极小多项式. 令c是一个标量. 我们想要证明的是p(c)=0当且仅当cT的一个特征值.
首先, 设p(c)=0, 那么p=(xc)q其中q是一个多项式. 既然degq<degp, 那么极小多项式p的定义告诉我们q(T)0. 选择一个向量β使得q(T)β0. 令α=q(T)β, 那么0=p(T)β=(TcI)q(T)β=(TcI)αcT的一个特征值.
现在设cT的一个特征值, 即存在α0使得Tα=cα. 正如我们在之前的引理中所注意到的,p(T)α=p(c)α.既然p(T)=0α0, 我们有p(c)=0.

T是一个可对角化线性算子而c1,,ck是其不同的特征值, 那么很容易看出来T的极小多项式为p=(xc1)(xck).如果α是一个特征向量, 那么算子Tc1I,,TckI之一将α送至0, 因此对于每个特征向量α(Tc1I)(TckI)α=0.对于T所变换的空间, 存在一个全由T的特征向量构成的基, 于是p(T)=(Tc1I)(TckI)=0.总结一下. 如果T是一个可对角化的线性算子, 那么T的极小多项式是不同的线性因子之积. 我们很快将看到, 这个性质刻画了可对角化算子.

例子4. 让我们试着寻找一下例子1, 2, 3里的线性算子的极小多项式. 我们将以相反的顺序讨论它们. 例子3中的线性算子被我们发现是可对角化的, 并且其特征多项式为f=(x1)(x2)2.根据前一段的论述, 我们知道T的极小多项式为p=(x1)(x2).读者可能会发现直接验证一下(AI)(A2I)=0要更令人放心一点. 在例子2中, 算子T的特征多项式也是(x1)(x2)2. 但是, 这个T不是可对角化的, 所以我们并不能知道其极小多项式就是(x1)(x2). 在这种情况下, 关于极小多项式我们又知道什么呢? 从定理3中我们得知其根是12, 但是重数未知. 因此, 我们在具有形式(x1)k(x2)l,k1,l1的多项式中寻找p. 先试试(x1)(x2):(AI)(A2I)=[211211221][111201222]=[201201402]于是, 极小多项式的次数至少为3. 于是, 接下来我们应该尝试(x1)2(x2)或者(x1)(x2)2. 后者是特征多项式, 似乎是不那么随机的选择. 读者通过计算可以发现(AI)(A2I)2=0, 因此T的极小多项式就是其特征多项式. [译注: 虽然例子2中的T是实向量空间上的线性算子, 以至于看起来极小多项式和特征多项式拥有相同的根的事实并不能保证极小多项式就是由那两个线性因子的幂构成. 但是, 我们也可以将其当作复数域上的线性算子, 根据前面的论证, 其极小多项式也是一样的, 而复数域是代数闭域.] 在例子1中我们讨论了2上的线性算子T, 其在标准基下由矩阵A=[0110]表示. 它的特征多项式为x2+1, 其没有实根. 为了确定极小多项式, 让我们忘了T而专注于A. 如果将其视为复矩阵, 那么A具有特征值ii. 这两个根都必须出现在极小多项式的根里, 因而极小多项式被x2+1整除. 验证A2+I=0是平凡的, 于是极小多项式就是x2+1.
定理4. (Cayley-Hamilton).T是有限维向量空间V上的一个线性算子. 如果fT的特征多项式, 那么f(T)=0. 换言之, 极小多项式整除特征多项式.
证明. 之后我们将会给出另外两个独立于此证明的证明. 当前这个证明, 尽管比较短, 可能难以理解. 除了简洁性, 它还有一个优点, 就是提供了第5章建立的行列式理论的一个富于启发性且远非平凡的应用.
K是一个含幺交换环, 其由所有以T为变元的多项式构成. 当然, K实际上是一个标量域上的含幺元的交换代数. 选择V的一个有序基{α1,,αn}, 令A是在此给定基下表示T的矩阵, 那么Tαi=j=1nAj,iαj,1in.这些式子也可以被写成以下等价的形式j=1n(δi,jTAj,iI)αj=0,1in.BKn×n的元素为Bi,j=δi,jTAj,iI.n=2时, 有B=[TA1,1IA2,1IA1,2ITA2,2I]并且 [译注: 在某种意义上, 这里存在一个"类型错误", 因为det(B)是多项式而f(T)是一个线性算子, 更正确的陈述是det(B)=f, 至于多项式变元是何种符号则无关紧要. 下面仍然有许多类型错误, 还请读者自行甄别.]det(B)=(TA1,1I)(TA2,2I)A1,2A2,1I=T2(A1,1+A2,2)T+(A1,1A2,2A1,2A2,1)I=f(T)其中f是特征多项式:f=x2(traceA)x+det(A).对于n>2的情形, 显然也有det(B)=f(T)这是因为f是矩阵xIA的行列式, 该矩阵的元素为多项式 [译注: 这里作者不小心将Ai,j写成了Aj,i, 但是不影响论证的合法性, 因为转置并不影响矩阵的行列式的值](xIA)i,j=δi,jxAi,j.我们想要证明f(T)=0. 为了证明f(T)是零算子, 只需要证明其充要条件就够了, 即对于k=1,,n(detB)αk=0. 根据B的定义, 向量α1,,αn满足等式j=1nBi,jαj=0,1in.n=2时, 它或许暗示我们将其写成以下形式 [译注: 这完全是形式上的, 至于其内在的涵义, 则需要读者仔细考察, 下面的推理亦是如此][TA1,1IA2,1IA1,2ITA2,2I][α1α2]=[00].在此情形之下, 古典伴随(adjB)是矩阵B~=[TA2,2IA2,1IA1,2ITA1,1I]并且B~B=[det(B)00det(B)].因此, 我们有(detB)[α1α2]=(B~B)[α1α2]=B~(B[α1α2])=[00]一般情况下, 令B~=(adjB), 那么对于每对ki, 根据B的定义可得 [译注: 这里的B~k,i只是附带的系数, 不被求和所绑定]j=1nB~k,iBi,jαj=0i上求和, 我们有0=i=1nj=1nB~k,iBi,jαj=j=1n(i=1nB~k,iBi,j)αj既然B~B=(detB)I, 于是i=1nB~k,iBi,j=δk,j(detB)因此对于k=1,,n, 我们得到0=j=1nδk,j(detB)αj=(detB)αk
证明. 以上证明的叙述有些混乱, 译者在此试图将其整理成更加清晰易读的形式. 设{α1,,αn}V的一个有序基, 而AT在此有序基下的矩阵表示. 令B=xIA, 这是多项式环上的矩阵. 另外, 设fT的特征多项式, 那么我们知道det(B)=f, 以及B(adjB)=fI. 根据A的定义, 我们知道i=1nBi,j(T)αi=0,1jn.这里的Bi,j是一个多项式, 而应用一个多项式于线性算子是第4章所定义的操作, 其结果仍然是一个线性算子. 接着, 我们可以推出对于k=1,,n0=(adjB)j,k(T)(i=1nBi,j(T)αi)=i=1n(adjB)j,k(T)Bi,j(T)αi=i=1n[(adjB)j,kBi,j](T)αi=i=1n[Bi,j(adjB)j,k](T)αij上求和, 我们得到0=j=1ni=1n[Bi,j(adjB)j,k](T)αi=i=1nj=1n[Bi,j(adjB)j,k](T)αi=i=1n(j=1n[Bi,j(adjB)j,k](T))αi=i=1n(j=1nBi,j(adjB)j,k)(T)αi=i=1nδi,k(detB)(T)αi=i=1nδi,kf(T)αi分别令k=1,,n, 可得f(T)αk=0,1kn既然{α1,,αn}V的一个基, 而f(T)在基的每个向量上都为零, 那么f(T)本身肯定是一个零变换.

译者注记. 以上我们补充的证明中的B和原来的证明中的B恰好是互为转置的关系. 读者可以看到, 这并不影响证明, 只是原本与矩阵乘法在形式上暗合的推理变成了转置了的顺序反转的版本而已. 作者的潜在想法实际上是这样的, 虽然原文只是在2×2的情况下提了一下. 对于多项式上的矩阵, 我们可以定义一个应用矩阵于线性算子的entrywise操作, 其结果是一个以线性算子为元素的矩阵, 即将多项式上的矩阵的逐个元素应用于线性算子得到的矩阵. 这个操作可以保持矩阵乘法, 即如果AB是多项式上的矩阵, 而T是一个线性算子, 那么(AB)(T)=A(T)B(T). 这里的A(T)B(T)纯粹是形式上的矩阵乘法, 其每个元素都是线性算子相乘再相加得到的. 虽然线性算子在一般情况下并不交换, 但在这里相乘的顺序的确没有那么重要, 因为我们知道对于多项式pqp(T)q(T)=q(T)p(T). 除了应用多项式矩阵于线性算子和线性算子矩阵的乘法之外, 我们还需要定义应用线性算子的矩阵于向量的列矩阵的形式操作, 这点在形式上当然和矩阵乘法也是一样的, 只是乘法变成了函数应用而已. 关键的一点在于, 如果C是这样一个向量的列矩阵, 那么A(T)[B(T)C]=[A(T)B(T)]C这个形式上的"乘法结合律"的确也是成立的. 在定义了这些形式操作并知道这几条性质之后, 那么Cayley-Hamilton的证明的确没有什么魔法可言.

此时此刻Cayley-Hamilton定理对于我们有用主要是因为它缩小了我们寻找线性算子的极小多项式的搜索范围. 如果我们知道了在某个有序基下表示T的矩阵A, 那么我们可以计算特征多项式f. 我们知道极小多项式p整除f, 并且它们拥有相同的根. 不过, 除非次数很小, 没有方法可以精确计算多项式的根. 然而, 如果f可以被分解为f=(xc1)d1(xck)dk,c1,,ck各不相同,di1那么p=(xc1)r1(xck)rk,1rjdj.这就是在一般情况下我们能够断言的全部事情了. 如果f的确是这样的多项式并且其次数为n, 那么对于每个具有这种形式的多项式p, 我们可以找到一个n×n的矩阵满足以f为特征多项式而p为极小多项式. 暂时我们还不会证明这个. 但是, 我们想强调的是, 具有这种形式的特征多项式告诉我们了极小多项式所具有的形式. 至于其他内容, 则无可奉告.

例子5.A4×4的(有理数)矩阵A=[0101101001011010].A的幂是容易计算的:A2=[2020020220200202],A3=[0404404004044040].因此, A3=4A, 即如果p=x34x=x(x+2)(x2), 那么p(A)=0. A的极小多项式必然整除p. 这个极小多项式的次数显然不是1, 因为次数为1意味着A是恒等矩阵的标量倍数. 因此, 极小多项式的候选者为: p,x(x+2),x(x2),x24. 这三个二次的多项式也很容易排除, 因为一眼就能看出A22A, A22A, A24I. 于是, pA的极小多项式. 并且, 0,2,2A的特征值. 特征多项式里x,x2,x+2这三个因子之一必然要重复两次. 显然, rank(A)=2. 因此, 与特征值0相关联的特征空间是2维的. 根据定理2, 特征多项式显然是x2(x24), 并且A在有理数域上相似于矩阵[0000000000200002].
练习1.V是有限维向量空间. V上的恒等算子的极小多项式是什么? V上的零算子的极小多项式是什么?
练习2.a,b,c是一个域F的元素, A是以下F上的3×3矩阵:A=[00c10b01a].证明A的特征多项式为x3ax2bxc, 并且这也是A的极小多项式.
练习3.A4×4的实矩阵A=[1100110022211110].证明A的特征多项式为x2(x1)2, 而这也是其极小多项式.
练习4. 练习3的矩阵A在复数域上是可对角化矩阵吗?
练习5.V是一个n维向量空间而TV上的一个线性算子. 设存在某个正整数k使得Tk=0, 证明Tn=0.
练习6. 找出一个3×3的矩阵, 其极小多项式是x2.
练习7.n是一个正整数, V是次数不超过n的实多项式的向量空间, DV上的微分算子. D的极小多项式是什么?
练习8.P2上将每个向量平行于y轴投影于x轴的算子: P(x,y)=(x,0). 表明P是线性的. P的极小多项式是什么?
练习9.A是一个n×n的矩阵, 其特征多项式为f=(xc1)d1(xck)dk.证明c1d1++ckdk=trace(A).
练习10.V是域F上的n×n矩阵的向量空间. 令A是一个固定的n×n矩阵. 令TV上由T(B)=AB定义的线性算子. 证明T的极小多项式是A的极小多项式.
练习11.AB是域F上的n×n矩阵. 根据6.2节的练习9, 矩阵ABBA拥有相同的特征值. 它们有着相同的特征多项式吗? 它们有着相同的极小多项式吗?

第6.4节 不变子空间

本节我们将引入一些在试图分析一个线性算子时有用的概念. 我们将运用这些想法来获得基于极小多项式的对于可对角化 (和可三角化) 算子的刻画.

定义.V是一个向量空间而TV上的一个线性算子. 如果WV的一个子空间, 那么我们称WT下不变, 如果对于每个向量αW有向量TαW, 即T(W)W.
例子6. 如果TV上任意的线性算子, 那么V和零子空间在T下不变. T的像和零空间也在T下不变.
例子7.F是一个域而D是多项式空间F[x]上的微分算子. 令n是正整数而W是次数小于等于n的多项式的子空间, 那么WD下不变. 这只是另一种陈述D是"次数降低"的算子的方式.
例子8. 这里给出例子6的一种非常有用的泛化. 令TV上的一个线性算子, U是任意的与T交换的线性算子, 即TU=UT. 令WU的像, 而NU的零空间, 那么WN都在T下不变. 如果αU的像中, 比如说α=Uβ, 那么Tα=T(Uβ)=U(Tβ), 于是Tα也在U的像中. 如果αN, 那么U(Tα)=T(Uα)=T(0)=0, 因而TαN.
U=g(T)是一类与T交换的算子, 其中g是一个多项式. 例如, 我们可以有U=TcI, 其中cT的一个特征值. 这个U的零空间对于我们而言是熟悉的. 我们看到这个例子包含了显见的事实, 即与某个特征值c相关联的T的特征空间在T下是不变的.
例子9.T2上的线性算子, 其在标准有序基下由矩阵A=[0110]表示, 那么在T下不变的仅有2平凡的子空间. 若有其他的不变子空间, 那它必然是1维的. 但是, 若W是由某个非零向量α张成的子空间, 那么WT下不变的事实意味着α是一个特征向量, 但是A没有实特征值.

当子空间W在算子T下不变时, T导出了空间W上的一个线性算子TW, 其由TW(α)=T(α),αW定义. 不过, TWT是相当不同的对象, 因为其定义域是W而不是V.

V是有限维的, 那么WT下的不变性有一个简单的矩阵解释, 或许我们现在就应该提到它. 设我们选取了V的一个有序基𝔅={α1,,αn}使得𝔅={α1,,αr}W的一个有序基 (r=dimW). 令A=[T]𝔅, 于是Tαj=i=1nAi,jαi.既然WT下不变, 那么对于jrTαjW, 这意味着Tαj=i=1rAi,jαi,jr.换言之, 对于jri>r, Ai,j=0.

若试图将A写下来, 其具有分块形式A=[BC0D]其中B是一个r×r矩阵, C是一个r×(nr)矩阵, D是一个(nr)×(nr)矩阵. 读者应该注意到, 根据定义, 矩阵B恰是导出算子TW在有序基𝔅下的矩阵.

往往我们并不利用矩阵A的分块形式展开关于TTW的论证, 但是我们应该注意到这样的分块形式呈现了TTW之间怎样的显然关系.

引理.WT下不变的子空间. 限制算子TW的特征多项式整除T的特征多项式. TW的极小多项式整除T的极小多项式.
证明. 我们有A=[BC0D]其中A=[T]𝔅B=[TW]𝔅. 对于这样的分块形式, 我们知道det(xIA)=det(xIB)det(xID).此即证明了关于特征多项式的陈述. 注意到这里的三个I的大小是不同的.
矩阵Ak次幂具有分块形式Ak=[BkCk0Dk]其中Ck是某个r×(nr)的矩阵. 因此, 任何零化A的多项式也零化B (还有D). 于是, B的极小多项式整除A的极小多项式.

译者注记. 对于多项式f, f(A)具有形式f(A)=[f(B)Cf0f(D)]其中Cf是某个r×(nr)的矩阵. 另外, 关于分块矩阵的运算性质, 原书几乎没有任何讨论, 或许读者应该参考其他线性代数教材.

例子10.T是有限维向量空间V上任意的线性算子. 令WT的所有特征向量张成的子空间. 令c1,,ckT不同的特征值. 对于每个i, 令Wi是与特征值ci相关的特征空间, 并令𝔅iWi的一个有序基. 定理2前的引理告诉我们𝔅=(𝔅1,,𝔅k)W的一个有序基, 因而dimW=dimW1++dimWk.𝔅={α1,,αr}, 其中最前面的一些向量构成了基𝔅1, 接下来的一些构成了基𝔅2, 诸如此类. 那么, 我们得到Tαi=tiαi,i=1,,r其中(t1,,tr)=(c1,c1,,c1,,ck,ck,,ck)ci重复dimWi次.
现在WT下不变, 因为对于每个αW, 我们有α=x1α1++xrαr,Tα=t1x1α1++trxrαr.选取任意其他的向量αr+1,,αnV使得𝔅={α1,,αn}V的一个基, 那么T𝔅下的矩阵具有之前所呈现的那种分块形式, 并且限制算子TW相对于基𝔅的矩阵为B=[t1000t2000tr].B (即TW) 的特征多项式为g=(xc1)e1(xck)ek其中ei=dimWi. 而且, g整除f, fT的特征多项式. 因此, ci作为f的根的重数至少为dimWi.
以上这些讨论应该能够使得定理2透明起来. 它仅仅是说T是可对角化的当且仅当r=n, 当且仅当e1++ek=n. 在不可对角化的情形下, 它不是很有用, 因为我们不知道分块形式中的矩阵CD是什么.
定义.WT下不变的子空间, 而αV中向量. 从αWT导子 (T-conductor) 是集合ST(α;W), 其由所有(标量域上)满足g(T)αW的多项式g构成.

既然算子T在大多数讨论中都是固定的, 我们也常扔掉下标T而就记作S(α;W). 许多作者通常将这个多项式的集合称为"stuffer" (das einstopfende Ideal). "conductor"是更标准的术语, 想象一下, 一个不那么激进的算子g(T), 温和地将向量α送往W. 在W={0}的特别情况下, 这个导子也被称为αT零化子 (T-annihilator).

引理. 如果WT下不变的子空间, 那么对于每个多项式f, Wf(T)下不变. 因此, 对于每个αV, 导子S(α;W)是多项式代数F[x]中的一个理想.
证明. 如果βW, 那么TβW. 因此, T(Tβ)=T2βW. 根据归纳, 对于每个自然数kTkβW. 取线性组合则能看出对于每个多项式f, f(T)βW.
即便WV的任意子集, S(α;W)的定义还是可以成立的. 如果WV是子空间, 那么S(α;W)F[x]的子空间, 因为(cf+g)(T)=cf(T)+g(T).如果W还在T下不变, 令多项式gS(α;W), 即g(T)αW. 如果f是任意的多项式, 那么f(T)[g(T)α]W. 既然(fg)(T)=f(T)g(T),那么fgS(α;W). 因此, 导子吸收了乘法.

理想S(α;W)唯一的首项系数为一的生成元也被称为从αWT导子 (在W={0}的情况下也被称为T零化子). 从αWT导子是满足g(T)αW的次数最低的首项系数为一的多项式g. 多项式fS(α;W)当且仅当g整除f. 注意到导子S(α;W)总是包含T的极小多项式. 因此, 每个T导子都整除T的极小多项式.

作为如何使用导子S(α;W)的第一个例子, 我们将刻画可三角化算子. 线性算子T被称为是可三角化的, 如果其在某个有序基下由三角矩阵表示.

引理.V是域F上的一个有限维向量空间. 令TV上的线性算子, 其极小多项式为线性因子之积p=(xc1)r1(xck)rk,ciF.WT下不变的一个真子空间 (WV). 存在向量αV满足
  1. αW;
  2. (TcI)αW, 其中c是线性算子T的某个特征值.
证明. a和b是在说从αWT导子是一个线性的多项式. 令βV是任意的不在W之中的向量. 令g是从βWT导子, 那么g整除p, 其中pT的极小多项式. 既然βW, 多项式g不可能是常量多项式. 因此,g=(xc1)e1(xck)ek其中至少有一个ei是正的. 选择使得ej>0j, 那么(xcj)整除g:g=(xcj)h.根据g的定义, 向量α=h(T)βW, 但是(TcjI)α=(TcjI)h(T)β=g(T)βW
定理5.V是域F上的一个有限维向量空间, TV上的一个线性算子, 那么T是可三角化的当且仅当T的极小多项式是域F上的线性多项式之积.
证明. 设极小多项式被分解为p=(xc1)r1(xck)rk.重复应用上述引理, 我们将会抵达一个有序基𝔅={α1,,αn}, 而其下表示T的矩阵是上三角的:[T]𝔅=[a1,1a1,2a1,3a1,n0a2,2a2,3a2,n00a3,3a3,n000an,n].这个式子仅仅是说Tαj=a1,jα1++aj,jαj,1jnTαj在由α1,,αj张成的子空间之中. 为了找出α1,,αn, 我们从应用引理于W={0}的情形开始, 这就得到了向量α1. 接着, 应用引理于W1, 此即α1张成的空间, 我们就得到了α2. 然后, 应用引理于W2, 即由α1α2张成的空间, 续行此法. 值得说明的是, 在α1,,αi找到后, 上面这样的三角类型的关系对于j=1,,i成立, 这保证了由α1,,αi张成的子空间在T下是不变的.
如果T是可三角化的, 那么显然T的特征多项式具有形式f=(xc1)d1(xck)dk,ciF.看看上面的三角矩阵, 我们知道对角线元素a1,1,,an,n是其特征值, 其中ci重复di次. 但是, 如果特征多项式f可以被这么分解, 那么极小多项式p当然也可以, 因为p整除f.
推论.F是代数闭域, 例如复数域, 那么每个域F上的n×n矩阵都在F上相似于一个三角矩阵.
定理6.V是域F上的有限维向量空间, TV上的一个线性算子, 那么T是可对角化的当且仅当T的极小多项式具有形式p=(xc1)(xck)其中c1,,ckF的不同元素.
证明. 之前我们已经注意到, 如果T是可对角化的, 那么极小多项式是不同的线性因子之积 (见例子4前的讨论). 为了证明其逆, 令WT的所有特征向量张成的子空间, 并设WV. 根据定理5的证明所用到的引理, 存在向量αWT的一个特征值cj满足β=(TcjI)αW.既然βW, 那么β=β1++βk其中Tβi=ciβi,1ik, 因而对于每个多项式hh(T)β=h(c1)β1++h(ck)βkW.既然p=(xcj)q, 其中q是某个多项式, 并且qq(cj)=(xcj)h我们有q(T)αq(cj)α=h(T)(TcjI)α=h(T)β但是h(T)βW, 并且因为0=p(T)α=(TcjI)q(T)α向量q(T)αW, 于是q(cj)αW. 既然αW, 我们有q(cj)=0, 但这与p的根互异矛盾 [译注: 显然, 此时需要计入重数].

在第6.7节末, 我们将给出定理6的另一个证明. 定理6除了作为优雅的结果, 其在计算方面也是实用的. 设我们有一个线性算子T, 在某个有序基下由矩阵A表示, 现在我们想要知道T是否是可对角化的. 我们计算其特征多项式f, 如果我们可以将f分解为f=(xc1)d1(xck)dk那么我们有两种判断的方法. 第一种方法是看我们能否对于每个i找到与特征值ci相关的di个线性无关的特征向量. 另一种方法是检验(Tc1I)(TckI)是否是零算子.

定理5提供了对于Cayley-Hamilton定理的一个不同的证明. 这个定理对于三角矩阵而言是容易证明, 而通过定理5, 对于任意代数闭域上的矩阵我们都可以得到此结果. 实际上, 任何域都是某个代数闭域的子域. 如果读者知道这个结果, 那么就得到了任意域上的矩阵的Cayley-Hamilton定理. 如果我们至少承认我们对于代数基本定理 (即复数域是代数闭域) 的讨论, 那么定理5提供了对于复矩阵的Cayley-Hamilton的一个证明, 此证明独立于我们之前所给出的.

练习1.T2上的线性算子, 其在标准有序基下的矩阵为A=[1122].
  1. 证明T的不变子空间仅可能是平凡的.
  2. 如果U2上的线性算子, 其在标准有序基下的矩阵和T一样, 表明U拥有一维的不变子空间.
练习2.WT的一个不变子空间. 证明限制算子TW的极小多项式整除T的极小多项式, 但是不涉及矩阵的概念.
练习3.cT的一个特征值, W是与特征值c相关的特征空间. 限制算子TW是什么?
练习4.A=[010222232].A在实数域上相似于三角矩阵吗? 如果可以, 找出这样的一个三角矩阵.
练习5. 每个满足A2=A的矩阵A都是可对角化的.
练习6.Tn维向量空间V上的一个可对角化算子, W是在T下不变的一个子空间. 证明限制算子TW也是可对角化的.
练习7.T是域上的一个有限维向量空间上的一个线性算子. 证明T是可对角化的当且仅当T可由某个域上根互异的多项式零化.
练习8.TV上的一个线性算子. 如果V的每个子空间都在T下不变, 那么T是恒等算子的标量倍数.
练习9.T是区间[0,1]上的连续函数空间上的不定积分算子(Tf)(x)=0xf(t)dt.多项式函数空间在T下不变吗? 可微函数空间呢? x=12时为零的函数空间呢?
练习10.A是一个3×3的实矩阵. 证明如果A上不相似于一个三角矩阵, 那么A上相似于一个对角矩阵.
练习11. 对还是错? 若三角矩阵A相似于一个对角矩阵, 那么A已经是一个对角矩阵了.
练习12.T是某个代数闭域F上的一个有限维向量空间上的一个线性算子, f是域F上的一个多项式. 证明cf(T)的特征值当且仅当c=f(t), 其中tT的一个特征值.
练习13.V=Fn×n, AV, V上的线性算子TU分别由T(B)=AB,U(B)=ABBA定义.
  1. 对还是错? 如果A(在F上)可对角化, 那么T是可对角化的.
  2. 对还是错? 如果A是可对角化的, 那么U是可对角化的.

第6.5节 同时三角化; 同时对角化

V是一个有限维向量空间, 𝔉V上的一族线性算子. 我们可以问何时能够同时三角化或者对角化这些𝔉中的线性算子, 即找到一个基𝔅使得矩阵[T]𝔅,T𝔉都是三角矩阵 (或者对角矩阵). 在可对角化的情形, 𝔉必然是可交换算子族, 即对于所有T,U𝔉, UT=TU. 当然, 每个𝔉中的算子也必然是可对角化的. 为了同时三角化, 每个𝔉中的算子必然是可三角化的, 但是𝔉不必是一个可交换算子族. 然而, 可交换是同时三角化的充分条件 (如果每个T都可以被单独三角化). 这些结果只需对于定理5和定理6的证明作小的修改即可得到.

子空间W在算子族𝔉下不变, 如果其在𝔉中的每个算子下不变.

引理.𝔉V上一个可三角化算子的交换族. 令W是一个V的真子空间, 其在𝔉下不变. 存在V中向量α满足
  1. αW;
  2. 对于每个T𝔉, 向量TααW张成的子空间之中.
证明. 不失一般性, 假定𝔉仅包含有限数目的算子, 这是出于以下观察. 令{T1,,Tr}𝔉的一个极大线性无关子集, 即𝔉张成的子空间的一个基. 如果α是使得b对于每个Ti成立的向量, 那么b将对于T1,,Tr的每个线性组合成立.
根据定理5之前的引理 (这个引理是对于单一的算子而言的), 我们可以找到向量β1W和标量c1满足(T1c1I)β1W. 令V1={βV|(T1c1I)βW}, 那么V1V的一个子空间且以W为真子空间. 更进一步, V1𝔉下不变, 以下是原因. 如果TT1交换, 那么(T1c1I)(Tβ)=T(T1c1I)β.如果βV1, 那么(T1c1I)βV1. 既然W𝔉下不变, 那么对于每个βV1和每个T𝔉, 我们有T(T1c1I)βW, 即TβV1.
现在WV1的一个真子空间. 令U2是由T2限制于子空间V1得到的线性算子. U2的极小多项式整除T2的极小多项式. 因此, 我们可以应用定理5之前的引理于U2和不变子空间W. 我们得到了一个向量β2V1但是β2W和一个标量c2满足(T2c2I)β2W. [译注: 实际上先是U2, 然后变为T2.] 注意到
  1. β2W;
  2. (T1c1I)β2W;
  3. (T2c2I)β2W.
V2={βV1|(T2c2I)βW}, 那么V2𝔉下不变. 应用定理5之前的引理于U3, 即限制T3V2得到的算子. 不断重复施行这样的过程, 我们将抵达一个向量α=βrW满足(TjcjI)αW,j=1,,r.
定理7.V是域F上的一个有限维向量空间. 令𝔉V上的一个可三角化算子的交换族. 存在V的一个有序基使得每个𝔉中的算子在这个基下都由三角矩阵表示.
证明. 考虑到刚才我们证明的引理, 这个定理的证明和定理5是一样的, 如果读者将T替换为𝔉.
推论.𝔉是某个代数闭域F上的一个n×n矩阵的交换族, 存在域F上的一个非奇异矩阵P使得对于每个矩阵A𝔉, P1AP是上三角矩阵.
定理8.𝔉是有限维向量空间V上的一个可对角化算子的交换族, 存在V的一个有序基使得每个𝔉中的算子在这个基下都由对角矩阵表示.
证明. 我们可以修饰定理7之前的引理, 使其适应于可对角化的情形, 以此来证明定理8. 之前在证明定理6的时候, 我们就已经这么做了, 通过修饰定理5之前的引理以使其适应于可对角化的情形. 然而, 此时通过V的维数上的归纳进行证明是更加容易的.
如果dimV=1, 没有需要证明的东西. 假定定理对于维数小于n的向量空间成立, 令V是一个n维空间. 选择任意不是恒等算子标量倍数的算子T𝔉. [译注: 若不然, 则𝔉中的算子在任意的基下均可同时对角化.] 令c1,,ckT不同的特征值, 并令Wici所对应的特征空间. [译注: k2.] 固定一个下标i, 那么Wi在任意与T交换的算子下都是不变的. 令𝔉i是限制𝔉中算子于(不变)子空间Wi的线性算子族. 因为限制算子的极小多项式整除本来的算子的极小多项式, 所以每个𝔉i中的算子也都是可对角化的. 既然dimWi<dimV, 根据归纳假设, 𝔉i中的算子可以被同时对角化. [译注: 这个限制算子族当然也是交换的族.] 换言之, Wi拥有一个基𝔅i, 其包含的向量同时为每个𝔉i中的算子的特征向量.
既然T是可对角化的, 定理2之前的引理告诉我们𝔅=(𝔅1,,𝔅k)V的一个基. 这就是我们要找的基.
练习1. 找到一个可逆的实矩阵P使得P1APP1BP都是对角矩阵, 其中AB是实矩阵
  1. A=[1202],B=[3801]
  2. A=[1111],B=[1aa1]
练习2.𝔉是一个3×3复矩阵的交换族. 𝔉至多可以包含多少线性无关的矩阵? n×n的情形呢?
练习3.Tn维空间V上的一个线性算子, 设T具有n个不同的特征值. 证明对于任意与T交换的线性算子U, 存在多项式g使得U=g(T).
练习4.A,B,C,D是交换的n×n复矩阵. 令E2n×2n矩阵E=[ABCD].证明det(E)=det(ADBC).
练习5.V=Fn×n, AV, V上的线性算子TA(B)=ABBA. 考虑线性算子族{TAL(V,V)|A为对角矩阵}, 证明其可以被同时对角化.

第6.6节 直和分解

当我们继续分析单一的线性算子, 我们将以稍微复杂一点的方式刻画我们的想法——基于子空间而不是矩阵. 本章之初, 我们这样描述我们的目的: 找到一个基使得线性算子的矩阵呈现特别简单的形式. 现在, 我们将我们的目的描述为: 将线性算子所在的空间分解为不变子空间的直和使得这些子空间上的限制算子是简单的.

定义.W1,,Wk是向量空间V的子空间. 我们称W1,,Wk是线性无关的, 如果α1++αk=0,αiWi可以推出每个αi=0.

对于k=2, W1W2线性无关当且仅当W1W2={0}. 如果k>2, W1,,Wk线性无关不仅是说W1Wk={0}, 实际上每个Wj与其他子空间Wi之交都仅是零子空间.

W=W1++Wk, 那么每个向量αW均可被表示为和α=α1++αk,αiWi.线性无关的重要性在于, 如果W1,,Wk是线性无关的, 那么α的这种表示是唯一的, 因为如果α=β1++βk,βiWi那么0=(α1β1)++(αkβk), 于是αiβi=0,i=1,,k. 因此, 当W1,,Wk线性无关时, 我们可以将W中的向量当作k元组(α1,,αk),αiWi操作, 就像我们操作k的向量一样.

引理.V是有限维向量空间, W1,,WkV的子空间, W=W1++Wk, 那么以下条件等价.
  1. W1,,Wk线性无关.
  2. 对于每个j,2jk, 我们有Wj(W1++Wj1)={0}.
  3. 如果𝔅iWi的一个有序基, 其中1ik, 那么𝔅=(𝔅1,,𝔅k)W的一个有序基.
证明. 假定a成立, 令向量αWj(W1++Wj1), 那么存在向量α1,,αj1,αiWi满足α=α1++αj1. 鉴于α1++αj1+(α)+0++0=0以及W1,,Wk是线性无关的, 必然有α1=α2==αj1=α=0.
现在我们证明b可以推出a. 假定b成立, 若a不成立, 存在不全为零的向量α1,,αk,αiWi使得0=α1++αk.j=max{i|αi0}, j是良定义的, 那么0=α1++αj,αj0于是αj=α1αj1Wj(W1++Wj1)中的一个非零向量, 这与条件b相矛盾.
现在我们已经知道a和b是等价的, 让我们看看为什么a等价于c. 假定a成立, 令𝔅iWi的一个基, 其中1ik, 并设𝔅=(𝔅1,,𝔅k). 𝔅中向量之间任意的线性关系都具有形式β1++βk=0其中βi𝔅i的某个线性组合. 既然W1,,Wk是线性无关的, 每个βi都是0. 又因为每个𝔅i都是线性无关的, 𝔅中的向量之间的线性关系只可能是平凡的. [译注: 这段论证实际上是从定理2之前的引理以及该引理的证明那里照搬过来的.]
我们将由c推出a的证明留作练习 (练习2).

若以上引理中任意的条件成立 (自然其他条件也成立), 那么我们称和W=W1++Wk是直的, 或者说WW1,,Wk的直和, 记作W=W1Wk.在其他文献中, 读者会发现这种和也被称为W1,,Wk的独立和或者内直和.

例子11.V是域F上的一个有限维向量空间, {α1,,αn}V任意的基. 如果Wi是由αi张成的一维子空间, 那么V=W1Wn.
例子12.n是一个正整数, F是复数域的一个子域, VFn×n, W1是所有对称矩阵构成的子空间, W2是所有斜对称矩阵构成的子空间, 那么V=W1W2. 如果AV, 那么A作为W1的向量和W2的向量之和的唯一表达为A=A1+A2,A1=12(A+At),A2=12(AAt).
例子13.T是有限维向量空间V上任意的线性算子, c1,,ck是其不同的特征值, Wici对应的特征空间, 那么W1,,Wk是线性无关的, 见定理2之前的引理. 特别地, 如果T是可对角化的, 那么V=W1Wk. [译注: 特征值当然有可能并不存在.]
定义. 如果V是一个向量空间, V的一个投影是V上一个满足E2=E的线性算子E.

E是一个投影, 令RE的像, NE的零空间.

  1. 向量βR当且仅当Eβ=β. 若存在α使得β=Eα, 那么Eβ=E2α=Eα=β. 反过来, 如果β=Eβ, 那么(当然有)βR.
  2. V=RN.
  3. α作为RN的向量之和的唯一表达为α=Eα+(αEα).
根据1, 2, 3, 很容易看出以下事实. 如果RNV的子空间满足V=RN, 那么存在唯一的投影算子ER为像且以N为零空间. 这个算子被称为沿着NR上的投影.

任意的投影E都可以被(平凡地)对角化. 如果{α1,,αr}R的一个基, {αr+1,,αn}N的一个基, 那么基𝔅={α1,,αn}可以对角化E:[E]𝔅=[I000]其中Ir×r的恒等矩阵. 这有助于解释某些和投影相关的术语. 读者应该看看平面2或者空间3里的各种例子以使得他们信服投影具有特定的几何意义.

投影可以用来刻画空间V的直和分解. 设V=W1Wk. 对于每个j我们可以定义一个V上的算子Ej. 令αV, 若α=α1++αk,αiWi, 定义Ejα=αj, 那么Ej是良定义的法则. 容易看出Ej是线性的, Ej的像是Wj, 以及Ej2=Ej. Ej的零空间是子空间(W1++Wj1+Wj+1++Wk).这是因为Ejα=0的意思即αj=0, 或者说α是除了Wj之外的子空间Wi的向量的和. 基于投影Ej, 对于每个αV, 我们有α=E1α++Ekα.这是在说I=E1++Ek.注意到如果ij, 那么EiEj=0, 因为Ej的像Wj包含于Ei的零空间之中. 我们现在将我们的发现总结如下, 并证明其逆.

定理9. 如果V=W1Wk, 那么存在V上的k个线性算子E1,,Ek满足
  1. 每个Ei都是投影, 即Ei2=Ei;
  2. ij, 那么EiEj=0;
  3. I=E1++Ek;
  4. Ei的像是Wi.
反过来, 如果E1,,EkV上的k个线性算子并且满足条件i, ii, iii, 令WiEi的像, 那么V=W1Wk. [译注: 实际上, ii和iii可以推出i.]
证明. 我们仅需证明逆命题. 设E1,,EkV上满足前三个条件的线性算子, 令WiEi的像, 那么定有V=W1++Wk这是因为根据条件iii, 对于每个αV我们有α=E1α++EkαEiαWi. 这个α的表达方式是唯一的, 因为若α=α1++αkαiWi, 即存在βi满足αi=Eiβi, 那么根据i和ii我们有Ejα=i=1kEjαi=i=1kEjEiβi=Ej2βj=Ejβj=αj这表明VWi的直和.
练习1.V是一个有限维向量空间, W1V任意的子空间, 证明存在V的子空间W2满足V=W1W2.
练习2.V是一个有限维向量空间, 而W1,,Wk是满足V=W1++WkdimV=dimW1++dimWk的子空间, 证明V=W1Wk.
练习3. 寻找这样一个投影E, 其将2沿着由(1,2)张成的子空间投影至由(1,1)张成的子空间.
练习4. 如果E1E2是投影至线性无关的子空间的算子, 那么E1+E2也是一个投影, 对还是错呢?
练习5. 如果E是一个投影而f是一个多项式, 那么f(E)=aI+bE. 如何以f的系数表示ab?
练习6. 对还是错? 如果一个可对角化算子的特征值仅是01, 那么它是一个投影.
练习7. 证明如果E是沿着NR上的投影, 那么(IE)是沿着RN上的投影.
练习8.E1,,Ek是空间V上满足E1++Ek=I的线性算子.
  1. 证明若ij时有EiEj=0, 那么对于每个iEi2=Ei.
  2. k=2的情形下, 证明a的逆, 即若有E1+E2=IE12=E1,E22=E2, 那么E1E2=0.
练习9.V是一个实向量空间, EV上的一个幂等线性算子, 即投影, 证明(I+E)是可逆的, 并找出(I+E)1是什么.
练习10.F是复数域的一个子域 (或者一个特征为零的域), VF上的一个有限维向量空间, E1,,EkV的投影并且满足E1++Ek=I. 证明如果ij, 那么EiEj=0. (提示: 使用迹函数并问问自己投影的迹是什么.)
练习11.V是一个向量空间, W1,,WkV的子空间, Vj=W1++Wj1+Wj+1++Wk.V=W1Wk, 证明对偶空间V拥有直和分解V=V10Vk0.

第6.7节 不变直和

我们主要对于这样的直和分解V=W1Wk感兴趣, 其每个子空间Wi都在某个给定的线性算子T下不变. 给定这样一种对于V的分解, T通过限制导出了每个Wi上的线性算子Ti. T的作用方式如下. 如果αV, 那么我们有着唯一的分解α=α1++αk,αiWi然后Tα=T1α1++Tkαk.我们将这种情况描述为T是算子T1,,Tk的直和. 必须要记得使用此术语时Ti不是V上而是子空间Wi上的线性算子. V=W1Wk的事实允许我们将每个αV与唯一的一个k元组(α1,,αk)联系起来, 其中αiWi (通过α=α1++αk), 再加上每个Wi都在T下不变, 我们可以将TV上的作用视为TiWi上的各独立作用之和. 我们寻找不变直和分解的最终目的当然还是研究T, 分解中的每个Ti的性质都应该是比较简单的.

在观察例子之前, 让我们先来指出其矩阵形式的类比. 设我们为每个Wi挑选了一个有序基𝔅i, 那么𝔅=(𝔅1,,𝔅k)V的一个有序基. 根据之前讨论单一不变子空间的矩阵类比的经验, 很容易看出来如果A=[T]𝔅Ai=[Ti]𝔅i, 那么A具有分块形式A=[A1000A2000Ak].

往往我们藉由与直和分解相关联的投影来刻画那些子空间 (定理9), 于是我们需要能够基于投影来重述不变直和.

定理10.T是空间V上的一个线性算子, 而W1,,WkE1,,Ek的情况和定理9一样, 那么每个Wi都在T下不变的充要条件是T与每个Ei交换, 即TEi=EiT,i=1,,k.
证明.T与每个Ei交换. 令αWj, 那么Ejα=α, 并有Tα=T(Ejα)=Ej(Tα)这表明TαWj, 即WjT下不变.
现在假定每个Wi都在T下不变, 我们将证明TEj=EjT. 令αV, 那么α=E1α++Ekα,Tα=TE1α++TEkα.因为EiαWi, 并且WiT下不变, 于是T(Eiα)Wi, 存在向量βi满足T(Eiα)=Eiβi, 那么EjTEiα=EjEiβi={0, 如果ijEjβj, 如果i=j因此EjTα=EjTE1α++EjTEkα=Ejβj=TEjα这对于每个αV自然都是成立的, 所以TEj=EjT. [译注: 以βi作为媒介实际上是不必要的, 在译者看来直接讨论更加清晰明了.]

现在我们将以不变直和分解 (与T交换的投影) 的语言刻画可对角化算子T. 这将有助于我们理解之后一些更加深刻的分解定理. 这种描述乍看上去可能比较复杂, 但是读者应该明白这是我们第一次得以瞥见一种非常有效的方法, 其可以将子空间, 基, 矩阵之类的相关问题规约为线性算子的代数计算. 在稍微熟悉之后, 这种推理方法的有效和优雅应该是显然的.

定理11.T是有限维向量空间V上的一个线性算子. 如果T是可对角化的并且c1,,ck是其不同的特征值, 那么存在V上的线性算子E1,,Ek满足
  1. T=c1E1++ckEk;
  2. I=E1++Ek;
  3. ij, 则EiEj=0;
  4. Ei2=Ei (即Ei是投影);
  5. Ei的像是与ci相关联的特征空间.
反过来, 如果存在k个不同的标量c1,,ckk个非零的线性算子E1,,Ek满足条件i, ii, iii, 那么T是可对角化的, c1,,ckT的不同的特征值, 并且条件iv和v也得到满足.
证明.T是可对角化的, 并以c1,,ck为不同的特征值. 令Wi是与ci相关联的特征空间. 正如我们之前所见,V=W1Wk.和定理9一样, 令E1,,Ek是与该分解对应的投影, 那么ii, iii, iv, v被满足是显然的. 为了验证i, 我们按照以下方式处理. 对于每个αV, 我们有α=E1α++Ekα于是Tα=TE1α++TEkα=c1E1α++ckEkα换言之, T=c1E1++ckEk.
现在设我们给定了一个以不同的标量ci为特征值的线性算子T以及非零的线性算子Ei满足i, ii, iii. 既然当ij时有EiEj=0, 那么我们给I=E1++Ek两边同乘Ei就立即得到了Ei2=Ei. 对于T=c1E1++ckEk两边右乘Ei, 那么我们有TEi=ciEi, 这表明了Ei的像之中的向量也在(TciI)的零空间里. 因为我们已经假定Ei0, 所以(TciI)的零空间中至少存在一个非零向量, 即ciT的一个特征值. 而且, 这些ci就是T的全部的特征值了. 这是因为如果c是任意的特征值, 那么TcI=(c1c)E1++(ckc)Ek于是若(TcI)α=0, 我们必有(cic)Eiα=0. 如果α不是零向量, 那么存在某个i使得Eiα0, 于是对于这个i我们有cic=0.
当然T是可对角化的, 因为我们已经表明了每个Ei的像中的向量都是T的特征向量, 而且I=E1++Ek告诉我们这些特征向量可以张成V. 剩下来我们需要说明的就只是(TciI)的零空间恰为Ei的像. 但这是显然的, 因为如果Tα=ciα, 那么j=1k(cjci)Ejα=0因此对于每个j(cjci)Ejα=0那么对于ji都有Ejα=0既然α=E1α++Ekα并且ji时有Ejα=0, 我们有α=Eiα, 即αEi的像之中.

定理9的一部分告诉我们, 对于一个可对角化算子T而言, 标量c1,,ck和算子E1,,Ek由条件i, ii, iii以及ci不同和Ei非零的事实所唯一确定. 这种分解T=c1E1++ckEk的一个令人愉快的特性在于如果g是域F上任意的多项式, 那么g(T)=g(c1)E1++g(ck)Ek.我们将证明的细节留给读者. 为了看明白其是如何得以证明的, 读者只需对于每个正整数r计算Tr, 例如T2=(i=1kciEi)(j=1kcjEj)=i=1kj=1kcicjEiEj=i=1kci2Ei2=i=1kci2Ei读者应该将这个结果与A为对角矩阵时的g(A)进行比较, 因为g(A)就是以g(A1,1),,g(An,n)为对角元素的对角矩阵.

我们特别想要指出当人们应用与c1,,ck相对应的Lagrange多项式pj=ij(xci)(cjci)时会发生什么. 我们有pj(ci)=δi,j, 这表明pj(T)=i=1kδi,jEi=Ej因此投影Ei不仅与T交换, 还是多项式应用于T的结果.

这样应用多项式于T的计算可以用来给出定理6的另一个证明, 定理6基于极小多项式刻画了可对角化的条件. 这个证明完全独立于我们先前所给出的.

如果T是可对角化的, T=c1E1++ckEk, 那么对于每个多项式gg(T)=g(c1)E1++g(ck)Ek因此g(T)=0当且仅当对于每个ig(ci)=0. 特别地, T的极小多项式为p=(xc1)(xck).

现在设T是以p=(xc1)(xck)为极小多项式的线性算子, 其中c1,,ck是标量域的不同元素. 我们构造Lagrange多项式pj=ij(xci)(cjci).回忆一下第4章, pj(ci)=δi,j以及对于任意次数小于等于(k1)的多项式, 我们有g=g(c1)p1++g(ck)pk.g为标量多项式1, 然后是多项式x, 我们得到1=p1++pk,x=c1p1++ckpk.(聪明的读者可能会注意到应用Lagrange插值于x可能并不合法, 因为k可能是1. 但是如果k=1, T是恒等算子的一个标量倍数, 因而是可对角化的.) 现在令Ej=pj(T), 根据Lagrange插值我们有I=E1++Ek,T=c1E1++ckEk.观察到如果ij, 那么pipj被极小多项式p整除, 因为每个cr都是其根. 因此, 我们可以推出EiEj=0,ij.我们还需要注意到另一个事实, 即对于每个iEi0. 这是因为pT的极小多项式, 而pi的次数小于p的次数, 所以不可能有pi(T)=0. 现在应用定理11, 我们可以得出T是可对角化的. [译注: 实际上, 即便没有Ei0, 也足够断言T是可对角化的. 这是因为E1,,Ek显然可以被同时对角化, 而恰恰在这个同时对角化的基下, 鉴于T=c1E1++ckEk, 直接就可以看出T的表示矩阵是对角矩阵. 之所以定理11需要额外的条件, 那是因为定理11作出了额外的断言.]

练习1.E是一个V的投影, TV上的一个线性算子. 证明E的像在T下不变当且仅当ETE=TE. 证明E的像与零空间均在T下不变当且仅当ET=TE.
练习2.T2上的线性算子, 其在标准有序基下的矩阵为[2102].W1是由ε1=(1,0)张成的2的子空间.
  1. 证明W1T下不变.
  2. 证明不存在子空间W2满足其在T下不变且与W1互补:2=W1W2.
练习3.T是有限维向量空间V上的一个线性算子, RT的像, NT的零空间, 证明RN线性无关当且仅当V=RN.
练习4.T是有限维向量空间V上的一个线性算子, 设V=W1Wk, 其中每个Wi都在T下不变, 令TiWi上导出的(限制)算子.
  1. 证明det(T)=det(T1)det(Tk).
  2. 证明T的特征多项式是T1,,Tk的特征多项式之积.
  3. 证明T的极小多项式是T1,,Tk的极小多项式的最小公倍式. (提示: 证明并使用与矩阵直和有关的相应事实.)
练习5.T是第6.2节例子3中的线性算子, 使用Lagrange多项式将表示矩阵A写成A=E1+2E2,E1+E2=I,E1E2=0的形式.
练习6.A是第6.3节例子5中的矩阵, 找出矩阵E1,E2,E3使得A=c1E1+c2E2+c3E3,E1+E2+E3=I,EiEj=0,ij.
练习7. 在练习5和6中, 注意到(对于每个i)与特征值ci相关联的特征空间由满足ji的各个矩阵Ej的列向量张成, 这是巧合吗? [译注: 练习本身很有可能是错误的, 应该将其改为"由Ei的列向量张成".]
练习8.TV上的一个线性算子, 其与每个V的投影交换, 关于T你能知道什么?
练习9.V是区间[1,1]上的实值连续函数的向量空间, We是由偶函数构成的子空间, Wo是由奇函数构成的子空间.
  1. 证明V=WeWo.
  2. 如果T是不定积分算子(Tf)(x)=0xf(t)dtWeWoT下不变吗?

第6.8节 准素分解定理

我们一直在尽力研究有限维空间V上的线性算子T, 通过将其分解为算子的直和, 这些算子在某种意义上是简单的. 在特定的情况下, 即T的极小多项式在标量域F上可以被分解为不同的首项系数为一的一次多项式之积时, 我们藉由特征值和特征向量的概念就可以完成分解. 那么对于一般情况下的T, 我们该怎么做呢? 如果我们想要通过特征值来研究T, 我们将面临两个问题. 第一个问题是T可能压根没有特征值, 这或许应该归咎于标量域, 即它不是代数闭域. 第二个问题是即便特征多项式在F上可以被完全分解为一次多项式之积, 仍然可能没有足够的特征向量以张成V, 这显然应该归咎于T. 我们用一个例子来刻画第二种情况. 现在给定F3 (F为任意的域) 上的线性算子T, 其在标准有序基下由A=[200120001]表示. A的特征多项式为(x2)2(x+1), 这也是A (或者T) 的极小多项式. 因此, T是不可对角化的. 读者可以看出来, 这种情况会发生是因为(T2I)的零空间仅是一维的. 另一方面, (T+I)的零空间和(T2I)2的零空间一起可以张成V, 前者是由ε3张成的子空间, 后者是由ε1ε2张成的子空间.

这或多或少将会是我们处理第二个问题的一般方法. 如果 (记住这是一个假设) T的极小多项式可以被分解为p=(xc1)r1(xck)rk其中c1,,ckF的不同元素, 那么我们可以证明空间V(TciI)ri,i=1,,k的零空间的直和. 这关于极小多项式p的假设等价于T是可三角化的 (定理5). 然而, 这条知识并不会帮到我们.

我们实际将要证明的定理比起刚才所描述的要更加一般, 因为它考虑的是极小多项式的素因子分解, 不论素因子本身的次数是否为一. 读者或许会发现思考素因子均为一次的特殊情形是有用的, 甚至是思考定理6的基于投影概念的证明, 定理6是这个定理更加特殊的情形.

定理12. 准素分解定理 (Primary Decomposition Theorem).T是域F上的有限维向量空间V上的线性算子, 设pT的极小多项式, 其分解为p=p1r1pkrk其中pi是域F上互异的首项系数为一的素多项式而ri是正整数. [译注: 原文用的是irreducible而不是prime, 但是如果追究第4章的定义的细节的话, 素多项式是更加适合的, 因为素多项式被定义为非标量的不可约多项式, 虽然即便在第4章原文中作者已经开始混淆这两个概念.] 令Wipiri(T),i=1,,k的零空间, 那么
  1. V=W1Wk;
  2. 每个Wi都在T下不变;
  3. 如果TiTWi上由限制导出的算子, 那么Ti的极小多项式为piri.
证明. 证明的想法如下. 如果i的直和分解是可能的, 那么我们该如何得到与之相关的投影E1,,Ek呢? 投影EiWi上是恒等算子, 在其他的Wj上则是零算子. 我们将寻找一个多项式hi使得hi(T)Wi上是恒等算子而在其他Wj上均是零算子, 于是h1(T)++hk(T)=I, 等等.
对于每个i, 令fi=ppiri=jipjrj.既然p1,,pk是不同的素多项式, 多项式f1,,fk是互素的 (第4章的定理10). 因此, 存在多项式g1,,gk满足i=1nfigi=1.我们也注意到, 如果ij, 那么fifj被多项式p整除, 因为fifj包含每个pmrm作为因子. 我们将说明多项式hi=figi表现得如同证明的第一段所述的那样.
Ei=hi(T)=fi(T)gi(T). 既然h1++hk=1p整除fifj,ij, 我们有E1++Ek=I,EiEj=0,ij.因此, 这些Ei是与某个V的直和分解相对应的投影. 我们想要证明Ei的像恰是子空间Wi. 显然Ei的像的每个向量都在Wi之中, 因为若αEi的像中, 那么α=Eiα, 于是piri(T)α=piri(T)Eiα=piri(T)fi(T)gi(T)α=(pgi)(T)α=0鉴于p是极小多项式. 反过来, 设αpiri(T)的零空间之中. 如果ji, 那么fjgjpiri整除, 于是(fjgj)(T)α=0, 即Ejα=0,ji. 但是, 这立刻就可以推出Eiα=α, 即αEi的像之中. 这就完成了陈述i的证明.
子空间Wi显然在T是不变的. [译注: 可以直接证明, 也可应用定理10.] 如果Ti是由T限制于Wi导出的算子, 那么显然有piri(Ti)=0, 因为根据定义, piri(T)在子空间Wi上的值均为0. 这表明Ti的极小多项式整除piri. 反过来, 令gTi的一个零化多项式, 即g(Ti)=0, 那么g(T)fi(T)=0. [译注: 这里没有那么平凡, 对于αWig(T)α=g(Ti)α=0, 而对于αWj,ji, 我们知道pjrj整除fi, 所以fi(T)α=0, 将这两者综合, 又因为VWi的直和, 我们才得到gfiT的一个零化多项式.] 因此, gfiT的极小多项式p整除, 即pirifi整除gfi. 很容易看出来piri整除g. [译注: 这是因为fi0.] 因此, piri也整除Ti的极小多项式, 那么Ti的极小多项式就是piri.
推论. 如果E1,,Ek是与T的准素分解相关的投影, 那么每个Ei都是应用某个多项式于T的值. 因此, 如果线性算子UT交换, 那么U与每个Ei交换, 即每个子空间Wi都在U下不变.

在定理12的证明的记号下, 让我们看看T的极小多项式是一次多项式之积的特殊情形, 即每个pi都具有形式pi=xci. 现在Ei的像是(TciI)ri的零空间Wi. 让我们置D=c1E1++ckEk. 根据定理11, D是一个可对角化算子, 我们将其称为T可对角化部分. 让我们看看算子N=TD. 因为T=TE1++TEk,D=c1E1++ckEk所以N=(Tc1I)E1++(TckI)Ek读者现在对于投影已经足够熟悉了, 可以看出N2=(Tc1I)2E1++(TckI)2Ek以及在一般情况下Nr=(Tc1I)rE1++(TckI)rEkr满足对于每个irri时, 我们有Nr=0, 因为算子(TciI)rEi的像上为0.

定义.N是向量空间V上的一个线性算子. 我们称N是幂零算子, 如果存在某个正整数r满足Nr=0.
定理13.T是域F上的有限维向量空间V上的一个线性算子, 设T的极小多项式在F上被分解为线性多项式之积, 那么存在V上的一个可对角化算子D和一个幂零算子N满足
  1. T=D+N;
  2. DN=ND.
可对角化算子D和幂零算子N由i和ii唯一确定, 并且它们都是某个多项式应用于T的结果.
证明. 我们刚才观察到我们可以将T写成D+N, 其中D是可对角化的而N是幂零算子. 并且, DN不仅是可交换的, 它们还是应用多项式于T的值. 现在设T=D+N, 其中D是可对角化的, N是幂零的, 并且DN=ND. 我们将证明D=DN=N.
既然DN可以交换而T=D+N, 我们可以看出DNT也是可以交换的. 因此, DN与任意应用多项式于T的结果交换. 现在我们有D+N=D+N或者说DD=NN并且这四个算子是互相交换的. 既然DD都是可对角化的并且是可交换的, 它们可以被同时对角化, 于是DD是可对角化的. 既然NN都是幂零的并且是可交换的, 算子(NN)也是幂零的. 这是因为, 使用NN可以交换的事实, 可以得到(NN)r=j=0r(rj)(N)rj(N)j于是当r足够大时这个(NN)r的表达式中的每一项都是0. (实际上, n维空间上的幂零算子的n次幂必然为0. 如果我们以上取r=2n, 那肯定是足够大了. 当然接着可以知道r=n已经足够大了, 但是这不能直接从上面的表达式看出来.) 现在我们知道可对角化算子DD也是幂零算子. 这样一个算子显然是零算子, 以下是论证. 作为幂零算子, 其极小多项式显然具有xr的形式. [译注: 根据定义, 存在正整数m满足Nm=0, 鉴于极小多项式整除零化多项式xm, 因而对于某个rm有极小多项式p=xr.] 但是既然它也是可对角化的, 极小多项式不可能有重复的根. 因此r=1, 或者说极小多项式就是x, 即DD=0. [译注: 在一般情况下, 极小多项式的次数大于等于一, 除非是零维向量空间上的算子, 但是本书除了第2章提及了这种可能性之外 (那里说仅包含零向量的平凡空间的维数要么不定义, 要么就定义为零), 其余地方提及有限维向量空间时都排除了零维的情况. 基本上所有结果包含零维的情况仍然成立, 只是许多证明需要打上补丁.] 于是, 我们可以看出D=DN=N.
推论.V是某个代数闭域 (例如复数域) 上的有限维向量空间, 那么V上的每个线性算子T都可以写成交换的可对角化算子D和幂零算子N之和. DN是唯一确定的, 并且每个都是应用多项式于T的结果.

从以上这些结果来看, 读者应该明白对于代数闭域上的向量空间上的线性算子的研究基本上可以归结为对于幂零算子的研究. 对于非代数闭域上的向量空间而言, 我们仍然需要寻找特征值和特征向量的某种替代物. 有趣的是, 这两个问题可以被同时处理, 而这就是我们在下一章所要做的事情.

为了给本节作结, 我们想要举一个例子, 它刻画了准素分解定理的某些想法. 之所以我们选择把它放在本节的最后, 是因为它处理微分方程, 并不是纯粹的线性代数.

例子14. 在准素分解定理中, 向量空间V是有限维的是不必要的条件. 另外, 对于i和ii而言, pT的极小多项式也是不必要的. 如果T是任意向量空间上的线性算子, 如果存在一个首项系数为一的多项式p满足p(T)=0, 那么定理12的i和ii在我们之前给出的证明下对于T也是成立的. [译注: 注意到定理9并不局限于有限维的情形.]
n是一个正整数, 令V是满足微分方程dnfdtn+an1dn1fdtn1++a1dfdt+a0f=0的所有实轴上的n次连续可微函数f构成的空间, 其中a0,,an1是一些固定的常数. 如果用Cn表示n次连续可微函数构成的空间, 那么作为这个微分方程的解空间的VCn的子空间. 如果D代表微分算子而p是多项式p=xn+an1xn1++a1x+a0那么V是算子p(D)的零空间, 因为这个微分方程就是在说p(D)f=0. 因此, VD下不变. 现在让我们将D视为子空间V上的一个线性算子, 那么p(D)=0.
如果我们讨论的是复值可微函数, 那么CnV是复向量空间而a0,,an1可以是任意的复数. 现在我们将p写成p=(xc1)r1(xck)rk其中c1,,ck是不同的复数. 如果Wj(DcjI)rj的零空间, 那么定理12告诉我们V=W1Wk.换言之, 如果f满足这个微分方程, 那么f可以被唯一地表示为f=f1++fk的形式, 其中fj满足微分方程(DcjI)rjfj=0. 因此, 对于这个大的微分方程的解的研究可以被规约为对于具有形式(DcI)rf=0的小的微分方程的解空间的研究. 这种规约是藉由线性代数的一般方法实现的, 即准素分解定理.
为了刻画这个小的微分方程的解空间, 我们必须要了解一些关于微分方程的知识. 也就是说, 除了D是线性算子的事实之外, 我们必须还要了解一些关于D的其他性质. 然而, 实际上并不需要太多. 很容易对于r进行归纳得到如果fCr, 那么(DcI)rf=ectDr(ectf)也就是说,dfdtcf(t)=ectddt(ectf), 等等.因此, (DcI)rf=0当且仅当Dr(ectf)=0. 一个满足Dr(g)=0的函数g, 即drg/dtr=0, 必然是一个次数小于等于(r1)的多项式函数 [译注: 严格说来, 次数是定义在多项式而非多项式函数上的, 但是这里的意思应该是明了的, 即由次数小于等于(r1)的多项式导出的函数, 并且在这种意义下次数对于这里的多项式函数是良定的]:g(t)=b0+b1t++br1tr1.于是, (DcI)rf=0当且仅当f具有形式f(t)=ect(b0+b1t++br1tr1).据此, "函数"ect,tect,,tr1ect可以张成这个小的微分方程的解空间. 鉴于1,t,,tr1是线性无关的函数并且指数函数 (exponential function) 没有零点, 这r个函数tject,0jr1构成了解空间的一个基.
回到本来的微分方程上去, 即p(D)f=0,p=(xc1)r1(xck)rk我们可以看到tmecjt,0mrj1,1jk构成了解空间的一个基. 特别地, 解空间是有限维的, 其维数等于多项式p的次数.

译者注记. 以上的例子中的推理过程存在不甚严格的步骤, 即微分算子D并非严格意义上的Cn上的线性算子, 因为n次连续可微函数的导数并不一定仍然是n次连续可微的. 因此, 鉴于p(D)D交换, 所以p(D)的零空间在D下不变这样的推理也不能称得上令人满意. 当然, 如果将我们所考虑的函数类限制于无穷可微的C的情形, 上述的推理倒是相当严密, 结果也没有改变.

练习1.T3上的一个线性算子, 其在标准有序基下由矩阵[6324121053]表示. 将T的极小多项式p表示为p=p1p2的形式, 其中p1p2是实数域上首项系数为一的素多项式. 令Wipi(T)的零空间, 找出W1W2各自的一个基𝔅i. 如果TiTWi上由限制导出的算子, 求出Ti在基𝔅i下的矩阵.
练习2.T3上的一个线性算子, 其在标准有序基下由矩阵[311221220]表示. 证明3上存在可对角化算子D和幂零算子N满足T=D+NDN=ND. 找出DN在标准基下的矩阵. (只需要对于这个特殊情形重复定理12的证明就够了.)
练习3. 如果V是域F上所有次数小于等于n的多项式构成的向量空间, 证明V上的微分算子是幂零的.
练习4.T是有限维向量空间V上的一个线性算子, 其特征多项式为f=(xc1)d1(xck)dk而极小多项式为p=(xc1)r1(xck)rk.Wi(TciI)ri的零空间.
  1. 证明Wi是集合{αV|存在正整数m满足(TciI)mα=0} (m可以依赖于α).
  2. 证明Wi的维数是di. (提示: 如果TiTWi上通过限制导出的算子, 那么TiciI是幂零的; 因而TiciI的特征多项式必然是xei, 其中eiWi的维数 (证明?); 于是Ti的特征多项式为(xci)ei; 现在使用T的特征多项式是Ti的特征多项式之积的事实来说明ei=di.)
练习5.V是复数域上的一个有限维向量空间. 令TV上的一个线性算子, DT的可对角化部分. 证明如果g是复数域上任意的多项式, 那么g(T)的可对角化部分是g(D).
练习6.V是域F上的一个有限维向量空间, TV上的一个线性算子且rank(T)=1. 证明T要么是可对角化的, 要么是幂零的, 但不可兼任.
练习7.V是域F上的一个有限维向量空间, TV上的一个线性算子. 设TV上的每个可对角化算子交换, 证明T是恒等算子的标量倍数.
练习8.V是域F上的n×n矩阵的空间, A是域F上一个固定的n×n矩阵. 我们定义V上的线性算子TA(B)=ABBA. 证明如果A是一个幂零矩阵, 那么TA是一个幂零算子. [译注: 参照幂零算子的定义, 可以定义幂零矩阵.]
练习9. 给出这样的一个例子, 两个4×4的幂零矩阵具有相同的极小多项式 (它们的特征多项式必然也是相同的), 但是并不相似.
练习10.T是有限维向量空间V上的一个线性算子, p=p1r1pkrkT的极小多项式, V=W1WkT的准素分解, 即Wipiri(T)的零空间, WV任意的在T下不变的子空间, 证明W=(WW1)(WW2)(WWk).
练习11. 以下对于定理13的证明有何问题? 设T的极小多项式是线性因子之积. 那么, 根据定理5, T是可三角化的. 令𝔅是一个使得A=[T]𝔅为上三角矩阵的有序基. 令D是以A1,1,,An,n为对角线元素的对角矩阵, 那么A=D+N, 其中N是一个严格上三角矩阵. 显然N是幂零的. [译注: 严格上三角矩阵指的是对角线元素均为零的上三角矩阵.]
练习12. 如果你已经思考过了练习11, 在你观察到定理7告诉你的关于T的可对角化部分和幂零部分的东西之后, 再次思考这个练习.
练习13.TV上的一个线性算子, 它的极小多项式具有pn的形式, 其中p在标量域上是不可约的. 证明存在αV使得αT零化子为pn.
练习14. 使用准素分解定理和练习13的结果证明以下结论. 如果T是有限维向量空间V上任意的线性算子, 那么存在αV使得αT零化子等于T的极小多项式.
练习15. 如果Nn维向量空间V上的一个幂零线性算子, 那么N的特征多项式为xn.

第7章 有理形式和Jordan形式

第7.1节 循环子空间和零化子

又一次, V是域F上的一个有限维向量空间, 而TV上一个固定的 (但也是任意的) 线性算子. 如果αV的任意一个向量, 那么存在一个最小的包含α且在T下不变的V的子空间. 这个子空间可以被定义为所有包含αT不变子空间之交. 然而, 现在对我们来说按照以下方式看待它是更有优势的. 如果W是任意的包含α且在T下不变的V的子空间, 那么W也必然包含向量Tα. 因此, W还必然包含T(Tα)=T2α, T(T2α)=T3α, 等等. 换言之, 对于每个域F上的多项式g, 必然有g(T)αW. 集合{g(T)α|gF[x]}显然在T下不变, 因而是包含α的最小T不变子空间.

定义.αV, α生成的T循环子空间Z(α;T)={g(T)α|gF[x]}. 如果Z(α;T)=V, 那么α被称为T的一个循环向量.

另一种描述子空间Z(α;T)的方式为Z(α;T)是由向量Tkα,k0张成的子空间, 因而αT的循环向量当且仅当这些向量可以张成V. 我们提醒读者, 一般的线性算子T可能没有循环向量.

例子1. 对于任意的T, 由零向量生成的T循环子空间是零子空间. 空间Z(α;T)是一维的当且仅当αT的特征向量. [译注: 尽管在上一章定义特征向量时没有排除零向量, 但是从现在开始本书所称特征向量均不包括零向量, 这也与其他文本保持一致.] 对于恒等算子而言, 每个非零向量都生成了一维的循环子空间. 因此, 若dimV>1, 恒等算子没有循环向量. 一个具有循环向量的线性算子的例子是F2上在标准有序基下由矩阵[0010]表示的线性算子T. 这里的一个循环向量是ε1, 因为若β=(a,b), 以g=a+bx我们有β=g(T)ε1. 对于相同的算子T, 由ε2生成的循环子空间是一维的, 因为ε2T的特征向量.

对于任意的Tα, 我们所感兴趣的是向量Tjα之间的线性关系c0α+c1Tα++ckTkα=0即我们所感兴趣的是具有性质g(T)α=0的多项式g=c0+c1x++ckxk. 集合{gF[x]|g(T)α=0}显然是F[x]中的一个理想. 并且, 它也是一个非零理想, 因为它包含T的极小多项式.

定义. 如果αV, αT零化子是F[x]中的理想M(α;T)={gF[x]|g(T)α=0}, 其唯一的首项系数为一的生成元pα也被称为αT零化子. [译注: 这个定义在第6.4节{不变子空间}已经给出过了.]

正如我们所指出的, T零化子pα整除算子T的极小多项式. 读者也应该注意到除非α是零向量, degpα>0.

定理1.αV中的非零向量, pααT零化子.
  1. pα的次数等于循环子空间Z(α;T)的维数.
  2. 如果pα的次数为k, 那么向量α,Tα,T2α,,Tk1α构成了Z(α;T)的一个基.
  3. 如果U是由TZ(α;T)上的限制导出的线性算子, 那么U的极小多项式为pα.
证明.g是域F上任意的多项式, 作带余除法g=pαq+r其中r=0degr<degpα=k. 鉴于pαqM(α;T), 于是g(T)α=r(T)α.既然r=0degr<k, 向量r(T)α是向量α,Tα,,Tk1α的线性组合. 换言之, 这k个向量可以张成Z(α;T). 它们当然也是线性无关的, 因为若这些向量之间存在非平凡的线性关系, 那么其可以导出一个非零的多项式g满足g(T)α=0degg<degpα, 但这是不可能的. 现在我们已经证明了i和ii.
UTZ(α;T)的限制. 如果gF[x], 那么pα(U)g(T)α=pα(T)g(T)α=g(T)pα(T)α=g(T)0=0因此, 算子pα(U)将每个Z(α;T)的向量都送至0, 即Z(α;T)上的零算子. 并且, 如果h是一个次数小于k的多项式, 那么我们不可能有h(U)=0, 不然的话h(U)α=h(T)α=0, 但这与pα的定义矛盾. [译注: 此即若h零化U, 则pα整除h. 换句话说, 就是pα的确生成了零化U的理想.] 这表明pαU的极小多项式.
译者注记. 实际上, 定理1对于α=0也成立, 此时pα=1, degpα=0, Z(α;T)={0}, dimZ(α;T)=0, Z(α;T)的基, Z(α;T)上导出的算子即零向量空间上的平凡线性算子, 其零化多项式构成的理想就是整个F[x], 所以极小多项式是1, 也就是pα.

该定理的一个特别推论如下: 如果α碰巧是T的一个循环向量, 那么T的极小多项式的次数必然等于空间V的维数. 因此, Cayley-Hamilton定理告诉我们T的极小多项式就是T的特征多项式. 之后我们将证明对于任意的T, 存在向量αV使得其T零化子是T的极小多项式. 然后, 这可以推出T具有循环向量当且仅当T的极小多项式和特征多项式是相同的. 但是, 还需要一些工作我们才能抵达这一步.

我们的计划是利用具有循环向量的算子研究一般的T. 因此, 让我们检视k维空间W上的一个具有循环向量α的算子U. 根据定理1, 向量α,,Uk1α构成了空间W的一个基, 并且α的零化子pαU的极小多项式 (因而也是U的特征多项式). 如果我们令αi=Ui1α,i=1,,k, 那么U于有序基𝔅={α1,,αk}上的作用为Uαi=αi+1,i=1,,k1Uαk=c0α1c1α2ck1αk其中pα=c0+c1x++ck1xk1+xk. Uαk的表达式是由pα(U)α=0的事实推得的, 即Ukα+ck1Uk1α++c1Uα+c0α=0.这表明U在有序基𝔅下的矩阵为[0000c01000c10100c20001ck1].这个矩阵被称为首项系数为一的多项式pα的同伴矩阵 (companion matrix). [译注: 读者应该将同伴矩阵的概念视为多项式上的一个映射.]

定理2. 如果U是有限维向量空间W上的一个线性算子, 那么U拥有循环向量当且仅当存在W的一个有序基使得U在其下以U的极小多项式的同伴矩阵表示.
证明. 我们刚才已经观察到若U拥有循环向量, 那么的确存在这样一个基. 反过来说, 如果我们有W的一个有序基{α1,,αk}使得U在其下由U的极小多项式的同伴矩阵表示, 那么显然α1U的一个循环向量.
推论. 如果A是一个首项系数为一的多项式p的同伴矩阵, 那么p既是A的极小多项式, 也是A的特征多项式.
证明. 一种方法是令UFk上在标准有序基下由A表示的线性算子, 然后应用定理1和Cayley-Hamilton定理. 另一种方法是使用定理1看出pA的极小多项式, 并通过直接的计算验证pA的特征多项式.
译者注记. 证明的要点在于意识到ε1U零化子pε1 (根据定理1, 其等于A的极小多项式) 何以等于p. 答案是, 根据直接的计算, 可以知道p(U)ε1=0, 因而pε1整除p, 但是它们次数相等且首项系数都为一, 所以p=pε1.

以下是本节最后的注记. 如果T是空间V上任意的线性算子, αV中任意的向量, 那么T于循环子空间Z(α;T)上的限制算子U具有一个循环向量, 即α. 因此, Z(α;T)拥有一个有序基, U在其下以pα的同伴矩阵表示, pααT零化子. [译注: 当然, pα也是U的极小多项式.]

练习1.TF2上的一个线性算子. 证明对于向量α, 若α非零且α不是T的特征向量, 那么αT的一个循环向量. 据此, 证明要么T拥有循环向量, 要么T是恒等算子的标量倍数.
练习2.T3上的线性算子, 其在标准有序基下由矩阵[200020001]表示. 证明T没有循环向量. 由向量(1,1,3)生成的T循环子空间是什么?
练习3.T3上的线性算子, 其在标准有序基下由矩阵[1i012i011]表示. 找出向量(1,0,0)T零化子. 找出(1,0,i)T零化子.
练习4. 证明如果T2拥有循环向量, 那么T拥有循环向量. 反过来正确吗?
练习5.V是域F上的一个n维向量空间, NV上的一个幂零线性算子. 设Nn10, 令αV是满足Nn1α0的一个向量. 证明αN的一个循环向量. N在有序基{α,Nα,,Nn1α}的矩阵是什么?
练习6. 给出以下事实的一个直接证明. 如果A是首项系数为一的多项式p的同伴矩阵, 那么pA的特征多项式.
练习7.V是一个n维向量空间, TV上的一个线性算子. 设T是可对角化的.
  1. 如果T拥有循环向量, 证明T拥有n个不同的特征值.
  2. 如果T拥有n个不同的特征值, 并且{α1,,αk}是由T的特征向量构成的一个基, 证明α=α1++αkT的一个循环向量.
练习8.T是有限维向量空间V上的一个线性算子. 设T拥有循环向量. 证明如果U是任意与T交换的线性算子, 那么U是应用某个多项式于T的结果.

第7.2节 循环分解和有理形式

本节的主要目的在于证明如果T是有限维向量空间V上任意的线性算子, 那么存在向量α1,,αrV满足V=Z(α1;T)Z(αr;T).换言之, 我们希望证明V是一个T循环子空间的直和. 这将表明T是有限数目的线性算子的直和, 其中每个都拥有循环向量. 其效用在于将关于一般线性算子的诸多问题规约为关于拥有循环向量的算子的类似问题. 我们将证明的定理3是线性代数中最为深刻的结果之一, 并且拥有许多有趣的推论.

循环分解定理与以下问题紧密关联. 对于什么样的T不变子空间W而言, 存在另一个T不变子空间W满足V=WW. 如果W是有限维向量空间V的任意一个子空间, 那么存在一个子空间W满足V=WW. 通常来说存在许多这样的子空间W, 其中每个都被称为与W互补. 我们问的是何时一个T不变子空间拥有一个与之互补的T不变子空间.

让我们设V=WW, 其中WW都在T下不变, 然后看看我们可以发现什么关于子空间W的性质. 每个向量βV都具有β=γ+γ的形式, 其中γWγW. 如果f是标量域上任意的多项式, 那么f(T)β=f(T)γ+f(T)γ.既然WW都是T不变的, 向量f(T)γWf(T)γW. 因此, f(T)βW当且仅当f(T)γ=0. 我们所感兴趣的正是这看似单纯的事实, 即如果f(T)βW, 那么f(T)β=f(T)γ.

定义.T是向量空间V上的线性算子, WV的一个子空间. 我们称WT可容许的 (T-admissible), 如果
  1. WT下不变;
  2. f(T)βW, 则存在向量γW满足f(T)β=f(T)γ.
[译注: admissible暂无通行翻译, 译者将其定为"可容许的".]

刚才我们已经表明了, 如果W是不变的且有一个互补的不变子空间, 那么W是可容许的. 定理3的一个推论是其逆, 于是可容许性刻画了那些拥有互补不变子空间的不变子空间.

让我们指出在获得分解V=Z(α1;T)Z(αr;T)的尝试里可容许性质的概念是如何牵涉其中的. 我们抵达这样一种分解的基本方法是归纳地挑选向量α1,,αr. 设根据某种过程我们已经挑选了向量α1,,αj, 并且子空间Wj=Z(α1;T)++Z(αj;T)是真子空间. 我们想要找到一个非零向量αj+1满足WjZ(αj+1;T)={0}因为这样的话子空间Wj+1=WjZ(αj+1;T)就离穷尽V更进至少一维. 但是, 这样的αj+1何以存在呢? 如果α1,,αj的挑选使得Wj是一个T可容许子空间, 那么很容易看出来我们可以找到一个合适的αj+1. 这是使得我们对于定理3的证明成立之所在, 即便这并非我们组织论证的方式.

W是一个T不变的真子空间. 让我们试着寻找一个非零的向量α满足WZ(α;T)={0}.我们可以选择某个向量βW, 考虑T导子S(β;W), 其由所有满足g(T)βW的多项式g构成. 回忆一下, 生成理想S(β;W)的唯一的首项系数为一的多项式f=s(β;W)也被称为从βWT导子. 向量f(T)βW之中. 现在, 如果WT可容许的, 那么存在γW满足f(T)β=f(T)γ. 令α=βγ, g是任意的多项式. 既然(βα)W, g(T)βW当且仅当g(T)αW. 换言之, S(α;W)=S(β;W). 因此, 多项式f也是从αWT导子. 但是f(T)α=0, 这告诉我们g(T)αW当且仅当g(T)α=0, 即子空间Z(α;T)W是线性无关的, 并且fαT零化子.

定理3. 循环分解定理.T是有限维向量空间V上的一个线性算子, W0是一个T可容许的V的真子空间, 存在非零向量α1,,αrV满足
  1. V=W0Z(α1;T)Z(αr;T);
  2. pk整除pk1, 其中k=2,,rpiαiT零化子.
而且, 整数r和零化子p1,,pr由i, ii以及αi0的事实唯一确定.
证明. 证明相当冗长, 故我们将其分为四个步骤. 似乎初读证明时取W0={0}会比较容易, 尽管这并不会带来任何实质性的简化. 贯穿整个证明, 我们都将f(T)β缩略为fβ.

第1步. 存在非零向量β1,,βrV满足

  1. V=W0+Z(β1;T)++Z(βr;T);
  2. 如果1kr并且Wk=W0+Z(β1;T)++Z(βk;T)那么导子pk=s(βk;Wk1)在所有到子空间Wk1T导子中拥有最大的次数, 即对于每个kdegpk=maxαVdegs(α;Wk1).
这一步只依赖于W0是不变子空间的事实. 如果W是一个T不变的真子空间, 那么0<maxαVdegs(α;W)dimV我们可以选择一个向量β使得degs(β;W)取得最大值, 然后子空间W+Z(β;T)T不变的且维数大于dimW. [译注: Cayley-Hamilton定理告诉我们特征多项式是一个零化多项式, 于是s(α;W)整除特征多项式, 因而有degs(α;W)dimV, 那么我们可以明白最大值是良定的且maxαVdegs(α;W)dimV. 考虑到W是真子空间, 若αW, 那么degs(α;W)>0, 由此可知maxαVdegs(α;W)>0. 文中β的选择必然满足βW, 因为否则的话T导子的次数为零. 那么, 子空间W+Z(β;T)的维数的确严格大于W的维数. 当然, 其在T下不变是显然的.] 应用此过程于W=W0可以得到β1. 若W1=W0+Z(β1;T)仍然是真子空间, 那么就再次应用该过程于W1以得到β2. 将过程继续施行下去, 鉴于dimWk>dimWk1, 我们必然可以在不超过dimV步的情况下抵达Wr=V.

第2步. β1,,βr是满足第1步的条件a和b的非零向量. 固定k, 其中1kr. 令βV中任意的向量, f=s(β;Wk1). 如果fβ=β0+i=1k1giβi,βiWi那么f整除每个多项式gi并且存在γ0W0满足β0=fγ0. [译注: βiWi只是约束了β0W0, 其余则是已知的.]
如果k=1, 此即陈述W0T可容许的这个条件. 为了在k>1的情形下证明断言, 应用带余除法:gi=fhi+ri,ri=0或者degri<degf.我们想要证明的是对于每个iri=0. 令γ=βi=1k1hiβi既然γβWk1, 我们有s(γ;Wk1)=s(β;Wk1)=f而且fγ=β0+i=1k1riβi.设某个ri异于0, 我们可以推导出矛盾来. 令j=max{i{1,,k1}|ri0}, 那么fγ=β0+i=1jriβi,rj0degrj<degf.p=s(γ;Wj1), 既然Wj1Wk1, 导子f=s(γ;Wk1)必然整除p:存在多项式gp=fg.应用g(T)于前式两边, 可以得到:pγ=gfγ=grjβj+gβ0+i=1j1griβi.根据p的定义, pγWj1, 而且上式最右边两项之和也在Wj1之中, 所以grjβjWj1. 现在我们使用第1步的条件b:deg(grj)degs(βj;Wj1)=degpjdegs(γ;Wj1)=degp=deg(fg)因此, degrjdegf, 但这与j的选择相矛盾. 现在我们知道f整除每个gi, 于是β0=fγ. 既然WT可容许的, 存在γ0W0使得β0=fγ0. 顺带值得一提的是, 第2步是断言W1,W2,,Wr具有T可容许性的一种增强形式.

第3步. 存在非零向量α1,,αrV满足定理3的条件i和ii.
我们自第1步的向量β1,,βr始. 固定k, 其中1kr. 我们将第2步应用于β=βk, 那么T导子f=pk, 于是可以得到pkβk=pkγ0+i=1k1pkhiβi其中γ0W0h1,,hk1是多项式. 令αk=βkγ0i=1k1hiβi鉴于βkαkWk1, 我们知道s(αk;Wk1)=s(βk;Wk1)=pk既然pkαk=0, 可以得到Wk1Z(αk;T)={0}.因为每个αk都满足以上两式, 所以Wk=W0Z(α1;T)Z(αk;T)并且pkαkT零化子. [译注: 读者需要注意到因为βkαkWk1, 所以Wk1+Z(αk;T)=Wk1+Z(βk;T).] 换言之, 向量α1,,αr和向量β1,,βr定义了相同的子空间序列W1,W2,并且T导子pk=s(αk;Wk1)自然也满足最大性质, 即第1步的条件b. 其还具有额外的性质, 就是子空间W0,Z(α1;T),Z(α2;T),是线性无关的. 由此很容易验证定理3的条件ii. 既然对于每个i都有piαi=0, 我们有着平凡的关系pkαk=0+p1α1++pk1αk1现在应用第2步, 将β1,,βk替换为α1,,αkβ=αk, 那么可以得到结论: pk整除每个pi, 其中i<k.

第4步. 数字r和多项式p1,,pk在定理3的条件下是唯一的.
设除了向量α1,,αr之外非零向量γ1,,γs也满足定理3的条件, 也就是说V=W0Z(γ1;T)Z(γs;T)并且gk整除gk1, 其中k=2,,sgiγiT零化子. 我们要证明的是r=s以及对于每个ipi=gi.
很容易看出来p1=g1. 多项式g1实际上由前述条件可以被确定为从VW0T导子. S(V;W0)被定义为集合{fF[x]|对于每个βVfβW0}, 其中F是标量域; 换言之, 多项式fS(V;W0)当且仅当f(T)的像是W0的子集. 那么, S(V;W0)是多项式代数中的一个非零理想, 而多项式g1是该理想的首项系数为一的生成元. 以下是我们的理由. 每个βV都具有形式β=β0+f1γ1++fsγs于是g1β=g1β0+i=1sg1fiγi因为每个gi都整除g1, 所以对于每个ig1γi=0, 那么g1β=g1β0W0, 于是g1S(V;W0). 既然g1是将γ1送至W0的次数最低的首项系数为一多项式, 那么g1当然也是理想S(V;W0)中次数最低的首项系数为一多项式. 根据同样的论证, p1也应该是这个理想的首项系数为一的生成元, 所以p1=g1.
如果f是一个多项式, WV的一个子空间, 那么缩写fW将表示集合{fα|αW}. 我们将以下三个事实的验证留作练习.

  1. fZ(α;T)=Z(fα;T).
  2. 如果V=V1Vk, 其中每个Vi都在T下不变, 那么fV=fV1fVk.
  3. 如果αγ有着相同的T零化子, 那么fαfγ也有着相同的T零化子, 因而有dimZ(fα;T)=dimZ(fγ;T).
现在我们通过归纳来论证r=s以及对于i=2,,rpi=gi. 论证的手法在于以恰当的方式数维数. 我们将给出r2的情况下有p2=g2的证明, 由此怎样进行归纳则是清晰的. 设r2, 那么dimW0+dimZ(α1;T)<dimV既然我们已经知道了p1=g1, 那么Z(α1;T)Z(γ1;T)有着相同的维数. 因此, 也有dimW0+dimZ(γ1;T)<dimV这说明s2. 现在问是否有p2=g2是有意义的了. 从两个对于V的分解中, 我们可以得到两种对于p2V的分解方式:p2V=p2W0Z(p2α1;T)p2V=p2W0Z(p2γ1;T)Z(p2γs;T)这里用到了事实1和2, 以及对于i2p2αi=0. 既然我们已经知道了p1=g1, 事实3告诉我们Z(p2α1;T)Z(p2γ1;T)有着相同的维数. 显然, 我们可以得到dimZ(p2γi;T)=0,i2.于是, p2γ2=0, 那么g2整除p2. 同样的论证可以反过来以得到p2整除g2. 因此, p2=g2.

推论. 如果T是有限维向量空间上的一个线性算子, 那么每个T可容许子空间都具有T下不变的补子空间.
证明.W0V的一个可容许子空间. 若W0=V, 那么我们所寻求的补就是{0}. 若W0是真子空间, 那么就应用定理3, 令W0=Z(α1;T)Z(αr;T)于是W0T下不变且V=W0W0.
推论.T是有限维向量空间V上的一个线性算子.
  1. 存在向量αV满足αT零化子是T的极小多项式.
  2. T有循环向量当且仅当T的极小多项式和特征多项式相等.
证明. 如果V={0}, 那么结果平凡地成立. 如果V{0}, 令V=Z(α1;T)Z(αr;T)α1,,αrT零化子p1,,pr满足pk+1整除pk, 其中k=1,,r1. 正如我们在定理3的证明中所注意到的那样, 很容易看出p1T的极小多项式, 即从V{0}T导子. 我们已然证明了a.
我们在第7.1节中看到, 如果T拥有循环向量, 那么T的极小多项式和特征多项式恰好是相等的. 为了证明b, 还需要证明的是其逆. 应用定理a, 选择一个满足要求的α. 如果极小多项式的次数等于dimV, 那么Z(α;T)的维数为dimV, 即V=Z(α;T).
定理4. 一般Cayley-Hamilton定理.T是有限维向量空间V上的一个线性算子, pf分别为T的极小多项式和特征多项式.
  1. p整除f;
  2. pf拥有相同的素因子, 在不计重数的情况下;
  3. 如果p=f1r1fkrkp的素因子分解, 那么f=f1d1fkdk其中difiri(T)的零化度除以fi的次数.
证明. 我们就不考虑平凡情形V={0}了. 为了证明i和ii, 考虑由定理3得到的V的一个循环分解. 正如我们在定理3的第2个推论的证明中所注意到的, p1=p. 令UiTZ(αi;T)的限制, 那么Ui当然有循环向量, 于是pi既是Ui的极小多项式, 也是其特征多项式. 因此, 特征多项式f是乘积f=p1pr. 这从T在适当的基下呈现的分块形式矩阵看是显然的. 此时p1整除f是自明的, 这就证明了i. 显然任何p的素因子也是f的素因子. 反过来, f=p1pr的素因子必须整除其中一个pi, 于是又整除p=p1.
p=f1r1fkrkp的素因子分解. 准素分解定理 (第6章的定理12) 告诉我们, 如果Vifiri(T)的零空间, 那么V=V1Vk并且firi是算子Ti的极小多项式, 其中TiT于(不变)子空间Vi上的限制. 将当前定理的i和ii应用于Ti, 既然其是素因子fi之幂, 那么Ti的特征多项式必然具有fidi的形式, 其中diri. 显然, 我们得到了di=dimVidegfi而且根据定义有dimVi=nullity(firi(T)), 于是di=nullity(firi(T))degfi.既然T是算子T1,,Tk的直和, 那么特征多项式f是乘积f=f1d1fkdk.
译者注记. 这个即是第6章所说的对于Cayley-Hamilton定理的三个证明中的最后一个. 似乎此证明所依赖的循环分解定理 (定理3) 的证明中有个估计可能需要用到Cayley-Hamilton定理, 然而这并不意味着该证明存在循环论证的嫌疑, 因为那个估计实际上并不需要那么准确, 以极小多项式的存在性划定一个有限的上界就够了.
推论. 如果Tn维向量空间上的一个幂零线性算子, 那么T的特征多项式为xn.

现在让我们检视循环分解定理的矩阵类比. 如果我们拥有线性算子T和定理3的直和分解, 令𝔅iZ(αi;T)的"循环有序基"{αi,Tαi,,Tki1αi}.这里ki表示Z(αi;T)的维数, 或者说零化子pi的次数. 在有序基𝔅i下, 导出算子Ti的矩阵是多项式pi的同伴矩阵. 因此, 若𝔅是将𝔅1,,𝔅r按照顺序合并得到的V的有序基, 那么T𝔅下的矩阵为A=[A1000A2000Ar]其中Aipi的同伴矩阵, 大小为ki×ki. 一个n×n的矩阵A, 如果其为非标量首项系数为一多项式p1,,pr的同伴矩阵的直和且对于i=1,,r1pi+1整除pi, 那么我们称A具有有理形式. 循环分解定理告诉我们了以下结果.

译者注记. 读者需要注意一下, 本书的有理形式在顺序上与通行定义正好相反. 也就是说, 其他材料将形如A=[Ar000A2000A1]的矩阵称为有理形式.
定理5.F是一个域, B是域F上的一个n×n矩阵, 那么B在域F上相似于唯一的有理形式矩阵.
证明.TFn上在标准有序基下由B表示的线性算子. 正如我们刚才所观察到的那样, 存在Fn的某个有序基使得其下的T由有理形式A表示. 那么, B相似于这个矩阵A. 设BF上相似于另一个有理形式C. 这就意味着存在Fn的某个基使得其下的TC表示. 如果C是非标量首项系数为一多项式g1,,gs的同伴矩阵的直和, 其中对于i=1,,s1gi+1整除gi [译注: 以上是在复述定义], 那么我们有非零向量β1,,βsVg1,,gsT零化子满足V=Z(β1;T)Z(βs;T).但是, 根据循环分解定理的唯一性陈述, 多项式gi和定义了矩阵A的多项式pi应该是完全等同的, 于是C=A.

多项式p1,,pr被称为矩阵B不变因子. 在第7.4节, 我们将描述一个计算给定矩阵的不变因子的算法. 可根据施行于矩阵的元素上的有限次有理操作计算得出这些多项式的事实赋予了有理形式其名.

例子2.V是域F上的一个二维向量空间, TV上的一个线性算子. T的循环子空间分解的可能性是相当受限的. 这是因为如果T的极小多项式的次数为2, 那么它等于T的特征多项式, 于是T拥有循环向量. 因此, 存在V的某个有序基使得T由其特征多项式的同伴矩阵表示. 另一方面, 如果T的极小多项式的次数为1, 那么T是恒等算子的标量倍数. 若T=cI, 那么对于任意的两个线性无关的向量α1α2, 我们有V=Z(α1;T)Z(α2;T),p1=p2=xc.对于矩阵而言, 这样的分析是说每个域F上的2×2矩阵都在F上恰相似于以下两种类型的矩阵中的一种:[c00c],[0c01c1].
例子3.T3上由矩阵A=[566142364]表示的线性算子. 我们之前已经计算过了, T的特征多项式为f=(x1)(x2)2, 极小多项式为p=(x1)(x2). 因此, 我们知道在T的循环分解中, 第一个向量α1T零化子为p. 既然我们是在三维空间中讨论, 那么只能再有一个向量α2. 其必然生成的是一维的循环子空间, 即其必是T的一个特征向量. 其T零化子p2必然是(x2), 因为pp2=f. 注意到这立即告诉我们A相似于矩阵B=[020130002]T在某个有序基下由B表示. 我们该如何寻找合适的向量α1α2呢? 嗯, 我们知道任意能够生成二维T循环子空间的向量都是合适的α1, 所以先让我们试试ε1. 我们有Tε1=(5,1,3)其并非ε1的标量倍数, 因此Z(ε1;T)的维数是2. 这个空间由所有具有形式aε1+b(Tε1)=a(1,0,0)+b(5,1,3)=(a+5b,b,3b)的向量构成, 或者说由所有满足x3=3x2的向量(x1,x2,x3)构成. 现在我们想要寻找的是一个满足Tα2=2α2Z(α2;T)Z(ε1;T)={0}的向量α2. 既然α2T的特征向量, 那么空间Z(α2;T)必然是由α2张成的一维子空间, 于是我们的要求其实是α2Z(ε1;T). 如果α=(x1,x2,x3), 那么很容易通过计算得知Tα=2α当且仅当x1=2x2+2x3. 因此, α2=(2,1,0)是满足我们要求的一个向量. 读者应该直接验证有序基{(1,0,0),(5,1,3),(2,1,0)}T的矩阵即是上面的B.
例子4.TV上的一个可对角化算子. 将T的循环分解与对角化T的基联系起来是有趣的. 令c1,,ckT不同的特征值, Vi是与特征值ci关联的特征空间, 那么V=V1Vk并且如果di=dimVi, 那么f=(xc1)d1(xck)dkT的特征多项式. 如果αV, 那么很容易将循环子空间Z(α;T)和子空间V1,,Vk联系起来. 首先我们知道存在唯一的向量β1,,βk使得α=β1++βk其中βiVi. 既然Tβi=ciβi, 那么对于每个多项式f, 我们有f(T)α=f(c1)β1++f(ck)βk.给定任意的标量t1,,tk, 存在多项式f满足f(ci)=ti,1ik. 因此, Z(α;T)就是由向量β1,,βk张成的子空间. α的零化子是什么呢? 根据前面的讨论, f(T)α=0当且仅当f(ci)βi=0,1ik. 换言之, 只需要对于那些使得βi0if(ci)=0即可推出f(T)α=0. 据此, α的零化子是积βi0(xci).现在, 令𝔅i={β1i,,βdii}Vi的一个有序基, 令r=max1ikdi.我们通过αj=dijβji,1jr定义向量α1,,αr. 循环子空间Z(αj;T)是由向量βji张成的子空间, 其中i遍历所有满足dij的那些指标. αjT零化子是pj=dij(xci).我们有V=Z(α1;T)Z(αr;T)因为每个βji属于且仅属于子空间Z(α1;T),,Z(αr;T)其中的一个并且𝔅=(𝔅1,,𝔅k)V的一个基. [译注: 直和的论证稍显意味不明, 但是事实本身是容易看出的.] 根据pj的公式, 也很容易看出pi+1整除pi, i=1,,r1. [译注: 由此看出这的确是定理3中的循环分解.]
练习1.TF2上在标准有序基下由矩阵[0010]表示的线性算子. 令α1=(0,1). 证明F2Z(α1;T)且不存在非零向量α2F2满足Z(α2;T)Z(α1;T)={0}.
练习2.T是有限维向量空间V上的一个线性算子, RT的像.
  1. 证明R拥有一个与之互补的T不变子空间当且仅当RT的零空间N线性无关.
  2. 如果RN线性无关, 证明N是唯一的与R互补的T不变子空间.
练习3.T3上在标准有序基下由矩阵[200120003]表示的线性算子. 令WT2I的零空间. 证明W没有与之互补的T不变子空间. (提示: 令β=ε1, 观察到(T2I)βW, 证明不存在αW使得(T2I)β=(T2I)α.) [译注: W存在T不变的补子空间当且仅当WT可容许的.]
练习4.TF4上的线性算子, 其在标准有序基下由矩阵[c0001c0001c0001c]表示. 令WTcI的零空间.
  1. 证明W是由ε4张成的子空间.
  2. 找出理想S(ε4;T),S(ε3;T),S(ε2;T),S(ε1;T)的首项系数为一的生成元.
练习5.T是域F上的向量空间V上的一个线性算子. 如果f是域F上的一个多项式而αV, 令fα=f(T)α. 如果V1,,VkT不变子空间而V=V1Vk, 证明fV=fV1fVk.[译注: 这个是定理3的证明中留给读者补充证明的引理.]
练习6.T是域F上的向量空间V上的一个线性算子. 如果向量α,βV有着相同的T零化子, 证明对于任意的多项式f, fαfβ也有着相同的T零化子. [译注: 这个亦是定理3的证明中留给读者补充证明的引理.]
练习7. 找出以下每个实矩阵的极小多项式和有理形式.[011100100],[c010c111c],[cosθsinθsinθcosθ]
练习8.T3上的线性算子, 其在标准有序基下由矩阵[344132243]表示. 找出满足定理3条件的非零向量α1,,αr.
练习9.A是实矩阵A=[133313335].找出一个3×3的可逆实矩阵P使得P1AP是有理形式.
练习10.F是复数域的一个子域, TF4上的线性算子, 其在标准有序基下由矩阵[200012000a2000b2]表示. 找出T的特征多项式. 考虑a=b=1; a=b=0; a=0,b=1的情形. 在这三种情形下, 找出T的极小多项式以及满足定理3条件的非零向量α1,,αr.
练习11. 证明如果AB是域F上的3×3矩阵, 那么AB在域F上相似的充要条件是它们拥有相同的特征多项式和极小多项式. 给出一个例子表明对于4×4的矩阵而言这是不对的.
练习12.F是复数域的一个子域, AB是域F上的n×n矩阵. 证明如果AB在复数域上相似, 那么它们也在F上相似. (提示: 证明A的有理形式不论A被视为F还是上的矩阵都是一样的, B当然也是如此.)
练习13.A是一个n×n复矩阵, 证明如果A的每个特征值都是实数, 那么A相似于一个实矩阵.
练习14.T是有限维向量空间V上的一个线性算子, 证明存在满足以下性质的向量αV. 如果f是一个多项式而f(T)α=0, 那么f(T)=0. (这样的向量α被称为T的多项式代数的一个分离向量.) 当T拥有循环向量时, 给出循环向量也是分离向量的直接证明.
练习15.F是复数域的一个子域, AF上的一个n×n矩阵, pA的极小多项式. 如果我们将A视为上的矩阵, 那么A上也拥有一个极小多项式f. 使用关于线性方程组的定理证明p=f. 另外, 你能看出这也可由循环分解定理推得吗?
练习16.A是一个满足A2+I=0n×n实矩阵, 证明n是偶数, 并且如果n=2k, 那么A在实数域上相似于以下分块形式的矩阵[0II0]其中Ik×k的恒等矩阵.
练习17.T是有限维向量空间V上的一个线性算子, 设
  1. T的极小多项式是素多项式之幂;
  2. T的极小多项式等于特征多项式.
证明不存在非平凡的T不变子空间拥有T不变的补子空间.
练习18. 如果T是可对角化线性算子, 那么每个T不变子空间都有与之互补的T不变子空间.
练习19.T是有限维向量空间V上的一个线性算子, 证明T拥有循环向量当且仅当每个与T交换的线性算子U都是应用某个多项式于T的结果.
练习20.V是域F上的一个有限维向量空间, TV上的一个线性算子. 我们问何时V中的每个非零向量都是T的一个循环向量, 证明其成立的充要条件为T的特征多项式在F上不可约.
练习21.A是一个n×n实矩阵, Tn上在标准有序基下由A表示的线性算子, Un上在标准有序基下由A表示的线性算子. 使用练习20的结果证明以下结论: 若T仅有平凡的不变子空间, 那么U是可对角化的.

第7.3节 Jordan形式

N是有限维向量空间V上的一个幂零算子. 让我们检视由定理3获得的N的循环分解. 我们有一个正整数rr个非零向量α1,,αrV满足V=Z(α1;N)Z(αr;N)并且若p1,,pr分别是α1,,αrN零化子, 那么对于i=1,,r1pi+1整除pi. 既然N是幂零算子, 那么其极小多项式为xk, 其中kn. [译注: 这里的n是隐式的V的维数.] 因此, 每个pi都具有xki的形式, 而整除的条件可以被表达为k1k2kr.当然了, k1=k并且kr1. xki的同伴矩阵是ki×ki的矩阵Ai=[0000100001000010].因此, 定理3为我们提供了V的一个有序基使得其下的矩阵是Ai这样的初等幂零矩阵之直和, 而且随着i的增大, Ai的大小是在减小的. 从中读者可以看出, 与一个n×n的幂零矩阵相关联着的, 是一个正整数rr个正整数k1,,kr满足k1++kr=nkiki+1. 这些正整数确定了矩阵的有理形式, 即在相似意义下确定了矩阵是什么. [译注: 相似矩阵有着相同的有理形式, 这从循环分解的唯一性来看是显然的.]

还有一点是我们想要对于上述的幂零算子N指出的. 正整数r恰是N的零化度. 实际上, r个向量Nki1αi构成了N的零空间的一个基. 这是因为, 令αN的零空间中的一个向量, 我们可以将α写成α=f1α1++frαr的形式, 其中fi是多项式, 并且不妨设对于每个ifi=0或者degfi<ki. 既然Nα=0, 那么对于每个i可知0=N(fiαi)=Nfi(N)αi=(xfi)αi因此, xfixki整除. 但是, 因为fi=0或者degfi<ki, 这意味着fi=cixki1其中ci是某个标量, 那么我们就有α=c1(xk11α1)++cr(xkr1αr)其表明这r个向量的确是N的零空间的一个基. [译注: 这些向量之所以线性无关, 是因为它们是使得幂零算子呈现有理形式的基的一部分.] 读者也应该注意到这个事实从矩阵的角度来看是相当清晰的.

现在我们想要将我们关于幂零算子或者幂零矩阵的发现和第6章的准素分解定理结合起来. 情况如下: 设TV的一个线性算子并且T的特征多项式在标量域F上可以被分解为f=(xc1)d1(xck)dk其中c1,,ckF的不同元素而di1, 那么T的极小多项式为p=(xc1)r1(xck)rk其中1ridi. 若Wi(TciI)ri的零空间, 那么准素分解定理告诉我们V=W1Wk并且由TWi上的限制导出的算子Ti的极小多项式为(xci)ri. 令Ni=TiciI, 那么Ni是幂零的并且其极小多项式为xri. 在Wi上, T就表现为Ni加上标量ci倍的恒等算子. 设我们挑选了Wi的一个有序基使得Ni呈现有理形式, 那么Ti在此有序基下的矩阵应该是形式为[c0001c00c001c]的矩阵的直和, 并且每个c=ci. 更进一步, 这些矩阵的大小自左向右递减. 我们将以上这种形式的矩阵称为与特征值c相关联的基本Jordan矩阵. 现在如果我们将每个Wi的基放在一起, 那么我们就得到了V的一个有序基. 让我们来刻画T在这个有序基下的矩阵A.

矩阵A是矩阵A1,,Ak的直和A=[A1000A2000Ak]每个Ai都具有形式Ai=[J1(i)000J2(i)000Jni(i)]其中每个Jj(i)都是与特征值ci相关联的基本Jordan矩阵. 而且, 在每个Ai内部, 矩阵Jj(i)的大小随着j的增加而递减. 一个满足本段之前所述条件的n×n矩阵A (对于不同的标量c1,,ck) 被称为是具有Jordan形式.

刚才我们已经指出, 若线性算子T的特征多项式可在标量域上被完全分解, 那么存在V的一个有序基使得T由某个Jordan形式表示. 现在我们想要说明的是, 这个矩阵在某种意义下是唯一的, 实际上最多仅取决于将T的特征值ci写下来的顺序. 换句话说, 如果两个Jordan形式是相似的, 那么它们仅可能是在标量ci的顺序上有所不同.

我们可以从以下论证中看出唯一性. 设存在V的某个有序基使得T由前述的Jordan矩阵A表示. 如果Ai是一个di×di的矩阵, 那么di显然是ci作为A (或者说T) 的特征多项式的根的重数. 换言之, T的特征多项式为f=(xc1)d1(xck)dk.这表明c1,,ckd1,,dk除开顺序应该是唯一的. A为矩阵Ai之直和的事实为我们提供了一个T不变的直和分解V=W1Wk. 我们注意到Wi必然是(TciI)n的零空间, 其中n=dimV. 这是因为, AiciI显然是幂零的, 而对于ji, AjciI又显然是非奇异的. 于是, 我们看到子空间Wi是唯一的. 如果Ti是由TWi上的限制导出的算子, 那么矩阵Ai作为(TiciI)的有理形式加上ci倍的di×di恒等矩阵是唯一的. [译注: 原文似乎忘掉还需要为幂零算子的有理形式加上ci倍的恒等矩阵才是Ai. 另外, Ai的唯一性依赖于有理形式的唯一性, 虽然实际上其间还有一点点差距, 但因为并不困难, 就留给读者思考了.]

现在我们希望更深入地观察算子T及其在某个有序基下的Jordan矩阵A, 以下所列出的是我们的发现:

  1. A的每个元素, 若是不在主对角线上或者紧挨着主对角线的下方, 必然是0. A的对角线上的元素是Tk种不同的特征值c1,,ck. 并且, ci重复di次, 而dici作为特征多项式的根的重数, 即di=dimWi.
  2. 对于每个i, 矩阵Aini个与特征值ci有关的基本Jordan矩阵Jj(i)的直和. 数字ni恰为与特征值ci相关联的特征空间的维数. 这是因为, ni(TiciI)的有理形式的基本幂零块的数目, 因而等于(TciI)的零空间的维数. [译注: Wi(TciI)ri的零空间, 其中ri是一个正整数, 于是其显然包含(TciI)的零空间.] 特别地, 我们注意到T是可对角化的当且仅当对于每个i, ni=di. [译注: ni是所谓的几何重数, di是所谓的代数重数.]
  3. 对于每个i, 矩阵Ai的第一个块J1(i)是一个ri×ri的矩阵, 其中rici作为T的极小多项式的根的重数. 这可由幂零算子(TiciI)的极小多项式为xri的事实推得.

当然, 和之前一样, 我们也有直接的矩阵形式的结果. 如果B是域F上的一个n×n矩阵并且B的特征多项式可在域F上被分解完全, 那么B在域F相似于一个n×n的Jordan矩阵A, 而A在可以重排其特征值顺序的意义下是唯一的, 我们将A称为B的Jordan形式.

F是代数闭域, 那么上述评注则可应用于所有F上的有限维向量空间上的线性算子. 因此, 例如, 每个复数域上的n×n矩阵都相似于一个基本上唯一的Jordan形式. [译注: "基本上"的意思即不计特征值的顺序.]

例子5.T2上的一个线性算子, 那么T的特征多项式要么具有(xc1)(xc2)的形式, 其中c1c2是不同的复数, 要么具有(xc)2的形式. 在前一种情况下, T必然是可对角化的且在某个有序基下由[c100c2]表示. 在后一种情况下, T的极小多项式可能是(xc), 那么T=cI, 或者是(xc)2, 那么在此情况下T在某个有序基下可由矩阵[c01c]表示. 因此, 复数域上的每个2×2矩阵, 要么相似于一个对角矩阵, 要么相似于以上这种形式的矩阵, 二者不可兼得.
例子6.A3×3的复矩阵A=[200a20bc1]A的特征多项式显然是(x2)2(x+1). 若这也是A的极小多项式, 那么A相似于[200120001]或者极小多项式为(x2)(x+1), 那么A相似于[200020001]既然(A2I)(A+I)=[0003a00ac00]因而A相似于对角矩阵当且仅当a=0.
例子7.A=[20001200002000a2]A的特征多项式为(x2)4. 既然A是两个2×2矩阵的直和, A的极小多项式显然是(x2)2. 现在如果a=0或者a=1, 那么矩阵A是Jordan形式. 注意到对于a=0a=1, 我们得到的两个矩阵有着相同的特征多项式和极小多项式, 但是它们并不相似. 这是因为, a=0时矩阵(A2I)的解空间的维数是3, 而a=1时解空间的维数则是2. [译注: 相似矩阵的解空间可以被视为对于同一个线性算子的零空间的具体刻画, 不论怎样它们的维数至少应该是相同的.]
译者注记. 在例子8之前, 译者想要写一些注记, 尽管这只是第6章的例子14的译者注记的老调重弹而已. 微分运算D实际上并非n次连续可微函数空间Cn上的线性算子, 因为它甚至不是算子. 实际上, n次连续可微函数的导数并不一定仍然是n次连续可微的. 换言之, Cn压根就不对运算D封闭. 原文看似完美无瑕的论证势必要打上一点补丁才行, 而改动最小的方式就是将Cn改成C, 即仅考虑无穷可微函数空间中满足微分方程的解. 这里的例子8甚至考虑的仅是n次可微而不是n次连续可微, 但是我们译注的基点没有发生变化.
例子8. 常系数齐次线性微分方程 (第6章的例子14) 提供了对于Jordan形式的一种很好的刻画. 令a0,,an1是复数而V是定义在实轴的某个固定区间上满足微分方程dnfdxn+an1dn1fdxn1++a1dfdx+a0f=0的所有n次可微函数f构成的空间. 令D是微分算子, 那么VD下不变, 因为Vp(D)的零空间, 其中p=xn++a1x+a0.那么V上的微分算子的Jordan形式是什么样的呢?
c1,,ckp不同的复根, 那么p=(xc1)r1(xck)rkVi(DciI)ri的零空间, 即微分方程(DciI)rif=0的解集, 那么根据第6章例子14的观察, 准素分解定理告诉我们V=V1Vk.NiDciIVi上的限制算子, 那么(V上的)算子D的Jordan形式由分别位于空间V1,,Vk上的幂零算子N1,,Nk的有理形式决定.
所以说, 我们必须要知道的是(在各种各样的c下)空间Vc上的算子N=DcI的有理形式, 其中Vc是微分方程(DcI)rf=0的解集. [译注: 这里的r实际上是某个任意的正整数, 并且根据第6章的微分方程的例子, Vc的维数就是r. 当然, NVc上是幂零算子的事实是显然的.] N在有理形式下有多少基本幂零块呢? 这个数字是N的零化度, 即与特征值c相关联的特征空间的维数. [译注: 这里说的特征值指的是Vc上的微分算子D的特征值, 而且其特征值就是唯一的, 即c, 这可以从之前的观察中看出来.] 然而, 此维数必然是1, 因为任意满足微分方程Df=cf的函数都是指数函数h(x)=ecx的某个标量倍数. 因此, (空间Vc上的)算子N具有循环向量, 其一个比较好的选择是g=xr1h:g(x)=xr1ecx.那么这就给出Ng=(r1)xr2hNr1g=(r1)!h[译注: 这里的符号运用稍微值得解释一下. 在xr1h中, x代表将每个值映射至自身的函数, xr1表示这个函数的r1次幂, 但是这里的乘法是定义在函数上的, 即(fg)(x)=f(x)g(x), 那当然xr1h也应该这么解释. 对于其余类似的表达式, 我们还应该注意到诸如(r1)这样的常数被解释为常值函数.] 现在我们知道D(在空间V)上的Jordan形式是k个基本Jordan矩阵的直和, 其中每个都对应于一个根ci, 且大小为ri×ri.
练习1.N1N2是域F上的3×3幂零矩阵, 证明N1N2相似当且仅当它们拥有相同的极小多项式.
练习2. 使用练习1和Jordan形式的结果证明以下事实: 如果域F上的n×n矩阵AB有着相同的特征多项式f=(xc1)d1(xck)dk和相同的极小多项式, 并且没有di大于3, 那么AB是相似的.
练习3. 如果A是一个5×5的复矩阵, 其特征多项式为f=(x2)3(x+7)2而极小多项式为p=(x2)2(x+7)那么A的Jordan形式是什么呢?
练习4. 6×6的复矩阵, 若其特征多项式为(x+2)4(x1)2, 那么其Jordan形式有多少种可能呢?
练习5. 次数小于等于3的多项式构成的向量空间 [译注: 当然包括不能定义次数的零多项式] 上的微分算子, 其在"自然"有序基下由矩阵[0100002000030000]表示. 这个矩阵的Jordan形式是什么? (F是复数域的一个子域.)
练习6.A是复矩阵[200000120000102000010200111120000011]找出A的Jordan形式.
练习7. 如果域F上的n×n矩阵Af=(xc1)d1(xck)dk为特征多项式, 请问A的迹是多少?
练习8. 按照相似对于满足A3=I3×3复矩阵A进行分类.
练习9. 按照相似对于满足An=In×n复矩阵A进行分类.
练习10.n是大于1的整数, N是域F上一个满足Nn=0但是Nn10n×n矩阵, 证明N没有平方根, 即不存在n×n的矩阵A使得A2=N.
练习11.N1N2是域F上的6×6幂零矩阵, 设其拥有相同的极小多项式和相同的零化度, 证明N1N2是相似的. 说明为何这对于7×7的情况并不成立.
练习12. 使用练习11和Jordan形式的结果证明以下事实: 令AB是域F有着相同特征多项式f=(xc1)d1(xck)dk和相同极小多项式的n×n矩阵, 并且设对于每个i, (AciI)(BciI)的解空间有着相同的维数, 如果没有di大于6, 那么AB是相似的.
练习13. 如果N是一个k×k的基本幂零矩阵, 即Nk=0但是Nk10, 证明Nt相似于N. 现在使用Jordan形式来证明每个复矩阵都相似于其转置.
练习14. 以下证明有何错误? 如果A是一个n×n的复矩阵满足At=A, 那么A=0. (证明: 令JA的Jordan形式, 因为At=A, 所以Jt=J. 但是, 鉴于J是下三角矩阵, Jt=J可以推出J的每个元素都是0. 既然J=0A相似于J, 那么A=0.) (给出非零矩阵A满足At=A的例子.)
练习15. 如果N上的一个3×3的幂零矩阵, 证明A=I+12N18N2满足A2=I+N, 即AI+N的一个平方根. 使用(1+t)1/2的二项级数展开以得到类似的I+N的平方根公式, 其中N上任意的n×n的幂零矩阵.
练习16. 使用练习15的结果证明如果c是一个非零复数而N是一个幂零的复矩阵, 那么(cI+N)拥有平方根. 现在使用Jordan形式来证明每个非奇异的n×n复矩阵都拥有平方根.

第7.4节 不变因子的计算

A是域F上的一个n×n矩阵, 我们希望找到一种能够计算确定了A的有理形式的不变因子p1,,pr的方法. 让我们从简单的情况着手, 即A是首项系数为一多项式p=xn+cn1xn1++c1x+c0的同伴矩阵. 在第7.1节我们已经看到p既是A的极小多项式也是A的特征多项式, 但是现在我们希望直接给出计算以表明pA的特征多项式. 在此情况下, 特征矩阵为xIA=[x000c01x00c101x0c2000xcn20001x+cn1].将第n行乘上x加到第(n1)行上去, 这将移除第(n1)(n1)列的x, 但是不会改变其行列式的值. 接着, 将新的第(n1)行乘上x加到第(n2)行上去. 如此反复直至所有主对角线上的x都被移除. 这个过程的最终结果是矩阵[0000xn++c1x+c01000xn1++c2x+c10100xn2++c3x+c20000x2+cn1x+cn20001x+cn1]其与xIA有着相同的行列式, 而右上角是p. 通过列变换我们可以清理一下最后一列:[0000p10000010000000000010]将前(n1)列每个都乘上1, 然后通过(n1)次相邻的对换将当前的最后一列移到第一列的位置. 因其(对于行列式而言)总的效果就是2n2次的符号反转, 所以行列式仍然不变. 我们得到了矩阵[p000010000100001]此时p=det(xIA)这个事实是显然的.

现在我们将要表明, 对于任意的n×n矩阵A, 存在一系列行和列变换将xIA转换为上面这种形式的矩阵, 即A的不变因子沿着主对角线依次出现. 先让我们完全明了我们将要(对于行和列)施行的操作.

我们关心的是F[x]m×n, 即由所有以域F上的多项式为元素的m×n矩阵构成的集合. 如果M是这样的一个矩阵, 那么M上的一个初等行变换是以下三种操作中的一种:

  1. M的一行乘上F中的一个非零标量;
  2. M的第r行替换为第r行加上f倍的第s行, 其中f是域F上任意的多项式并且rs;
  3. 交换M的两行.
一个初等行变换的逆仍然是相同类型的初等行变换. [译注: 其实所谓类型不是良定的, 但是不要紧, 因为压根不会利用这个事实.] 注意到在1中, 我们要求的是非零标量而不是非零多项式, 因为非标量的多项式并非可逆, 若是如此则会导致不能作出初等行变换可逆的断言. 一个m×m初等矩阵, 即一个F[x]m×m中的初等矩阵, 是可由m×m的恒等矩阵通过单独一个初等行变换得到的矩阵. 显然对于M施行一个初等行变换可以等效为给M左乘一个相应的m×m的初等矩阵; 实际上, 如果e是这样的一个初等行变换, 那么e(M)=e(I)M.

M,NF[x]m×n, 我们称M行等价于N, 如果N可由M经过有限的一系列初等行变换得到:M=M0M1Mk=N.显然N行等价于M当且仅当M行等价于N, 所以我们可以使用术语"MN是行等价的". 如果N行等价于M, 那么N=PM其中m×m的矩阵P是初等矩阵之积:P=E1Ek.特别地, P是一个可逆矩阵, 其逆为P1=Ek1E11.当然, Ej的逆来源于初等行变换的逆. [译注: 多项式上的矩阵乘法也满足结合律, 所以逆矩阵自然是唯一的.]

刚才的这些内容就和域上的矩阵是一样的, 其平行于第1章的那些基本结果. 因此, 其所暗示的接下来的问题应该是如何引入多项式矩阵的行简化阶梯形式. 这里我们遇到了新的障碍. 之前我们是怎么对于矩阵进行行规约的呢? 第一步是选出第1行的首非零元, 然后将第1行的每个元素都除以那个元素. 对于元素为多项式的矩阵, 我们必然不能在一般情况下完成这个操作. 在接下来的定理中我们可以看到, 特定情形下我们可以绕开这个困难. 然而, 对于F[x]m×n而言, 并不存在适用于所有情况的行简化形式. 若是我们也引入列变换, 并研究兼用行列变换得到的等价关系, 那么对于每个矩阵我们可以得到一种相当有用的标准形式. 以下是我们的基本工具.

引理.MF[x]m×n, 设其第一列不全为零, 并令pM的第一列各元素的最大公因子, 那么M行等价于一个矩阵N, 其中N的第一列为[p00].
证明. 我们将要证明的东西比我们刚才所陈述的要强一点. 实际上, 我们表明了存在一个找到N的算法, 即一个可供机器执行以在有限步骤内计算N的描述. 首先, 我们需要一些记号.
MF[x]m×n具有非零的首列M1=[f1fm]定义l(M1)=minfi0degfip(M1)=gcd(f1,,fm)j是某个满足degfj=l(M1)的下标. 为了明确起见, 令j是满足要求的下标中最小的那个, 即j=min{i{1,,m}|degfi=l(M1)}. 我们尝试用fj去除每个fi:fi=fjgi+ri,ri=0或者degri<degfj.对于每个异于ji, 将M的第i行替换为第i行减去gi乘上第j行. 将第j行乘上首项系数的倒数以将fj化为首项系数为一的多项式, 然后交换第j行和第1行. 通过所有这些操作, 我们得到了一个矩阵M, 其第一列为M1=[fjr2rj1r1rj+1rm].我们已经给出了一个良定义的过程以将每个M转化为一个具有以下这些性质的M:
  1. M行等价于M;
  2. p(M1)=p(M1);
  3. 要么l(M1)<l(M1), 要么M1=[p(M1)00].
性质b和c是容易验证的. [译注: 为了验证性质b, 读者最好回顾一下第4章, 那里将f1,,fmgcd定义为由这些多项式生成的理想的首项系数为一的生成元. 并且, 第4章给出了gcd的一个等价定义, 其更符合我们的直觉, 即若首项系数为一的多项式d满足其整除f1,,fm且每个整除f1,,fm的多项式都整除d, 那么df1,,fmgcd. 或许, 利用等价定义说明性质b是更简单的, 但其实两种定义都差不多.] 实际上, 性质c只是在重述, 要么存在某个i使得ri0degri<degfj, 要么对于每个i都有ri=0, 于是fj成为f1,,fm的最大公因子.
现在要证明引理就相当简单了. 我们从矩阵M开始, 应用上述过程以得到M. 性质c告诉我们要么矩阵M就是引理所需要的N, 要么l(M1)<l(M1). 对于后一种情况, 我们再次应用该过程于M以得到矩阵M(2)=(M). 要是M(2)也不合适, 我们就构造M(3)=(M(2)), 如此进行下去. 证明的要义在于严格的不等式l(M1)>l(M1)>l(M1(2))>不可能无限延伸下去. 至多只需要l(M1)次过程迭代, 我们必定能够抵达具有我们所寻求性质的矩阵M(k). [译注: 这里其实存在一个无关紧要的细节问题, 就是迭代次数的上界严格说来是l(M1)+1, 原因如下. 首先, 除非一开始矩阵的第一列就是符合条件的, 否则都需要进行至少一次迭代. 其次, 迭代终止的条件为l应用于矩阵第一列的值不变. 也就是说, 尽管前面的迭代步骤都会导致l应用于矩阵第一列的值严格减小, 但是最后一步时总是不变的.]
译者注记. 将引理的背景去掉, 其实这就是求多个多项式的最大公因子的辗转相除法.
定理6.PF[x]m×m, 以下条件是等价的:
  1. P是可逆的;
  2. P的行列式是非零的标量多项式;
  3. P行等价于m×m的恒等矩阵;
  4. P是初等矩阵之积.
证明. 由i推出ii是显然的, 这是因为行列式函数是乘性的, 而F[x]中的可逆元素仅是非零的标量多项式. 实际上, 第5章我们已经通过古典伴随说明了i和ii是等价的. 这里我们的论证提供了由ii推出i的一个不同证明. 我们将坐一圈旋转木马 (merry-go-round)iiiiviii其实并不显然的命题只有从ii推出iii而已.
假定ii成立, 我们考虑P的第一列. 其包含特定的多项式p1,,pm而我们知道必然有gcd(p1,,pm)=1因为每个p1,,pm的公因子都必然整除det(P), 其为非零的标量多项式. 应用前述引理于P, 我们可以得到一个矩阵Q=[1a2am0B0]其行等价于P. 鉴于一次初等行变换至多只会改变矩阵的行列式以一个非零的标量因子, det(Q)也是一个非零的标量多项式. 显然, (m1)×(m1)的矩阵BQ有着相同的行列式. 因此, 我们可以继续将前述引理应用于B. 若是重复此步骤m次, 就可以得到一个上三角矩阵R=[1a2am01bm001]其行等价于P. 并且, R又显然等价于m×m的恒等矩阵.
推论.M,NF[x]m×n, 那么N行等价于M当且仅当N=PM其中PF[x]m×m是一个可逆矩阵.

现在我们以类比于初等行变换和行等价的方式来定义初等列变换列等价. 我们并不需要新的初等矩阵的概念, 因为施行一次初等列变换于恒等矩阵得到的矩阵类和施行一次初等行变换得到的是一样的.

定义. 矩阵N等价于矩阵M, 如果我们可以通过一系列变换从M得到N:M=M0M1Mk=N其中每一步都是一次初等行变换或者初等列变换.
定理7.M,NF[x]m×n, N等价于M当且仅当N=PMQ其中PF[x]m×mQF[x]n×n都是可逆矩阵.
定理8.AFn×n, p1,,prA的不变因子, 那么矩阵xIA等价于一个n×n的对角矩阵, 其对角线上的元素依次为p1,,pr,1,1,,1.
证明. 存在可逆矩阵PFn×n使得P1AP成为有理形式, 即具有分块形式P1AP=[A1000A2000Ar]其中Ai是多项式pi的同伴矩阵. 根据定理7, 矩阵P1(xIA)P=xIP1AP等价于xIA. 现在我们有xIP1AP=[xIA1000xIA2000xIAr]其中的各个I是具有适当大小的恒等矩阵. 根据本节开头的讨论, 我们表明了xIAi等价于矩阵[pi00010001].将以上得到的结果组合一下, 显然xIA等价于这样的对角矩阵, 其主对角线上具有多项式pi(nr)1. 通过交换行和列, 可以将对角线元素按照我们想要的顺序排列, 即: p1,,pr,1,,1.

定理8的证明并未给出计算不变因子p1,,pr的有效方法, 因为其依赖于循环分解定理. 现在我们将给出一个规约行列式矩阵为对角形式的显式算法. 定理8的证明暗示了我们也可以将主对角线上的相继元素安排成前一个整除后一个的样子. [译注: 也就是说, 反转整个主对角线上的元素的顺序.]

定义.NF[x]m×n, 我们称N具有(Smith)规范形式, 如果
  1. N的每个偏离主对角线的元素都是0;
  2. N的主对角线上的元素依次是f1,,fl, 其满足fk整除fk+1, 1kl1.
在以上定义中, 数字l=min(m,n), 而主对角线元素是fk=Nk,k,k=1,,l.
译者注记. 作者在定义里遗漏了一个细节, 其后果是规范形式并非唯一. 实际上, 这里还需要添加额外的限制条件, 即主对角线上的非零元素的首项系数均为一.
定理9.MF[x]m×n, 那么M等价于一个具有规范形式的矩阵N.
证明. 鉴于原文的证明存在一些基本问题, 又很难通过直接打上补丁修复完善, 因此译者自行编制了一个证明, 其已经尽量在精神上与原文保持一致.
如果M=0, 那么M本身就具有规范形式, 无需证明. 如果M0, 我们想要(通过初等行变换和初等列变换)将其化为与之等价的形式M=[f1000R0]其中首项系数为一的多项式f1整除矩阵R的每个元素. 若我们的确能够施行此项操作, 实际上证明就结束了. 这是因为我们可以再次将该过程应用于R以得到多项式f2, 并且我们知道f1整除f2. 不断迭代下去, 我们最终将抵达所需的规范形式.
l(M)=minMi,j0degMi,j. 为了简单起见, 我们将以归纳法叙述证明. 如果l(M)=0, 这是显然的, 因为此时M具有某个标量元素, 只需将其化为1然后移动到左上角, 最后消去第一列和第一行的其他元素即可. 对于l(M)>0, 我们令k=l(M), 并作归纳假设: 对于任意的矩阵NF[x]m×n, 如果l(N)<k, 那么我们可以运用初等行变换和初等列变换将其化为我们想要的形式. 现在我们找出矩阵M中一个具有最低次数的元素, 然后将其移动到左上角来. 我们可以通过初等行变换将第一列除第一行以外的元素化为其除以第一行元素的余式. 若余式不均为零, 那么整个矩阵的元素的最低次数就减小了, 运用归纳假设即可. 否则的话, 我们将注意力放到第一行上来. 如法炮制, 我们可以通过初等列变换将第一行除了第一列以外的元素化为其除以第一列元素的余式. 若存在不为零的余式, 则又可使用归纳假设. 如果上面两个手段失效了, 此时第一行和第一列除左上角元素外均已化为零. 那么, 左上角的元素是否整除右下角的(m1)×(n1)分块矩阵的每个元素呢? 如果是, 那么就结束了. 否则的话, 即存在某个元素不能被左上角整除, 我们将包含该元素的列加到第一列上去. 明显地, 我们再次将第一列除了第一行之外的元素化为其除以第一行元素的余式. 此时可以肯定某个余式不为零, 即我们创造了利用归纳假设的条件. 至此证明全然结束了.
最后我们还想顺便说一句, 尽管这个以归纳法进行的证明似乎是声明性的, 但是实际上其已足够指导我们施行一个过程算法来将矩阵化为我们所需要的形式, 或者说其可以导出一个这样的过程. 或许, 这是因为归纳和递归天然就是类似的.

我们想要表明与一个矩阵M相关联的规范形式是唯一的. 我们已经见过的两件事实提供了定理9中的多项式f1,,fl何以被M唯一确定的线索. 首先, 初等行变换和初等列变换至多改变一个方阵的行列式以非零的标量因子. 其次, 初等行变换和初等列变换不会改变矩阵的元素的最大公因子. [译注: 实际上, 这两个事实之间的关系是递进的, 而后者才是真正的线索. 以下我们将证明, 确定了矩阵的Smith规范形式的不变因子 (即规范形式的主对角线上的元素) 可由所谓的行列式因子决定.]

定义.MF[x]m×n, 如果1kmin(m,n), 我们将δk(M)定义为M的所有k×k子矩阵的行列式的最大公因子. [译注: 在许多中文教材中, k×k的子矩阵的行列式常被称为k阶子式, 而δk(M)常被称为Mk阶行列式因子. 值得注意的是, 某一阶的子式可能全部为零, 此时的行列式因子要么设为未定义的, 要么就定义为零.]

回忆一下, M的一个k×k子矩阵是将M的某mk行和某nk列删去得到的东西. 换言之, 我们挑选了两个特定的k元组I=(i1,,ik),1i1<<ikmJ=(j1,,jk),1j1<<jkn然后由M的这些行和列构造了矩阵. 我们感兴趣的是行列式DI,J(M)=det[Mi1,j1Mi1,jkMik,j1Mik,jk].多项式δk(M)是诸多项式DI,J(M)的最大公因子, 其中IJ遍历所有可能的前述k元组.

定理10. 如果M,NF[x]m×n是等价的矩阵, 那么δk(M)=δk(N),1kmin(m,n).
证明. 实际上证明单次初等行变换e不会改变δk就够了, 而又因为e是可逆的, 所以我们只需要证明: 对于每个k而言, 如果多项式f整除所有DI,J(M), 那么f整除所有DI,J(e(M)), 其中I,J是一切可能的前述k元组.
既然我们在考虑行变换, 令α1,,αmM的行, 并且我们采用记号DJ(αi1,,αik)=DI,J(M).[译注: 严格说来, 这个定义方式稍有问题, 但是记号的含义还算是明确, 即以这些行构造矩阵, 取J指定的列来构造子矩阵, 最后计算其行列式.] 给定IJ, DI,J(M)DI,J(e(M))之间有什么关系呢? 考虑变换e的三种类型:
  1. 给第r行乘上一个非零标量c;
  2. 将第r行替换为第r行加上g倍的第s行, 其中rs;
  3. 交换第r行和第s行, 其中rs.
暂时忘掉类型c的操作, 让我们专注于类型a和b, 其仅改变第r行. 如果r不在下标i1,,ik之中, 那么显然DI,J(e(M))=DI,J(M).如果r在下标i1,,ik之中, 那么对于这两种类型的操作我们有
  1. DI,J(e(M))=DJ(αi1,,cαr,,αik)=cDJ(αi1,,αr,,αik)=cDI,J(M)
  2. DI,J(e(M))=DJ(αi1,,αr+gαs,,αik)=DI,J(M)+gDJ(αi1,,αs,,αik)
对于类型a的操作, 显然任意整除DI,J(M)的多项式f也整除DI,J(e(M)). 对于类型c的操作的情况, 注意到
  1. 如果存在j使得s=ij, 那么DJ(αi1,,αs,,αik)=0;
  2. 否则的话, 即对于所有j都是sij, 那么DJ(αi1,,αs,,αik)=±DI,J(M).
这个I是将k元组(i1,,s,,ik)按照升序重新排列得到的. 应该很明了的是, 如果f整除每个DI,J(M), 那么f整除每个DI,J(e(M)). [译注: 这里的I,J就不是给定的两个k元组了, 而是所有可能的情况.]
对于类型c操作的情况, 大致上也可遵循相同的论证手段, 或者说实际上其可以被实现为类型a和b操作的组合.
推论. 每个矩阵MF[x]m×n都恰等价于一个具有规范形式的N. 出现在N的主对角线上的多项式f1,,flfk=δk(M)δk1(M),1kmin(m,n)其中为了方便起见, 我们定义δ0(M)=1.
证明. 如果规范形式Nf1,,fl为对角线元素, 那么很容易看出来δk(N)=f1f2fk.
译者注记. 这个推论及其证明大体上是正确的, 就是有点粗糙. 问题在于, 可能存在某个k使得所有k阶子式都为零. (当然, 对于每个kk, k阶子式也都为零.) 至于如何细致地解决这个问题, 也就是说将推论及其证明陈述得圆满, 那就留给读者了.

当然了, 我们将推论中的矩阵N称为M规范形式. 多项式f1,,fl常被称为M不变因子.

AFn×n而令p1,,prA的不变因子. 现在我们可以看出矩阵xIA的规范形式的对角线元素依次是1,1,,1,pr,,p1. 前面的推论告诉我们如何基于xIA的子矩阵 [译注: 其实就是各阶行列式因子] 来表达p1,,pr. 数字nrmax{k{1,,n}|δk(xIA)=1}. A的极小多项式p1A的特征多项式除以xIA的所有(n1)×(n1)的子矩阵的最大公因子 [译注: 也就是(n1)阶行列式因子], 诸如此类.

练习1. 对还是错? 每个F[x]m×n中的矩阵都行等价于一个上三角矩阵.
练习2.T是有限维向量空间上的一个线性算子, AT在某个有序基下的矩阵, 那么T拥有循环向量当且仅当(xIA)的各(n1)×(n1)子矩阵的行列式互素.
练习3.AFn×n, 设f1,,fnxIA的规范形式的对角线元素. 对于什么样的矩阵Af11呢?
练习4. 构造一个以x2(x1)2为极小多项式且以x3(x1)4为特征多项式的线性算子T. 描述T下对于向量空间的准素分解, 并找出投影至这些不变子空间的算子. 找到一个基使得T的表示矩阵呈现Jordan形式. 最后, 显式给出定理3中的循环分解 (其将向量空间分解为T循环子空间的直和), 并求出不变因子.
练习5.T8上的线性算子, 其在标准有序基下由矩阵A=[1111111100000001000000010110000100011000011111010111101100000000]表示.
  1. 找出特征多项式和不变因子.
  2. 找出8T下的准素分解以及相应的那些投影. 对于准素分解的每个直和分量, 找出如定理3那样的循环分解.
  3. 找出A的Jordan形式.
  4. 如定理3那样, 将8分解为T循环子空间的直和. (提示: 一种做法是使用b的结果并对于例子4中所讨论的想法进行适当泛化.)

第7.5节 总结; 半单算子

在前一章和本章中, 我们一直在处理有限维向量空间V上的单独一个线性算子T. 既定的流程在于将T分解为比较简单的线性算子的直和, 这是为了获得T是如何在空间V上进行"操作"的详细信息. 让我们简要回顾一下现在我们所立之地.

最初我们使用特征值和特征向量来研究T. 我们引入了可对角化算子的概念, 其可以基于特征值和特征向量被完全刻画. 接着, 我们观察到T可能连一个特征向量都没有. 即便是标量域为代数闭域的情形, 此时每个线性算子都至少拥有一个特征向量, 我们注意到这些T的特征向量也未必能够张成整个空间.

于是, 我们证明了循环分解定理, 将任意的线性算子表达为拥有循环向量的算子的直和, 这无需对于标量域进行任何假定. 如果U是拥有循环向量的一个线性算子, 那么存在一个基{α1,,αn}满足Uαj=αj+1,j=1,,n1Uαn=c0α1c1α2cn1αnU在这个基上的作用为将每个αj偏移为下一个向量αj+1, 除了Uαn是基中这些向量的某个线性组合. 既然一般的线性算子T都是有限数目的这样的线性算子U的直和, 我们可以得到对于T的作用的一种显式而又相当简单的描述.

接下来我们将循环分解定理应用于幂零算子. 在标量域为代数闭域的情形下, 我们将其与准素分解定理相结合, 可以得到所谓的Jordan形式. Jordan形式给出了空间V的一个基{α1,,αn}, 其使得对于每个j, 要么Tαjαj的标量倍数, 要么Tαj=cαj+αj+1. 这样的一个基当然以一种显式而又简单的方式刻画了T的作用.

有理形式 (或者Jordan形式) 的重要性在于其存在性, 而非其在特定情形下可以被计算出来. 当然了, 如果给定一个线性算子并可计算其循环形式 [译注: 也就是有理形式] 或者Jordan形式, 那就是应该要做的事情. 这是因为, 若是我们拥有如此形式, 则可一口气报出大量关于T的信息. 标准形式的计算之中会出现两种不同类型的困难. 一种困难当然是计算可能会过于冗长. 另一种困难在于即便拥有必要的时间和耐心, 可能也没有任何方法能够施行意图的计算. 比如说, 第二种类型的困难出现于尝试计算一个复矩阵的Jordan形式时. 鉴于分解特征多项式并无良定的方法, 因而读者可能在问题的外围就卡住了. 不过, 我们的确在第7.4节表明了存在一个找出给定n×n矩阵的有理形式的算法. 然而, 这样的计算通常都是极其繁琐的. [译注: 当然, 就译者所处的时代而言, 读者完全可以使用计算机来施行这种计算.]

在以上我们对于本章和前一章的总结中, 我们尚未提及一个我们已经证明了的定理. 这个定理是说, 如果T是某个代数闭域上的向量空间上的线性算子, 那么其可以被唯一地分解为相互交换的一个可对角化算子和一个幂零算子之和. 这个结果是由准素分解定理和关于可对角化算子的特定信息推得的. 它不像循环分解定理或者Jordan形式的存在性那样深刻, 但是它的确在特定的数学部分里有着重要的用途. 为了给本章作结, 我们将证明了一个类似的定理, 但不假定标量域为代数闭域. 我们先来定义一种算子, 其将扮演着与可对角化算子类似的角色.

定义.V是域F上的一个有限维向量空间, TV上的一个线性算子. 我们称T半单 (semi-simple) 的, 如果每个T不变的子空间都拥有一个与之互补的T不变的子空间.

我们要证明的是, 只需要对于域F作出一些限制, 那么每个线性算子T都可以被唯一地表示为T=S+N的形式, 其中S是半单的, N是幂零的, 而且SN=NS. 首先, 我们将要通过极小多项式来刻画半单算子, 而这种刻画将表明, 当F是代数闭域时, 一个线性算子是半单的当且仅当其是可对角化的.

引理.T是有限维向量空间V上的一个线性算子, 令V=W1WkT的准素分解. 换言之, 如果pT的极小多项式而p=p1r1pkrkp的素因子分解, 那么Wjpjrj(T)的零空间. 令WV的任意在T下不变的子空间, 那么W=(WW1)(WWk).
证明. 为了证明这个引理, 我们需要回忆一下第6.8节中我们对于准素分解定理的证明的一个推论. 如果E1,,Ek是与分解V=W1Wk对应的投影, 那么每个Ej都是应用某个多项式于T的结果. 也就是说, 存在多项式h1,,hk使得Ej=hj(T).
现在令W是在T下不变的一个子空间. 如果αW, 那么α=α1++αk, 其中αjWj. 既然αj=Ej(α)=hj(T)α并且WT下不变, 每个αj也在W之中. 因此, 每个αW都具有α=α1++αk的形式, 其中αjWWj. 这个表达方式当然是唯一的, 鉴于V=W1Wk. 也就是说, 我们得到了W=(WW1)(WWk).
引理.T是有限维向量空间V上的一个线性算子, 设T的极小多项式在标量域F上不可约, 那么T是半单的.
证明.WV的一个在T下不变的子空间, 我们必须要证明W拥有一个与之互补的T不变子空间. 根据定理3的一个推论, 实际上证明{如果多项式f和向量βV满足f(T)βW, 那么存在αW使得f(T)β=f(T)α}就足够了. 于是, 设βV和多项式f满足f(T)βW. 若f(T)β=0, 令α=0, 那么αW并且f(T)β=f(T)α. 若f(T)β0, 那么f不被T的极小多项式p整除. 既然p是素多项式, 那么fp是互素的. 也就是说, 存在多项式gh使得fg+ph=1. 因为p(T)=0, 我们就有f(T)g(T)=I, 而这又能推出β必然在子空间W之中, 鉴于β=g(T)f(T)β=g(T)(f(T)β)其中f(T)βWWT下不变. 取α=β即可.
定理11.T是有限维向量空间V上的一个线性算子, 那么T为半单算子的充要条件是T的极小多项式p具有p=p1pk的形式, 其中p1,,pk是互异的标量域F上的不可约多项式. [译注: 虽然没有显式说明, 但是p1,,pk当然默认是非标量且首项系数为一的了.]
证明.T是半单算子, 我们将证明在对于极小多项式p的素因子分解中, 没有不可约多项式会重复出现. 假设其否定成立, 那么存在某个非标量的首项系数为一多项式g满足g2整除p. 令W是算子g(T)的零空间, 那么WT下不变. 现在对于某个多项式hp=g2h, 既然g并非标量多项式, 那么算子g(T)h(T)并非零算子. 于是, 存在βV使得g(T)h(T)β0, 即(gh)β0. 虽然(gh)βW, 鉴于g(ghβ)=g2hβ=pβ=0, 但是并无αW能够使得ghβ=ghα. 这是因为, 如果αW, 那么(gh)α=(hg)α=h(gα)=h(0)=0.也就是说, W没有与之互补的T不变子空间, 这与T是半单算子的假设矛盾.
现在设p的素因子分解为p=p1pk, 其中p1,,pk是互异的不可约(非标量)首项系数为一的多项式. [译注: 作者似乎终于回想起来第4章里不可约多项式和素多项式是两个不同的概念.] 令WV的一个在T下不变的子空间, 我们将证明W拥有一个与之互补的T不变的子空间. 令V=W1WkT的准素分解, 即令Wjpj(T)的零空间. 令TjTWj上由限制导出的算子, 于是Tj的极小多项式为素多项式pj. 现在WWjWj的一个在Tj下 (或者说在T下) 不变的子空间. 根据前面的第二条引理, 存在Wj的一个在Tj下不变的子空间Vj使得Wj=(WWj)Vj. 当然, 既然VjTj下不变, 其肯定也在T下不变. 那么, 我们有V=W1Wk=(WW1)V1(WWk)Vk=[(WW1)(WWk)]V1Vk根据之前的第一条引理, 我们知道W=(WW1)(WWk). 于是, 若令W=V1Vk, 那么V=WWWT下不变.
推论. 如果T是某个代数闭域上的有限维向量空间上的线性算子, 那么T是半单的当且仅当T是可对角化的.
证明. 如果标量域F是代数闭域, 那么F上的首项系数为一的素多项式都具有xc的形式. 在这种情况下, T是半单算子当且仅当T的极小多项式为p=(xc1)(xck), 其中c1,,ckF的不同元素, 而这恰恰就是我们在第6章建立的刻画T为可对角化算子的准则.

我们应该指出, T是半单算子当且仅当存在某个多项式f, 其是不同的素多项式之积, 使得f(T)=0. 这仅是与极小多项式为不同的素多项式之积的条件在表面上有所区别. [译注: 这里说的不同, 更准确地说, 实际上是互素, 因为我们不计标量缩放的差异.]

现在我们将注意力转移到将线性算子表示为交换的半单算子与幂零算子之和的问题上来. 在这里, 我们要限制标量域为复数域的一个子域. 机敏的读者可能会看出来要义在于域F应该是一个特征为零的域. 也就是说, 对于每个正整数n, F中的和1++1 (n1相加) 不应该为0. 对于域F上的多项式f, 我们用f(k)代表fk阶形式导数. 换一种记号的话, 就是f(k)=Dkf, 其中D是多项式空间上的形式微分算子. 如果g是另一个域F的多项式, 那么我们用f(g)代表应用fg的结果, 即由应用多项式f于线性代数F[x]中的元素g得到的多项式. [译注: 应用域F上的多项式于域F上的含幺元的线性代数的元素的操作在第4章中被定义, 当然这里的域不需要什么额外的限制.]

引理. Taylor公式.F是一个特征为零的域, gh是域F上的多项式. 如果f也是域F上的多项式并且degfn, 那么f(g)=k=0n1k!f(k)(h)(gh)k.[译注: 这个实际上是第4章最后一节的某个练习.]
证明. 我们要证明的是一般化了的Taylor公式. 若令h=cg=x, 我们则可得到原本的公式, 即f=f(x)=f(c)+f(1)(c)(xc)+f(2)(c)2!(xc)2++f(n)(c)n!(xc)n.对于这一般公式的证明实际上只是二项式定理(a+b)k=ak+kak1b+k(k1)2!ak2b2++bk的一个应用. 读者应该看出来, 既然替换和微分是线性过程, 那么只需要对于f=xk的情况证明公式成立就足够了, 因为f=k=0nckxk的一般情形可再由线性组合推得. 若f=xk, 其中kn, 那么Taylor公式是在说gk=hk+khk1(gh)+k(k1)2!hk2(gh)2++(gh)k这不过就是gk=[h+(gh)]k的二项式展开而已. [译注: 对于j>k, f(j)=0.]
译者注记. "替换和微分是线性过程"是说对于任意的标量ab, 对于任意的多项式fg, 对于任意的非负整数k, 我们有(af+bg)(h)=a[f(h)]+b[g(h)]以及(af+bg)(k)=af(k)+bg(k)于是最终得到a[f(k)(h)]+b[g(k)(h)]=[af(k)+bg(k)](h)=(af+bg)(k)(h)
引理.F是复数域的一个子域, f是域F上的一个首项系数为一的多项式, ff的形式导数, 那么以下陈述是等价的:
  1. f的素因子分解中各项互异;
  2. ff互素;
  3. 若将f视为域上的多项式, f没有重复的根.
证明. 陈述a和b的等价性实际上就是第4章的定理11 (而且那里的域可以是任意的), 所以不再赘述. 为了看出陈述c与a和b的等价性, 我们只需观察到以下事实. 对于域F上的多项式fg, 它们作为域F上的多项式而互素等价于其作为域上的多项式而互素. 我们将这个的证明留作练习. 取g=f, 注意到在f被视为上的多项式时, c就是a, 因而b和c是等价的.
译者注记. 这个观察到的事实可以通过带余除法的唯一性和辗转相除法说明.

现在我们可以证明一个定理, 其使得半单算子和可对角化算子之间的关系更加明晰.

定理12.F是复数域的一个子域, V是域F上的一个有限维向量空间, TV上的一个线性算子, AT在某个有序基下的表示矩阵, 那么T是半单算子当且仅当A在复数域上相似于一个对角矩阵.
证明.pT的极小多项式. 根据定理11, T为半单算子当且仅当p在域F上的素因子分解p=p1pkp1,,pk互异. 根据前述引理, T是半单算子当且仅当p在复数域上没有重复的根.
当然, p也是矩阵A的极小多项式. [译注: 读者或许可以回忆一下, 极小多项式并不会因为域的扩张而改变.] 我们知道A在复数域上相似于一个对角矩阵当且仅当极小多项式没有重复的复根. 这就证明了定理12.
定理13.F是复数域的一个子域, V是域F上的一个有限维向量空间, TV上的一个线性算子, 那么存在V上的半单算子S和幂零算子N使得
  1. T=S+N;
  2. SN=NS.
而且, 半单算子S和幂零算子N可由i和ii唯一确定, 它们都是应用某个多项式于T得到的结果.
证明.p1r1pkrkT的极小多项式的素因子分解, f=p1pk, r=max(r1,,rk), 那么f是互异的首项系数为一的素多项式之积, 且frT的极小多项式整除, 于是fr(T)=0.我们将要构造一个多项式序列g0,g1,g2,使得对于每个自然数n=0,1,2,, 有f(xj=0ngjfj)fn+1整除. 我们取g0=0, 那么f(xg0f0)=f(x)=ff整除. 设我们已经选定了g0,,gn1, 令h=xj=0n1gjfj根据假设, f(h)fn整除. 我们想要找出一个gn使得f(hgnfn)fn+1整除. 我们应用一般Taylor公式, 然后可以得到f(hgnfn)=k=0degf1k!f(k)(h)(gnfn)k=f(h)gnfnf(h)+fn+1b其中b是某个多项式. [译注: 如果注意一下细节的话, 这里degf1n1.] 根据假设, 存在多项式q满足f(h)=qfn. 因此, 为了使得f(hgnfn)fn+1整除, 只需要选择令[qgnf(h)]f整除的gn就可以了, 这的确是可以做到的. 鉴于p1,,pk互异, 所以ff互素. 也就是说, 存在多项式ae满足af+ef=1. 将其应用于h, 我们就得到a(h)f(h)+e(h)f(h)=1.gn=q[e(h)], 那么qgnf(h)=qq[e(h)]f(h)=q[a(h)]f(h)=q2[a(h)]fn[qgnf(h)]f整除. [译注: 这里的方括号仅是为了明示运算的顺序, 而非应用多项式之意.]
现在我们已经有了一个序列g0,g1,使得fn+1整除f(xj=0ngjfj)并且g0=0. 让我们取n=r1, 既然fr(T)=0, 我们有f(Tj=0r1gj(T)fj(T))=0.[译注: 这里用到了[f(g)](T)=f(g(T))的事实.] 令N=j=1r1gj(T)fj(T)=j=0r1gj(T)fj(T)既然j=1ngjfjf整除, 我们看出来Nr=0, 即N是一个幂零算子. 令S=TN, 那么f(S)=f(TN)=0. 鉴于f是不同的首项系数为一的素多项式之积, 那么S的极小多项式的素因子分解中也不可能出现重复的因子, 所以S是半单的.
现在我们有T=S+N, 其中S是一个半单算子, N是一个幂零算子, 并且它们都是应用某个多项式于T的结果, 因而是交换的. 为了证明唯一性的陈述, 让我们从标量域F转移到复数域上来考虑问题. 令𝔅是空间V的某个有序基, 那么我们有[T]𝔅=[S]𝔅+[N]𝔅其中[S]𝔅在复数域上是可对角化的, 而[N]𝔅是一个幂零矩阵, 并且它们还是交换的. 根据第6章中我们已经证明了的结果, 这样的两个矩阵是唯一确定的.
译者注记. 实际上第6章只表述了线性算子的版本, 若将其写成矩阵的形式, 则是以下定理.
定理. 对于域F上的n×n矩阵A, 若A的极小多项式可以在域F上被分解为一次因子之积, 那么存在可对角化矩阵DFn×n和幂零矩阵NFn×n满足
  1. A=D+N;
  2. DN=ND.
其中可对角化矩阵D和幂零矩阵N由条件i和ii唯一确定, 并且它们都是应用某个多项式于A得到的结果.
练习1. 对于标量域为复数域的一个子域的有限维向量空间V, 如果NV上的一个幂零线性算子, 那么对于任意的多项式f, f(N)的半单部分是恒等算子的一个标量倍数.
练习2.F是复数域的一个子域, VF上的一个有限维向量空间, TV上的一个半单线性算子. 如果f是域F上任意的一个多项式, 那么f(T)也是半单的.
练习3. 设标量域为复数域的一个子域, 对于向量空间上的一个线性算子T, 证明T是半单算子当且仅当对于任意的多项式f, f(T)是幂零算子可以推出f(T)=0.

第8章 内积空间

第8.1节 内积

整章我们只考虑实或复向量空间, 即实数域或复数域上的向量空间. 我们的主要目的在于研究可以讨论向量长度和夹角的向量空间. 我们将研究一类特定的标量值函数, 其定义于向量的序对之上, 被称为内积. 内积的一个例子是3中的标量积或者说点积. 3中的向量α=(x1,x2,x3)β=(y1,y2,y3)的标量积是实数α|β=x1y1+x2y2+x3y3.从几何上说, 这个点积是α的长度, β的长度, 以及αβ的夹角的余弦之积. 因此, 藉由代数地定义的标量积来定义3中的长度和夹角这样的几何概念完全是可能的.

向量空间上的内积是性质与3中的点积类似的函数, 而基于这样的内积我们又可以定义长度和角度. 我们关于角度的一般概念的注记将仅限于向量的垂直性 (或者说正交性). 第一节我们将定义何谓内积, 考虑一些实际的例子, 并建立内积的一些基本性质. 之后, 我们将回到讨论长度和正交性的任务上来.

定义.F是实数域或复数域, V是域F上的一个向量空间. V上的一个内积是一个函数V×VF,(α,β)α|β满足对于任意的α,β,γV和任意的标量cF
  1. α+β|γ=α|γ+β|γ;
  2. cα|β=cα|β;
  3. β|α=α|β, 一横代表复共轭;
  4. 如果α0, 那么α|α>0.

读者应该注意到条件a, b, c可以推出条件e:α|cβ+γ=cα|β+α|γ.另一点值得说明的是, 当F是实数域时, 条件c和e中的复共轭是多余的. 然而, 在复数域的情况下, 为了条件的一致性, 复共轭则是必要的. 若是没有这些复共轭, 我们就会得到以下矛盾:α|α>0iα|iα=1α|α>0.

在本章的剩余部分里, F要么代表实数域, 要么代表复数域.

例子1. Fn上存在一个内积, 我们称之为标准内积. 对于向量α=(x1,,xn)β=(y1,,yn), 其标准内积被定义为α|β=j=1nxjyj.F=时, 这也可以记成α|β=j=1nxjyj.在实数域的情形下, 标准内积常被称为点积或者标量积, 并记为αβ.
例子2. 对于2中的向量α=(x1,x2)β=(y1,y2), 令α|β=x1y1x2y1x1y2+4x2y2.既然α|α=(x1x2)2+3x22, 可直接推得α0时有α|α>0. 内积定义中的条件a, b, c则是容易验证的.
例子3.VFn×n, 那么V以自然的方式同构于Fn2, 因而由例子1可知A|B=j=1nk=1nAj,kBj,k定义了V上的一个内积. 而且, 如果我们引入共轭转置矩阵B, 其由Bk,j=Bj,k定义, 那么我们可以基于迹函数来表达内积:A|B=tr(AB)=tr(BA).这是因为tr(AB)=j=1n(AB)j,j=j=1nk=1nAj,kBk,j=j=1nk=1nAj,kBj,k
例子4.QFn×n是一个可逆矩阵, 对于X,YFn×1, 置X|Y=YQQX.注意到我们这里将右边的1×1矩阵与其唯一的元素等同起来了. 当Q为恒等矩阵时, 这个内积本质上和例子1是相同的, 我们将其称为Fn×1上的标准内积. 读者应该注意到术语"标准内积"在两种特定的上下文中使用. 对于一般的域F上的有限维向量空间, 并不存在显然可称之为标准的内积.
例子5.V是所有类型为[0,1]的连续函数构成的向量空间, 那么f|g=01f(t)g(t)dtV上的一个内积. 可能读者更熟悉单位区间上的实值连续函数构成的向量空间, 此时g(t)上的复共轭是可以省略的.
例子6. 这实际上是一类例子. 读者可以通过以下方法根据已有的内积构造出新的内积来. 令VW是域F上的向量空间, 设|W上的一个内积. 如果T是一个从VW的非奇异线性变换, 那么pT(α,β)=Tα|Tβ定义了V上的一个内积pT. 例子4中的内积可以被视为这个的一种特殊情形, 以下同样也是特殊情形.
  1. V是一个有限维向量空间, 令𝔅={α1,,αn}V的一个有序基. 令ε1,,εnFn的标准有序基, 令T是由Tαj=εj,j=1,,n定义的从VFn的线性变换. 换言之, 令T是由𝔅确定的从VFn的"自然"同构. 如果我们取Fn上的标准内积, 那么pT(j=1nxjαj,k=1nykαk)=j=1nxjyj.因此, 对于V的任意的有序基, 都存在一个具有性质αj|αk=δj,k的内积. 实际上, 很容易表明恰存在一个这样的内积. 之后我们将证明V上的每个内积都可根据某个有序基𝔅按照以上方式确定.
  2. 让我们再次检视例子5, 令V是单位区间上的所有连续函数构成的空间, 取W=V. 令T是"乘上t"的线性算子, 即(Tf)(t)=tf(t),0t1. 容易验证T是线性的. 而且, T也是非奇异的. 这是因为, 设Tf=0, 那么对于0t1tf(t)=0, 因而t>0f(t)=0. 鉴于f是连续的, 我们也有f(0)=0, 于是f=0. 现在使用例子5的内积, 我们可以构造V上的一个新的内积pT(f,g)=01(Tf)(t)(Tg)(t)dt=01f(t)g(t)t2dt

我们现在开始检视内积的一些一般性质. 设V是一个带有内积的复向量空间, 那么对于α,βV, 我们有α|β=Reα|β+iImα|β其中Reα|βImα|β分别是复数α|β的实部和虚部. 如果z是一个复数, 那么Imz=Re(iz), 这可以推出Imα|β=Re[iα|β]=Reα|iβ.因此, 按照α|β=Reα|β+iReα|iβ内积完全可由其"实部"确定.

偶尔知道实或复向量空间上的内积可由另一种函数确定是很有用的, 这种函数即所谓的二次形式. 为了定义二次形式, 我们首先以α代表α|α的正平方根; α被称为α相对于内积的范数. 通过考察1,,2,3上由标准内积导出的范数, 读者应该说服自己将α的范数想成是α的长度是很贴切的. 由内积决定的二次形式是函数αα2. 根据内积的性质, 我们可以推出, 对于任意的向量αβα±β2=α2±2Reα|β+β2.因此, 在实数域的情形下, 我们有α|β=14α+β214αβ2.在复数域的情形下, 我们得到的是更复杂的表达式α|β=14α+β214αβ2+i4α+iβ2i4αiβ2.这两个公式都被称为极化恒等式, 我们也应该注意到在复数域的情形下其也可以写成以下形式:α|β=14n=14inα+inβ2.

刚才我们所得到的性质对于任意的实或复向量空间上的内积均成立, 不论其维数如何. 现在我们转向V是有限维向量空间的情形. 正如读者可能会猜到的, 有限维向量空间上的内积总是可以基于一个有序基由矩阵刻画.

V是有限维的, 令𝔅={α1,,αn}V的一个有序基, 并且给定V上的一个特定的内积. 我们将表明, 这个内积完全由以下的这些值Gj,k=αk|αj决定. 如果α=k=1nxkαkβ=j=1nyjαj, 那么α|β=k=1nxkαk|β=k=1nxkαk|β=k=1nxkj=1nyjαk|αj=j=1nk=1nyjGj,kxk=YGX其中XY分别是αβ在有序基𝔅下的坐标矩阵, 而G是以Gj,k=αk|αj为元素的矩阵. 我们称G内积在有序基𝔅下的矩阵. 根据定义, G是一个Hermite矩阵, 即G=G. 然而, G是一种相当特殊的Hermite矩阵, 因为其必须满足附加的条件XGX>0,X0.特别地, G必须是可逆的. 否则的话, 存在一个X0使得GX=0, 那么对于这样的X就不能满足以上要求了. 更显式地说, 以上的条件即对于任意不全为零的标量x1,,xnj=1nk=1nxjGj,kxk>0.从中我们立即可以看出G的每个对角线元素都必然是正数. [译注: 提及正数, 一定是实数.] 然而, 这个施加于对角线元素上的条件并不足以保证XGX>0,X0, 之后我们将给出使其成立的充分条件. [译注: 这个施加于Hermite矩阵上的条件一般被称为"正定"条件.]

以上这样的过程是可逆的, 即若任意的Hermite矩阵GFn×n满足XGX>0,X0, 那么GV上的一个内积在有序基𝔅下的矩阵. 这个内积是由公式α|β=YGX给定的, 其中XY分别是αβ在有序基𝔅下的坐标矩阵.

练习1.V是一个向量空间而|V上的一个内积.
  1. 证明对于任意的βV0|β=0.
  2. 证明若对于任意的βVα|β=0, 那么α=0.
练习2.V是域F上的一个向量空间. 证明V上的两个内积之和仍然是V上的一个内积. 两个内积之差是内积吗? 证明一个内积的正倍数仍然是一个内积.
练习3. 显式描述11上的所有内积.
练习4. 验证Fn上的标准内积的确是一个内积.
练习5.|2上的标准内积.
  1. α=(1,2),β=(1,1), 如果向量γ满足α|γ=1β|γ=3, 求出γ.
  2. 证明对于任意的α2, 我们有α=α|ε1ε1+α|ε2ε2.
练习6.|2上的标准内积, 而T(x1,x2)=(x2,x1)2上的线性算子. 现在T是"逆时针旋转90度"的变换, 并且对于所有的α2, 都有α|Tα=0. 找出所有这样的2上的内积[|], 其对于每个向量α[α|Tα]=0.
练习7.|2上的标准内积, 证明不存在非零的2上的线性算子T使得对于每个α2α|Tα=0. 推广这个结果.
练习8.A2×2, 定义映射fA:2×1×2×1fA(X,Y)=YtAX.证明fA2×1上的一个内积当且仅当A=At,A1,1>0,A2,2>0,det(A)>0.
练习9.V是一个带有的内积的实或复向量空间, 证明由内积确定的范数满足平行四边形定律α+β2+αβ2=2α2+2β2.
练习10. 找出例子2中的内积在2的标准有序基下的矩阵.
练习11. 证明公式j=0lajxj|k=0mbkxk=j=0lk=0majbkj+k+1定义了[x]上的一个内积. 令W是次数小于等于n的多项式构成的子空间. 限制以上内积于W, 找出其相对于有序基{1,x,x2,,xn}的矩阵. (提示: 为了表明这个公式的确定义了一个内积, 观察到f|g=01f(t)g(t)dt然后处理这个积分表达式.)
练习12.V是一个有限维向量空间, 𝔅={α1,,αn}V的一个有序基, |V上的一个内积. 如果c1,,cn是任意的n个标量, 那么恰存在一个向量αV使得α|αj=cj,j=1,,n.
练习13.V是一个复向量空间. 一个函数J:VV被称为一个共轭 (conjugation), 如果J(α+β)=J(α)+J(β),J(cα)=cJ(α),J(J(α))=α, 其中c是任意的标量而α,βV. 如果J是一个共轭, 证明:
  1. W={αV|Jα=α}相对于V中所定义的运算可以被视为域上的一个向量空间.
  2. 对于每个αV, 存在唯一的向量β,γW使得α=β+iγ.
练习14.V是一个复向量空间, W是一个满足以下性质的V的子集:
  1. 相对于V中所定义的运算, W可以被视为一个实向量空间.
  2. 对于每个αV, 存在唯一的向量β,γW满足α=β+iγ.
证明Jα=βiγ定义了V上的一个共轭, 其满足Jα=α当且仅当αW. 另外, 证明JV上唯一带有此性质的共轭.
练习15. 找出12上的所有共轭.
练习16.W是复向量空间V的一个有限维实子空间. 证明W满足练习14的条件b当且仅当W的每个基也是V的一个基.
练习17.V是一个复向量空间, JV上的一个共轭, W={αV|Jα=α}V的一个实子空间, fW上的一个内积, 证明:
  1. 存在唯一的V上的内积g使得对于任意的α,βWg(α,β)=f(α,β).
  2. 对于所有的α,βV, g(Jα,Jβ)=g(β,α).
以上的部分a是在说11 (或者nn) 上的标准内积之间的什么关系?

第8.2节 内积空间

既然现在我们已经对于内积有所了解, 那么我们将注意力转移到向量空间与其上的某个特定内积结合产生的代数结构上来. 具体来说, 我们将建立由内积赋予向量空间的"长度"和"正交性"的概念的基本性质.

定义. 一个内积空间是一个其上带有特定内积的实或复向量空间.

一个有限维的实内积空间常被称为一个Euclid空间. 一个复内积空间经常被称为一个酉空间.

定理1. 如果V是一个内积空间, 那么对于任意的向量α,βV和标量c, 我们有
  1. cα=|c|α;
  2. 对于α0, α>0;
  3. |α|β|αβ;
  4. α+βα+β.
证明. 陈述i和ii几乎可由定义直接推出. iii中的不等式在α=0时是显然成立的. 若α0, 置γ=ββ|αα2α那么γ|α=0, 然后0γ2=ββ|αα2α|ββ|αα2α=β|ββ|αα|βα2=β|β|α|β|2α2因此, |α|β|2α2β2, 再开根即可. 现在使用iii, 我们可以推出α+β2=α2+2Reα|β+β2α2+2|α|β|+β2α2+2αβ+β2=(α+β)2于是, α+βα+β.

iii被称为Cauchy-Schwarz不等式, 其有着各种各样的应用. 根据刚才我们的证明, 如果α0, 那么除非β=β|αα2α该不等式严格成立. 也就是说, Cauchy-Schwarz不等式取等号当且仅当αβ线性相关.

译者注记. 以上对于Cauchy-Schwarz不等式的证明看似复杂, 实则在某种意义上有着简单的几何解释. 例如, 在2及其上的标准内积下, 很容易看出来β|αα2αβα上的垂直投影, γ|α=0就是对于垂直的表述, 而γ2=β|β|α|β|2α2差不多就是勾股定理/Pythagoras定理的一个应用.
例子7. 如果我们将Cauchy-Schwarz不等式应用于例子1, 2, 3, 5中给出的内积, 那么我们就会得到以下结果:
  1. |k=1nxkyk|(k=1n|xk|2)12(k=1n|yk|2)12
  2. |x1y1x2y1x1y2+4x2y2|((x1x2)2+3x22)1/2((y1y2)2+3y22)1/2
  3. |tr(AB)|(tr(AA))1/2(tr(BB))1/2
  4. |01f(t)g(t)dt|(01|f(t)|2dt)12(01|g(t)|2dt)12
定义.αβ是内积空间V中的向量, 那么α正交β, 如果α|β=0. 既然这能推出β正交于α, 我们常就简单说αβ是正交的. 对于V的一个子集S, 我们称S是一个正交集合, 若其中不同向量之间均是正交的. 如果对于正交集合S的每个向量αα=1, 那么我们就称S是一个规范正交集合.

零向量正交于V中的每个向量, 而且是唯一具有此性质的向量. 另外, 读者应该将规范正交集合想成是由长度为1且相互垂直的向量构成的集合.

例子8. n的标准基相对于其上的标准内积是一个规范正交集合, n也是如此.
例子9. 2中的向量(x,y)相对于标准内积与(y,x)正交, 因为(x,y)|(y,x)=xy+yx=0.然而, 如果2装备的是例子2中的内积, 那么(x,y)(y,x)正交当且仅当y=3±132x.
例子10.Vn×n, Ep,q是仅第pq列为1其余均为0的矩阵, 那么所有这样的矩阵Ep,q构成的集合相对于例子3中给出的内积是规范正交的, 因为Ep,q|Er,s=tr(Ep,qEs,r)=δq,str(Ep,r)=δq,sδp,r.
例子11.V是区间[0,1]上的连续复值 (或者实值) 函数构成的向量空间, 并定义其上的内积为f|g=01f(t)g(t)dt.fn(x)=2cos2πnxgn(x)=2sin2πnx, 那么{1,f1,g1,f2,g2,}构成了一个无穷的规范正交集合. 在复情形下, 我们也可以构造以下线性组合12(fn±ign),n=1,2,以这种方式, 我们构造了一个新的规范正交集合S, 其由所有具有形式hn(x)=e2πinx,n=±1,±2,的函数构成. 将常函数1加入S得到的集合S也是规范正交的. 我们假定读者熟悉以上内容所牵涉的积分计算.

以上例子给出的规范正交集合均是线性无关的, 现在我们将表明诚然如此.

定理2. 由非零向量构成的正交集合是线性无关的.
证明.S是某给定内积空间中由非零向量构成的有限或无限的正交集合, 设α1,α2,,αmS中的不同向量, 并且β=c1α1+c2α2++cmαm那么β|αk=j=1mcjαj|αk=j=1mcjαj|αk=ckαk|αk既然αk|αk0, 这可以推出ck=β|αkαk2,1km.因此, 当β=0时, 每个ck=0, 即S是线性无关的集合.
推论. 如果一个向量β是由非零向量α1,,αm构成的一个正交序列的线性组合, 那么β必然是以下特定的线性组合β=k=1mβ|αkαk2αk.

以上的推论是定理的证明的直接结果. 另外, 还有一个应该提及的显然推论. 如果{α1,,αm}是某个有限维内积空间V中由非零向量构成的正交集合, 那么mdimV. 这是在说V中相互正交的方向的数目不可能超过V的由代数定义的维数. V中相互正交的方向的最大数目可以被理解为V的几何维数, 并且我们刚才看到其不会大于代数维数. 这两种维数相等的事实是以下结果的一个特定推论.

定理3.V是一个内积空间, 而β1,,βnV中线性无关的向量, 那么我们可以构造V中相互正交的向量α1,,αn使得对于每个k=1,2,,n, 集合{α1,,αk}是由β1,,βk张成的子空间的一个基.
证明. 向量α1,,αn可由一种被称为Gram-Schmidt正交化过程的构造方式得到. 首先, 令α1=β1, 而其他向量则按以下方法由归纳给定: 设已经挑选了α1,,αm使得对于每个k{α1,,αk},1km是由β1,,βk张成的V的子空间的一个正交基, 其中1m<n. 为了构造下一个向量αm+1, 令αm+1=βm+1k=1mβm+1|αkαk2αk那么αm+10, 因为否则的话βm+1就是α1,,αm的线性组合了, 也就是β1,,βm的线性组合. 而且, 如果1jm, 那么αm+1|αj=βm+1|αjk=1mβm+1|αkαk2αk|αj=βm+1|αjβm+1|αj=0因此, {α1,,αm+1}是由m+1个非零向量构成的正交集合, 并且它们都在由β1,,βm+1张成的子空间之中. 根据定理2, 其的确是该子空间的一个基. 换言之, 向量α1,,αn可按以上公式一个接着一个地构造出来. 特别地, 当n=4时, 我们有α1=β1α2=β2β2|α1α12α1α3=β3β3|α1α12α1β3|α2α22α2α4=β4β4|α1α12α1β4|α2α22α2β4|α3α32α3
推论. 每个有限维内积空间都拥有一个规范正交基.
证明.V是一个有限维内积空间, 而{β1,,βn}V的一个基. 应用Gram-Schmidt过程, 我们可以构造一个正交基{α1,,αn}. 那么, 为了获得一个规范正交基, 我们仅需将每个向量αk替换以αk/αk就够了.

规范正交基相较于其他任意的基的一个主要优势在于牵涉坐标的计算会更加简单. 为了澄清这个断言, 设V是一个有限维内积空间. 那么, 根据上一节的讨论, 我们可以构造这个内积相对于V的某个有序基𝔅={α1,,αn}的矩阵G, 其由Gj,k=αk|αj定义, 然后便可基于坐标来计算内积. 若𝔅是一个规范正交基, 那么G就是恒等矩阵, 而对于任意的标量xjyk, 我们有j=1nxjαj|k=1nykαk=j=1nxjyj因此, 基于规范正交基, V中的内积看起来就像是Fn中的标准内积.

尽管实际计算上的用途有限, 但有趣的是, Gram-Schmidt过程也可以用来判定是否线性相关. 设β1,,βnV中线性相关的向量, 排除β1=0的平凡情况. [译注: 其实不排除也可以, 只是对于极端情况需要一些说明.] 令m是使得β1,,βm能够线性无关的最大整数, 那么1m<n. 若α1,,αm是施行正交化过程于β1,,βm得到的向量, 那么αm+1=βm+1k=1mβm+1|αkαk2αk必然为0. 这是因为, αm+1在由α1,,αm张成的子空间之中并且正交于这些向量, 因而根据定理2的推论可知αm+1=0. 也就是说, βm+1α1,,αm的线性组合, 即β1,,βm的线性组合, 那么β1,,βm+1是线性相关的.

译者注记. 上一段的内容告诉我们, 即便为了施行Gram-Schmidt正交化过程, 也无需提前判断出β1,,βn是线性无关的. 这是因为, 在正交化的过程中, 一旦遇到某个αk=0, 那么便可知β1,,βk线性相关. 而若正交化过程结束也没有出现哪个αk=0, 就可以断言β1,,βn线性无关.
例子12. 对于装备有标准内积的3, 考虑向量β1=(3,0,4),β2=(1,0,7),β3=(2,9,11)施行Gram-Schmidt过程于β1,β2,β3, 我们就得到了以下向量.α1=(3,0,4)α2=(1,0,7)(1,0,7)|(3,0,4)25(3,0,4)=(1,0,7)(3,0,4)=(4,0,3)α3=(2,9,11)(2,9,11)|(3,0,4)25(3,0,4)(2,9,11)|(4,0,3)25(4,0,3)=(2,9,11)2(3,0,4)(4,0,3)=(0,9,0)这些向量显然是非零的且相互正交, 因而{α1,α2,α3}3的一个正交基. 为了将3中任意的向量(x1,x2,x3)表达为α1,α2,α3的线性组合, 我们无需求解任何线性方程组, 运用定理2的推论即可. 因此, 我们就有(x1,x2,x3)=3x1+4x325α1+4x1+3x325α2+x29α3.例如, (1,2,3)可以被表示为线性组合(1,2,3)=35(3,0,4)+15(4,0,3)+29(0,9,0).实际上, 我们可以换个角度陈述以上的结果: 对偶于基{α1,α2,α3}(3)的基{f1,f2,f3}可由以下公式所显式定义f1(x1,x2,x3)=3x1+4x325f2(x1,x2,x3)=4x1+3x325f3(x1,x2,x3)=x29当然, 这些公式可以写成以下更为一般的形式fj(x1,x2,x3)=(x1,x2,x3)|αjαj2.最后一点, 注意到从α1,α2,α3中我们可以得到规范正交基15(3,0,4),15(4,0,3),(0,1,0).
例子13.A=[abcd]是一个复矩阵, 置β1=(a,b)β2=(c,d), 并设β10. 如果我们使用2上的标准内积对于β1,β2施行正交化过程, 就会得到以下向量:α1=(a,b)α2=(c,d)(c,d)|(a,b)|a|2+|b|2(a,b)=(c,d)ca+db|a|2+|b|2(a,b)=(cbbdba|a|2+|b|2,daacab|a|2+|b|2)=detA|a|2+|b|2(b,a)之前的一般理论告诉我们α20当且仅当β1,β2线性无关. 另一方面, α2的公式告诉我们α20当且仅当detA0.

从本质上说, Gram-Schmidt过程就是不断重复应用一种被称为正交投影的基本几何操作. 并且, 从这一角度理解正交化过程最为恰当. 在解决近似问题时, 正交投影也会自然出现.

W是内积空间V的一个子空间, 令βV中的任意一个向量. 我们的问题在于找出W中对于β的最佳的可能近似. 这意味着在向量α属于W的限制下寻找使得βα尽可能小的向量α. 让我们用更加精确的语言来陈述这件事情.

W中的向量对于β进行的最佳近似是这样一个向量αW, 其满足对于每个向量γW, 我们都有βαβγ.

通过检视这个问题在2或者3中的情况, 读者从直觉上可以感受到以W的向量对于β的最佳近似应该是使得βα垂直 (或者说正交) 于W的向量α. 而且, 这样的α应该恰只有一个. 这些直觉性的想法对于有限维子空间是正确的, 而仅对于部分而不是全部的无限维子空间成立. 鉴于精确的情况太过复杂而难以在这里处理, 我们将只证明以下的结果.

定理4.W是内积空间V的一个子空间, 并设βV中的一个向量.
  1. 向量αW是以W中的向量对于β进行的最佳近似当且仅当βα正交于W中的每个向量.
  2. 如果以W的向量对于β进行的最佳近似存在, 那么其是唯一的.
  3. 如果W是有限维的并且{α1,,αn}W的任意的正交基, 那么向量α=k=1nβ|αkαk2αk是以W的向量对于β的(唯一的)最佳近似.
证明. 首先, 注意到如果γV中的任意向量, 那么βγ=(βα)+(αγ), 而且βγ2=βα2+2Reβα|αγ+αγ2.现在设βα正交于W中的每个向量, 如果γWγα, 那么既然αγW, 我们可以推出βγ2=βα2+αγ2>βα2反过来, 设对于每个γWβγβα, 那么根据上面的第一个等式, 这可以推出2Reβα|αγ+αγ20对于每个γW成立. 鉴于{αγ|γW}=W, 实际上其等价于2Reβα|τ+τ20对于每个τW成立. 对于非零的τW, 我们可以构造向量φ=βα|ττ2τW代入即得2Reβα|φ+φ2=2Reβα|βα|ττ2τ+βα|ττ2τ2=2|βα|τ|2τ2+|βα|τ|2τ2=|βα|τ|2τ20于是, βα|τ=0. 换言之, βα正交于W中的每个向量. 到目前为止, 我们完成了对于i的证明. 不过, 根据上面的讨论, 若存在W中的向量满足最佳近似的条件, 那么显然至多只有一个这样的向量. 也就是说, ii的确成立.
现在设WV的一个有限维子空间, 那么我们知道, 根据定理3, W的确拥有正交基. 令{α1,,αn}W的任意的正交基, 按照iii的方式定义α. 然后, 根据定理3的证明中的计算, 我们知道βα正交于每个αk. 换言之, βα正交于W中的每个向量. 根据已经证明了的i, 我们可以断言α是以W中的向量对于β的最佳近似.
定义.V是一个内积空间, SV的一个子集, 那么S正交补被定义为S={βV|对于每个αSβ|α=0}.

V的正交补是零子空间. 反过来, {0}=V. 如果SV的任意子集, 那么其正交补S总是V的子空间. 这是因为, 首先S是非空的, 鉴于其总是包含0; 其次, 每当α,βSc是任意的标量, 对于每个γS, 我们有cα+β|γ=cα|γ+β|γ=c0+0=0因而cα+βS. 在定理4中, 最佳近似α的特征性质在于其是W中唯一使得βαW的向量.

定义. 每当定理4中的向量α存在, 其被称为βW上的正交投影. 如果V中的每个向量都在W上具有正交投影, 那么赋V的向量以其在W上的正交投影的确是一个映射, 这被称为VW上的正交投影.

根据定理4, 内积空间在有限维子空间上的正交投影总是存在的. 但是, 定理4也能推出以下结果.

推论.V是一个内积空间, W是其一个有限维子空间, EVW上的正交投影, 那么映射ββEβVW上的正交投影.
证明. 对于任意的向量βV, 根据E的定义和定理4, 我们知道βEβW. 然后, 既然β(βEβ)=EβW而又根据W的定义, W中的向量总是正交于W的每个向量, 于是β(βEβ)也正交于W的每个向量. 换言之, ββEβVW上的正交投影.
例子14. 给定装备有标准内积的3, 那么(10,2,8)在由(3,12,1)张成的子空间W上的正交投影为α=(10,2,8)|(3,12,1)(3,12,1)2(3,12,1)=14154(3,12,1)3W上的正交投影E(x1,x2,x3)3x1+12x2x3154(3,12,1).E的秩显然为1, 因而E的零化度为2. 另一方面,E(x1,x2,x3)=(0,0,0)当且仅当3x1+12x2x3=0, 而这等价于(x1,x2,x3)W. 因此, WE的零空间, 而dimW=2. 通过计算(x1,x2,x3)3x1+12x2x3154(3,12,1)我们知道3W上的正交投影IE(x1,x2,x3)1154(145x136x2+3x3,36x1+10x2+12x3,3x1+12x2+153x3)

例子14中的观察将以如下形式得到泛化.

定理5.W是内积空间V的一个有限维子空间, 设EVW上的正交投影, 那么EV上的一个幂等线性算子. 而且, WE的像, WE的零空间, 于是V=WW.
证明. 对于每个βV, 既然EβW, 那么E(Eβ)=Eβ是显然的. 换言之, E2=E, 即E是幂等的. 现在我们需要证明E是线性的. 对于α,βV, 我们知道αEα,βEβW. 设c是任意的标量, 那么c(αEα)+(βEβ)=(cα+β)(cEα+Eβ)W其中cEα+EβW. 换言之, 即E(cα+β)=cEα+Eβ, 由此E是线性算子.
只需稍微检视一下正交投影的定义, 便可知E的像是W. 另外, 根据定理4的推论, IEVW上的正交投影. 而且, IE的像是W. 现在让我们回忆一下第6章的定理9及其之前的讨论, 就知道E的零空间是W, 于是V=WW.
推论. 在定理5的条件下, IEVW上的正交投影. 而且, IEV上的幂等线性算子, 其以W为像而W为零空间.
译者注记. 对于定理4的推论还有定理5及其推论而言, W是有限维子空间的条件并不是必要的, 只是为了确保正交投影的存在性. 实际上, 若VW上的正交投影的确存在, 那么这些命题依旧成立.

现在我们可以按照如下方式几何地陈述Gram-Schmidt过程了. 给定内积空间V和线性无关的向量β1,,βn, 令Pk,k>1V在由β1,,βk1张成的子空间的正交补上的正交投影, 并设P1=I, 那么应用正交化过程于β1,,βn得到的向量α1,,αn可由αk=Pkβk,1kn定义.

定理5也可以推出所谓的Bessel不等式.

推论.{α1,,αn}是内积空间V中由非零向量构成的正交集合, 如果βV, 那么k=1n|β|αk|2αk2β2.并且, 此不等式取得等号当且仅当β=k=1nβ|αkαk2αk.
证明.W是由α1,,αn张成的子空间, 那么γ=k=1nβ|αkαk2αkW是以W中的向量对于β的最佳近似. 并且, 若令δ=βγ, 则δW, 因而γ|δ=0, 故β2=γ2+δ2=k=1nβ|αkαk2αk|k=1nβ|αkαk2αk+δ2=(k=1n|β|αk|2αk2)+δ2k=1n|β|αk|2αk2显然, 此不等式取得等号当且仅当δ2=0, 即β=γ. 证明就结束了.
译者注记. Bessel不等式取得等号的一个等价条件为β在由α1,,αn张成的子空间之中.

{α1,,αn}为规范正交集的特殊情况下, Bessel不等式就变成了k=1n|β|αk|2β2.当然, 若{α1,,αn}V的一个规范正交基, 那么Bessel不等式总是取等号, 而此时β在有序基{α1,,αn}下的坐标的第k个分量为β|αk.

例子15. 若我们将上述推论应用于例子11中所描述的规范正交集合, 就会发现
  1. k=nn|01f(t)e2πiktdt|201|f(t)|2dt
  2. 01|k=nncke2πikt|2dt=k=nn|ck|2
  3. 01(2cos2πt+2sin4πt)2dt=1+1=2
练习1. 考虑装备了标准内积的4, 令子空间W={γ4|γ|α=0γ|β=0}其中α=(1,0,1,1)β=(2,3,1,2), 找出W的一个基.
练习2. 应用Gram-Schmidt过程于向量β1=(1,0,1), β2=(1,0,1), β3=(0,3,4)以得到装备有标准内积的3的一个规范正交基.
练习3. 考虑装备有标准内积的3, 找出由β1=(1,0,i)β2=(2,1,1+i)张成的子空间的一个规范正交基.
练习4.V是一个内积空间, 两个向量αβ之间的距离d(α,β)=αβ定义, 证明
  1. d(α,β)0;
  2. d(α,β)=0当且仅当α=β;
  3. d(α,β)=d(β,α);
  4. d(α,β)d(α,γ)+d(γ,β).
练习5.V是一个内积空间而α,βV, 那么α=β当且仅当对于每个γVα|γ=β|γ.
练习6. 给定装备有标准内积的2, 令W是由(3,4)张成的子空间, E2W上的正交投影, 找出
  1. E(x1,x2)的公式;
  2. 标准有序基下E的矩阵;
  3. W;
  4. 使得E由矩阵[1000]表示的一个规范正交基.
练习7.V是一个内积空间, 其向量空间为2, 而其内积的二次形式由(x1,x2)2=(x1x2)2+3x22定义. 令EV在由(3,4)张成的子空间W上的正交投影, 现在回答练习6的四个问题.
练习8. 找出2上的一个内积使得ε1|ε2=2.
练习9.V[x]的次数至多为3的多项式构成的子空间, 其上装备的内积为f|g=01f(t)g(t)dt.
  1. 找出由所有标量多项式构成的子空间的正交补.
  2. 应用Gram-Schmidt过程于基{1,x,x2,x3}.
练习10.V是向量空间n×n, 设其上的内积为A|B=tr(AB), 找出由所有对角矩阵构成的子空间的正交补.
练习11.V是一个有限维内积空间, {α1,,αn}V的一个规范正交基, 证明对于任意的α,βV, 我们都有α|β=k=1nα|αkβ|αk.
练习12.W是内积空间V的一个有限维子空间, EVW上的正交投影, 证明对于所有α,βV, Eα|β=α|Eβ.
练习13.S是内积空间V的一个子集. 证明(S)包含由S张成的子空间. 当V是有限维的时候, 证明(S)就是由S张成的子空间.
练习14.V是一个有限维内积空间而𝔅={α1,,αn}V的一个规范正交基. 令TV上的一个线性算子而A是在有序基𝔅下的矩阵. 证明Ai,j=Tαj|αi.
练习15.V=W1W2f1f2分别是W1W2上的内积. 证明存在唯一的V上的内积f使得
  1. W2=W1;
  2. 对于α,βWk,k=1,2, 有f(α,β)=fk(α,β).
练习16.V是一个内积空间而WV的一个有限维子空间, 一般存在许多以W为像的投影. 其中一种当然是W上的正交投影, 它具有对于每个αV, Eαα的性质. 证明如果E是一个以W为像的投影且对于每个αVEαα, 那么EW上的正交投影. [译注: 这个不等式和Bessel不等式差不多.]
练习17.V是一个实内积空间, 其由区间[1,1]上的所有连续实值函数构成, 而内积为f|g=11f(t)g(t)dt.W是所有奇函数构成子空间, 找出W的正交补.

第8.3节 线性泛函和伴随

本节的第一部分处理内积空间上的线性泛函以及其与内积的关系. 基本的结果在于有限维内积空间上任意的线性泛函f就是"固定一个向量的内积", 即对于某个固定的βV, f具有f(α)=α|β的形式. 我们使用这个结果证明了V上的线性算子T的"伴随"的存在性, 其是一个对于每个α,βVTα|β=α|Tβ的线性算子T. 通过规范正交基的使用, 线性算子上的伴随操作 (从TT) 就相当于构造一个矩阵的共轭转置. 我们稍微探索了一下伴随操作和复数的共轭之间的类似之处.

V是任意的内积空间, βV是一个固定的向量, 我们定义从V到标量域的函数fβfβ(α)=α|β.函数fβV上的一个线性泛函, 这是因为根据内积的定义, α|β作为α的函数是线性的. 如果V是有限维的, 那么V上的每个线性泛函都可由某个β以这种方式产生.

定理6.V是一个有限维内积空间, 而fV上的一个线性泛函, 那么存在唯一的向量βV使得对于每个αVf(α)=α|β.
证明.{α1,α2,,αn}V的一个规范正交基, 置β=j=1nf(αj)αjfβ是由fβ(α)=α|β定义的线性泛函, 那么fβ(αk)=αk|j=1nf(αj)αj=f(αk).既然这对于每个基向量αk成立, 于是f=fβ. 现在设γV满足fγ=f, 那么fγ(γβ)fβ(γβ)=γβ|γγβ|β=γβ|γβ=0换言之, γβ=0, 即γ=β. 因此, 恰存在一个向量β按照以上陈述的方式确定了线性泛函f.

这个证明可以使用基下的线性泛函的表示的语言稍微重述一下. 如果我们选定了V的一个规范正交基{α1,,αn}, 那么α=x1α1++xnαnβ=y1α1++ynαn的内积为α|β=x1y1++xnyn.如果fV上任意的线性泛函, 那么f具有f(α)=c1x1++cnxn的形式, 其中c1,,cn是由基确定的一些固定标量. 当然, cj=f(αj). 如果我们希望找到一个向量βV使得对于每个αα|β=f(α), 那么显然β的坐标分量yj必须满足yj=cj, 或者说yj=f(αj). 据此, 可知β=f(α1)α1++f(αn)αn就是我们所要的向量.

现在应该作出一些更加深刻的评注. 刚才我们所给出的对于定理6的证明相当简短, 然而它却没能强调一个基本的几何事实, 即β位于f的零空间的正交补之中. 令Wf的零空间, 那么V=WW, 并且f完全由其在W上的值所确定. 实际上, 如果PVW上的正交投影, 那么f(α)=f(Pα)对于每个αV成立. 设f0, 那么f的秩为1dimW=1. 如果γW中任意的非零向量, 那么Pα=α|γγ2γ对于所有αV成立, 因此f(α)=f(Pα)=f(α|γγ2γ)=α|γf(γ)γ2=α|f(γ)γ2γ换言之, β=[f(γ)/γ2]γ.

译者注记. 前一段的一些基本事实(对于像我这样不够聪明的读者)值得澄清. 首先, 之所以β位于f的零空间的正交补之中, 是因为若f(α)=0, 那么α|β=0, 即β正交于f的零空间的每个向量. 其次, 之所以f(α)=f(Pα), 是因为根据P的定义, αPα正交于W的每个向量, 而我们知道βW, 于是就有αPα|β=α|βPα|β=f(α)f(Pα)=0f(α)=f(Pα).
例子16. 我们应该给出一个例子以表明定理6若缺少V是有限维空间的条件则并不成立. 令V是复数域上的多项式的向量空间, 而内积为f|g=01f(t)g(t)dt.这个内积也可以被代数地定义. 如果f=j=0lajxjg=k=0mbkxk, 那么f|g=j=0lk=0majbkj+k+1.z是一个固定的复数, L是"在z处求值"的线性泛函:L(f)=f(z).存在一个多项式g使得对于每个ff|g=L(f)吗? 答案是否定的, 以下是我们的推理. 设存在多项式g满足f(z)=01f(t)g(t)dt对于每个多项式f成立. 令h=xz, 那么对于任意的f我们有(hf)(z)=0, 于是0=01h(t)f(t)g(t)dt特别地, 这个等式在f=hg时也成立, 以至于01h(t)(hg)(t)g(t)dt=01|h(t)|2|g(t)|2dt=01|(hg)(t)|2dt=hg|hg=0这可以推出hg=0. 鉴于h0, 必然有g=0. 可是, L并非零线性泛函, 即这样的g不存在.
译者注记. 以上的h是对于h的每个系数作复共轭得到的多项式. 在t为实数的情况下, h(t)=h(t).

读者可以稍微推广一下这个例子. 设我们选定了标量c1,,cn和不同的复数z1,,zn, 令L(f)=c1f(z1)++cnf(zn)那么LV上的一个线性泛函, 但是除非c1=c2==cn=0, 并不存在多项式g使得L(f)=f|g. 读者只需重复上述的论证以h=(xz1)(xzn).

现在我们将注意力转到线性算子的伴随的概念上来.

定理7. 对于有限维内积空间V上任意的线性算子T, 存在唯一的V上的线性算子T使得对于每个α,βVTα|β=α|Tβ.
证明.βV中任意的一个向量, 那么αTα|βV上的一个线性泛函. 根据定理6, 存在唯一的βV使得对于每个αVTα|β=α|β. 令T是映射ββ, 我们知道Tα|β=α|Tβ对于所有α,βV成立, 那么剩下来的工作就是要验证T的确是一个线性算子. 令β,γVc是一个标量, 对于任意的α, 我们有α|T(cβ+γ)=Tα|cβ+γ=cTα|β+Tα|γ=cα|Tβ+α|Tγ=α|cTβ+Tγ因此, T(cβ+γ)=cTβ+Tγ, 即T是线性的.
T的唯一性是显然的. 对于任意的向量βV, 向量Tβ由以下条件所唯一刻画:对于每个αVTα|β=α|Tβ.
译者注记. 以上证明的写法在某种意义上有些颠倒. 实际上, 根据定理6, 满足条件的T至多只有一个. 接着, 我们仅需要验证这个由定理6确定的映射的确是我们所要的线性算子即可.
定理8.V是一个有限维内积空间而𝔅={α1,,αn}V的一个(有序)规范正交基, 令TV上的一个线性算子而A是在有序基𝔅下的矩阵, 那么Ak,j=Tαj|αk.
证明. 既然𝔅是一个规范正交基, 我们有α=k=1nα|αkαk.鉴于矩阵ATαj=k=1nAk,jαk定义, 而Tαj=k=1nTαj|αkαk我们有Ak,j=Tαj|αk.
推论.V是一个有限维内积空间而TV上的一个线性算子, 那么在V的任意的规范正交基下, T的矩阵是T的矩阵的共轭转置.
证明.𝔅={α1,,αn}V的一个规范正交基, 设A=[T]𝔅B=[T]𝔅. 根据定理6, 我们有Ak,j=Tαj|αkBk,j=Tαj|αk.根据T的定义, 可以推出Bk,j=Tαj|αk=αk|Tαj=Tαk|αj=Aj,k
例子17.V是一个有限维内积空间, EV在其一个子空间W上的正交投影, 那么对于任意的α,βV, 我们可以推出Eα|β=Eα|Eβ+(IE)β=Eα|Eβ=Eα+(IE)α|Eβ=α|Eβ根据算子E的唯一性, 我们知道E=E. 现在考虑例子14所描述的投影, 那么A=1154[936336144123121]E在标准规范正交基下的矩阵. 根据之前的推论, 应该有A=A, 的确如此. 另一方面, 设α1=(154,0,0)α2=(145,36,3)α3=(36,10,12)那么{α1,α2,α3}是一个基, 并且Eα1=(9,36,3)Eα2=(0,0,0)Eα3=(0,0,0)既然(9,36,3)=(154,0,0)(145,36,3), E在基{α1,α2,α3}下的矩阵为B=[100100000].在这种情况下, BB, 而且B也不是E在基{α1,α2,α3}下的矩阵. 应用以上推论, 我们可以得出{α1,α2,α3}不是规范正交基. 当然, 这不论如何都是很显然的.
定义.T是内积空间V上的一个线性算子, 那么我们称TV上具有一个伴随, 如果存在V上的一个线性算子T使得Tα|β=α|Tβ对于所有α,βV成立.

根据定理7, 有限维内积空间V上的每个线性算子T都在V上具有伴随. 在无限维的情形下, 并不总是如此. 但是, 不论如何, 至多只有一个这样的算子T. 当它存在时, 我们将其称为T伴随.

关于有限维的情形, 有两点评注值得一说.

  1. T的伴随不仅依赖于T, 也依赖于内积的定义.
  2. 正如例子17所显示的那样, 对于任意而非规范正交的有序基𝔅, [T]𝔅[T]𝔅之间的关系要比以上推论所描述的更加复杂.

例子18.Vn×1而内积为X|Y=YX. 如果An×n, 那么线性算子XAX的伴随是线性算子XAX, 因为AX|Y=YAX=(AY)X=X|AY.读者应该发现这是前述推论的一个特殊情形.
例子19. 这个例子类似于例子18. 令Vn×n而内积为A|B=tr(AB). 令Mn×n, 那么左乘M的伴随是左乘M. 当然, 左乘M指的是线性算子LM(A)=MA.LM(A)|B=tr(MAB)=tr(ABM)=tr(A(MB))=A|LM(B)因此, (LM)=LM. 以上计算中, 我们用到了迹函数的一个特有性质: tr(AB)=tr(BA).
译者注记. 本书还没有证明过tr(AB)=tr(BA), 现在我们来证明一下:tr(AB)=j=1n(AB)j,j=j=1nk=1nAj,kBk,j=k=1nj=1nBk,jAj,k=k=1n(BA)k,k=tr(BA)
例子20.V是复数域上的多项式的向量空间, 而其上的内积为f|g=01f(t)g(t)dt.考虑线性算子"乘以f", 即Mf(g)=fg, 那么这个算子具有一个伴随, 即乘以f, 这是因为Mf(g)|h=fg|h=01f(t)g(t)h(t)dt=01g(t)[f(t)h(t)]dt=01g(t)(fh)(t)dt=g|fh=g|Mf(h)于是(Mf)=Mf.
例子21. 在例子20里, 我们看到某些无限维向量空间上的线性算子的确也有伴随. 正如之前所说, 这种线性算子并不总是具有伴随. 令V是例子20中的内积空间, 而D[x]上的形式微分算子, 那么分部积分表明Df|g=f(1)g(1)f(0)g(0)f|Dg.让我们固定g, 并检视何时存在一个多项式Dg使得对于所有的f都有Df|g=f|Dg. 如果这样的一个Dg存在的话, 我们有f|Dg=f(1)g(1)f(0)g(0)f|Dg或者f|Dg+Dg=f(1)g(1)f(0)g(0).g固定的情况下, L(f)=f(1)g(1)f(0)g(0)就成为例子16中所考虑的那种类型的线性泛函. 除非L=0, 其就不可能具有L(f)=f|h的形式. 如果Dg存在, 那么令h=Dg+Dg, 我们就有L(f)=f|h, 于是g(0)=g(1)=0. 也就是说, 适合的Dg的存在可以推出g(0)=g(1)=0. 反过来, 若g(0)=g(1)=0, 多项式Dg=Dg满足对于所有的f, Df|g=f|Dg. 如果我们选择了任意的g使得g(0)0g(1)0, 那么就不可能定义合适的Dg. 我们总结一下, 即D没有伴随.

我们希望这些例子能够加深读者对于线性算子的伴随的理解. 我们看到, 从TT的伴随操作表现得有些类似于复数上的共轭. 以下的定理强调了这种类比.

定理9.V是一个有限维内积空间, TUV上的线性算子, c是任意的标量, 那么
  1. (T+U)=T+U;
  2. (cT)=cT;
  3. (TU)=UT;
  4. (T)=T.
证明. 为了证明i, 令α,βV, 那么(T+U)α|β=Tα+Uα|β=Tα|β+Uα|β=α|Tβ+α|Uβ=α|Tβ+Uβ=α|(T+U)β根据伴随的唯一性, 我们得到了(T+U)=T+U. 我们将ii的证明留给读者. 我们从以下关系TUα|β=Uα|Tβ=α|UTβTα|β=β|Tα=Tβ|α=α|Tβ可以得到iii和iv.

定理9经常被重述为伴随是一个周期为2的共轭线性的反同构. 我们上面提及的伴随与复共轭的类似之处当然是复共轭具有z1+z2=z1+z2, z1z2=z1z2, z=z的性质. 对于乘积的伴随, 读者必须小心顺序是相反的: (TU)=UT. 当我们继续研究内积空间上的线性算子时, 我们将提及以上类比的一些扩展. 现在, 我们就要沿着之前的路线提及一点. 一个复数z是实数当且仅当z=z. 读者可能会设想满足T=T的线性算子T在某种意义上表现得与实数类似, 实际上的确如此. 例如, 若T是有限维内积空间上的一个线性算子, 那么T=U1+iU2其中U1=U1U2=U2. 因此, T也拥有某种"实部"和"虚部". 这样的算子U1U2是唯一的, 由U1=12(T+T)U2=12i(TT)给定.

满足T=T的线性算子T被称为是自伴的, 或者Hermite的. 若𝔅V的一个规范正交基, 那么[T]𝔅=[T]𝔅.于是, T是自伴算子当且仅当其在每个规范正交基下的矩阵表示都是自伴的. 自伴算子是重要的, 不仅在于其提供了一般线性算子在某种意义下的实部和虚部, 还出于以下原因:

  1. 自伴算子具有许多特殊的性质. 例如, 对于这样的一种线性算子, 存在一个由其特征向量构成的规范正交基.
  2. 许多实践中出现的线性算子都是自伴的.
之后我们将考虑自伴算子的特殊性质.

练习1.V是带有标准内积的向量空间2, T是由Tε1=(1,2)Tε2=(i,1)定义的线性算子. 如果α=(x1,x2), 找出Tα.
练习2.T2上的线性算子, 由Tε1=(1+i,2)Tε2=(i,i)定义. 使用标准内积, 找出T在标准有序基下的矩阵. TT交换吗?
练习3.V是带有标准内积的3, TV上的线性算子, 其在标准有序基下的矩阵由Aj,k=ij+k定义, 其中i是虚数单位. 找出T的零空间的一个基.
练习4.V是一个有限维内积空间, TV上的一个线性算子, 证明T的像是T的零空间的正交补.
练习5.V是一个有限维内积空间, TV上的一个线性算子. 如果T是可逆的, 证明T也是可逆的, 并且(T)1=(T1).
练习6.V是一个内积空间, 而βγV中固定的向量. 证明Tα=α|βγ定义了V上的一个线性算子. 证明T具有伴随, 并显式描述T.
现在设V是带有标准内积的n, β=(y1,,yn)γ=(x1,,xn). T在标准有序基下的矩阵的第jk列的元素是什么? 这个矩阵的秩是多少?
练习7. 证明两个自伴算子之积是自伴的当且仅当这两个算子交换.
练习8.V上次数小于等于3的多项式构成的向量空间, 而内积为f|g=01f(t)g(t)dt.如果t是一个实数, 找出多项式gtV使得对于每个fV都有f|gt=f(t).
练习9.V是练习8的内积空间, DV上的形式微分算子, 找出D.
练习10.Vn×n, 其上的内积为A|B=tr(AB). 令PV是一个固定的可逆矩阵, 而TP(A)=P1APV上的线性算子. 找出TP的伴随.
练习11.V是一个有限维内积空间, EV上的一个幂等线性算子, 证明E是自伴的当且仅当EE=EE.
练习12.V是一个有限维内积空间, TV上的一个线性算子, 证明T是自伴的当且仅当对于每个αV, Tα|α是实数.

第8.4节 酉算子

在本节中, 我们将考虑两个内积空间之间的同构的概念. 如果VW是向量空间, 那么从VW的同构是一个从VW的双射的线性变换, 即"保持"向量空间运算的从VW的一一对应. 既然内积空间不仅包含包含向量空间, 还具有一个给定的内积, 那么当VW是内积空间时, 我们要求从VW的内积不仅保持线性运算, 还应该保持内积. 内积空间上的自同构被称为"酉算子". 我们将考虑酉算子的各种例子并建立其基本性质.

定义.VW是相同的域上的内积空间, T是从VW的线性变换, 那么我们称T保持内积, 如果对于每个α,βV都有Tα|Tβ=α|β. 从VW同构是保持内积的从VW的向量空间的同构.

如果T保持内积, 那么Tα=α, 于是T必然是非奇异的. 因此, 从VW的同构也可以被定义为保持内积的从VW的满射的线性变换. 若T是从VW的同构, 那么T1是从WV的同构. 当这样的一个T存在时, 我们就称VW同构的. 当然, 内积空间之间的同构是一个等价关系.

定理10.VW是相同的域上的n维内积空间, 如果T是从VW的线性变换, 那么以下条件是等价的.
  1. T保持内积.
  2. T是一个(内积空间的)同构.
  3. TV的每个规范正交基映射为W的规范正交基.
  4. TV的某个规范正交基映射为W的规范正交基.
证明. 由i推出ii: 如果T保持内积, 那么对于每个αV, Tα=α. 因此, T是非奇异的. 既然dimV=dimW, 我们知道T是一个向量空间的同构.
由ii推出iii: 设T是一个同构. 令{α1,,αn}V的一个规范正交基. 既然T是一个向量空间的同构, 那么{Tα1,,Tαn}W的一个基. 鉴于T也保持内积, Tαj|Tαk=αj|αk=δj,k.
由iii推出iv: 不言自明.
由iv推出i: 令{α1,,αn}V的一个规范正交基, 其使得{Tα1,,Tαn}W的一个规范正交基, 那么Tαj|Tαk=δj,k=αj|αk.对于V中任意的向量α=x1α1++xnαnβ=y1α1++ynαn, 我们有α|β=j=1nxjyjTα|Tβ=j=1nxjTαj|k=1nykTαk=j=1nk=1nxjykTαj|Tαk=j=1nxjyj于是, T保持内积.
译者注记. 以上证明用到了第3章的定理9的注记.
推论.VW是相同的域上的有限维内积空间, 那么VW同构当且仅当它们具有相等的维数.
证明. 如果{α1,,αn}V的一个规范正交基而{β1,,βn}W的一个规范正交基, 令T是由Tαj=βj定义的从VW的线性变换, 那么T是从VW的同构.
例子22. 如果V是一个n维内积空间, 那么每个有序规范正交基𝔅={α1,,αn}都确定了一个从V到带有标准内积的Fn的同构, 这个同构即T(x1α1++xnαn)=(x1,,xn).还有一个由𝔅确定的从V到带有标准内积的Fn×1的同构, 其仅与前述例子在表面上有所不同, 此即α[α]𝔅也就是将α送至其在有序基𝔅下的坐标矩阵的变换. 对于任意的有序基𝔅而言, 这都是一个向量空间的同构. 然而, 这是两个内积空间之间的同构当且仅当𝔅是一个规范正交基.
例子23. 现在我们给出一个不那么浮浅的例子. 令W上的所有3×3的斜对称矩阵A (即At=A) 构成的向量空间. 我们装备W以内积A|B=12tr(ABt), 这里的12只是为了方便而插入的. 令V是带有标准内积的3. 令T是从VW的线性变换, 由T(x1,x2,x3)=[0x3x2x30x1x2x10].定义, 那么T是一个满射. 置A=[0x3x2x30x1x2x10],B=[0y3y2y30y1y2y10]我们有tr(ABt)=x3y3+x2y2+x3y3+x2y2+x1y1=2(x1y1+x2y2+x3y3)因此, α|β=Tα|TβT是一个内积空间之间的同构. 注意到T将标准基ε1,ε2,ε3送至规范正交基[000001010],[001000100],[010100000].
例子24. 基于规范正交基描述同构实际上并不总是最方便. 例如, 设G=PP, 其中P是一个n×n的可逆复矩阵. 令V是向量空间n×1, 带有内积[X|Y]=YGX. 令W是相同的向量空间, 但是带有标准内积X|Y=YX. 我们知道VW是同构的内积空间. 似乎刻画一个VW之间的同构的最简单方式如下: 令从VW的线性变换T(X)=PX, 那么TX|TY=PX|PY=(PY)(PX)=YPPX=YGX=[X|Y]因而T是一个同构.
例子25.V是单位区间上的实值连续函数的空间, 带有内积[f|g]=01f(t)g(t)t2dt.W是相同的向量空间, 带有内积f|g=01f(t)g(t)dt.T是从VW的线性变换, 由(Tf)(t)=tf(t)给定, 那么Tf|Tg=[f|g], 于是T保持内积. 然而, T并非从VW的同构, 因为T不是满射. 当然, 这会发生仅是因为作为基础的向量空间不是有限维的.
定理11.VW是相同的域上的内积空间, T是从VW的线性变换, 那么T保持内积当且仅当对于每个αV, Tα=α.
证明. 如果T保持内积, 那么当然T"保持范数". 设对于每个αVTα=α, 那么Tα2=α2. 现在根据实或复选择相应的极化恒等式, 再加上T具有线性性质的事实, 很容易得到对于每个α,βV, 我们有α|β=Tα|Tβ.
译者注记. 以复内积空间为例, 我们补充一下这里的推理:Tα|Tβ=14(Tα+Tβ2TαTβ2)+i4(Tα+iTβ2TαiTβ2)=14(T(α+β)2T(αβ)2)+i4(T(α+iβ)2T(αiβ)2)=14(α+β2αβ2)+i4(α+iβ2αiβ2)=α|β
定义. 一个内积空间上的一个酉算子是一个从此空间到自身的同构.

两个酉算子之积仍然是酉算子, 因为如果U1U2是酉算子, 那么U2U1是可逆的, 并且对于每个αU2U1α2=U1α2=α2. [译注: 作者这里提及可逆时, 指的是作为映射的可逆, 或者是作为线性变换的可逆, 但肯定不是作为内积空间同态的可逆, 因为那样的话就不需要说明了.] 当然, 酉算子的逆也是酉算子, 鉴于Uα=α可以推出U1β=β, 其中β=Uα. [译注: 这个逆当然说的是作为映射的逆.] 既然恒等算子显然是一个酉算子, 我们看到一个内积空间上的所有酉算子构成的集合在复合运算下是一个群.

如果V是一个有限维内积空间而TV上的一个线性算子, 那么定理10告诉我们U是酉算子当且仅当对于每个α,βV, Uα|Uβ=α|β; 或者, 当且仅当对于某个 (或者每个) 规范正交基{α1,,αn}, {Uα1,,Uαn}也是规范正交基.

定理12.U是内积空间V上的一个线性算子, 那么U是酉算子当且仅当U的伴随U存在并且UU=UU=I.
证明.U是酉算子, 那么U是可逆的, 并且Uα|β=Uα|UU1β=α|U1β对于任意的α,βV成立, 因而U1U的伴随.
反过来, 设U存在并且UU=UU=I, 那么U是可逆的, 而U1=U. 于是, 剩下来我们要做的事情就只是证明U保持内积. 对于任意的α,βV, 我们有Uα|Uβ=α|UUβ=α|Iβ=α|β
例子26. 考虑带有标准内积的n×1, 令A是域上的一个n×n矩阵, U是由U(X)=AX定义的线性算子, 那么对于每个X,Yn×1UX|UY=AX|AY=YAAX因此, U是酉算子当且仅当AA=I.
定义. 一个n×n的复矩阵被称为酉矩阵, 如果AA=I. [译注: 这里提及了复矩阵, 也就包括了实矩阵的情况, 鉴于实数域是复数域的子域.]
定理13.V是一个有限维内积空间而UV上的一个线性算子, 那么U是酉算子当且仅当U在某个 (或者每个) 有序规范正交基下的表示是酉矩阵.
证明. 在当前阶段, 这不太算是一个定理, 我们陈述该定理主要是为了强调一下. 如果𝔅={α1,,αn}V的一个有序规范正交基, 而AU相对于𝔅的矩阵, 那么AA=I当且仅当UU=I. 现在这个结果可由定理12直接推出.

A是一个n×n的复矩阵, 那么陈述A为酉矩阵即意味着(AA)j,k=δj,k或者r=1nAr,jAr,k=δj,k.换言之, A的列相对于标准内积X|Y=YX构成了一个规范正交集合. 既然AA=I当且仅当AA=I, 我们看到U是酉矩阵恰当A的行在带有标准内积的n中构成了一个规范正交集合. [译注: 在本书中, 作者将1×nn视为完全相同的.] 因此, 使用标准内积, A是酉矩阵当且仅当A的行和列都构成了规范正交集合. 这里读者看到了展现矩阵的单边逆也是双边逆这个定理的威力的一例. 按照以上方式应用该定理于实矩阵, 我们得到了以下结果: 设我们有一个实方阵, 其每一行的元素的平方和为1而不同的行是正交的, 那么每一列的元素的平方和也为1, 并且不同的列是正交的. [译注: 相对于标准内积而言. 当然, 这本质上只是对于实数域上的方阵重复了一下刚才的结果.] 若是读者对于3×3的情形写下证明而不诉诸于任何矩阵的知识, 那么他应该会对于矩阵的单边逆可以推出双边逆印象深刻.

定义. 一个实或复的n×n矩阵A被称为是正交矩阵, 如果AtA=I.

一个实正交矩阵是酉矩阵; 并且, 一个酉矩阵是正交矩阵当且仅当其每个元素都是实数.

译者注记. 读者应该注意一下, 这里的定义与其他材料稍有不同. 一般而言, 当提起酉矩阵的时候, 人们默认这是一个复矩阵; 当提起正交矩阵的时候, 人们默认这是一个实矩阵. 显然, 正交矩阵即酉矩阵被限制为实情形得到的概念. 或者说, 酉矩阵即正交矩阵在复情形上的推广. 当然, 只要读者稍加注意, 就不会有什么问题.
例子27. 我们给出一些酉矩阵和正交矩阵的例子.
  1. 1×1的矩阵[c]是正交矩阵当且仅当c=±1, 是酉矩阵当且仅当cc=1. 后一个条件即|c|=1, 或者c=eiθ, 其中θ是实数.
  2. A=[abcd]那么A是正交矩阵当且仅当At=A1=1adbc[dbca].显然, 任何正交矩阵的行列式都是±1. 因此, A是正交矩阵当且仅当A=[abba]或者A=[abba]其中a2+b2=1. 这两种情形由det(A)的值区分.
  3. 三角函数之间的关系表明Aθ=[cosθsinθsinθcosθ]是正交矩阵. 如果θ是一个实数, 那么Aθ即平面上逆时针旋转θ的线性变换Uθ2的标准有序基下的矩阵. 此时, 鉴于Aθ是一个实正交矩阵, 因而Aθ是一个酉矩阵, 那么Uθ是一个酉算子, 即保持点积.
  4. A=[abcd]那么A是酉矩阵当且仅当[acbd]=1adbc[dbca].酉矩阵的行列式具有绝对值1, 因而是一个具有eiθ形式的复数, 其中θ是实数. 于是, A是酉矩阵当且仅当A=[abeiθbeiθa]=[100eiθ][abba]其中θ是一个实数而ab是满足|a|2+|b|2=1的复数.

正如我们之前所注意到的, 一个内积空间上的酉算子构成了一个群. 根据这个观察以及定理13, 我们可以推出由所有n×n的酉矩阵构成的集合U(n)也是一个群. 因此, 酉矩阵的逆和两个酉矩阵之积都是酉矩阵. 当然, 直接看出来也是很简单的. 一个n×n的复矩阵A是酉矩阵当且仅当A1=A. 因此, 如果A是酉矩阵, 我们有(A1)1=A=(A)1=(A1). 如果ABn×n的酉矩阵, 那么(AB)1=B1A1=BA=(AB). [译注: 似乎直接按照酉矩阵的定义进行证明反而更简单.]

n中的Gram-Schmidt过程对于牵涉群U(n)的矩阵具有一个有趣的推论.

定理14. 对于每个n×n的可逆复矩阵B, 存在唯一的主对角线元素皆为正数的下三角矩阵M使得MB是酉矩阵.
证明. B的行β1,,βn构成了n的一个基. 应用Gram-Schmidt过程于β1,,βn, 我们得到了n的一个正交基α1,,αn, 其中αk=βkj=1k1βk|αjαj2αj.因此, 对于每个k, 存在唯一的标量Ck,j使得αk=βkj=1k1Ck,jβj.U是以α1α1,,αnαn为行的酉矩阵, 而M是由Mk,j={Ck,jαk, 如果j<k1αk, 如果j=k0, 如果j>k定义的矩阵. 那么, M是下三角矩阵 (意即主对角线的上面的元素均为0), M的主对角线上的元素均大于0, 并且αkαk=j=1nMk,jβj,1kn.此即是说U=MB.为了证明M的唯一性, 令T+(n)代表所有主对角线元素均为正数的下三角矩阵构成的集合. 设M1,M2T+(n)满足M1B,M2BU(n), 那么因为U(n)是一个群, 我们有(M1B)(M2B)1=M1M21U(n).另一方面, 虽然并不全然明显, 但是T+(n)在矩阵乘法下也是一个群. 一种看出这点的方法是考虑列矩阵的空间上的线性变换MMX,MT+(n)的几何性质. 因此, M21,M1M21,(M1M21)1T+(n). 但是, 既然M1M21U(n), 我们知道(M1M21)1=(M1M21). 鉴于任何下三角矩阵的转置或者共轭转置都是上三角矩阵, 所以M1M21既是上三角矩阵又是下三角矩阵. 换言之, 就是对角矩阵. 一个对角矩阵是酉矩阵当且仅当其每个对角线元素均具有绝对值1; 若是对角线元素都为正数, 那么它们只能全等于1. 因此, M1M21=I, 即M1=M2.
译者注记. 译者也没太明白怎么利用几何性质说明T+(n)是一个群, 但是当然还有其他方式. 例如, 通过和以上证明相同的手法 (其中的酉矩阵就是恒等矩阵), 我们可以证明T+(n)中的矩阵的逆必然也是T+(n)的元素. 另外, T+(n)显然对于乘法封闭, 所以T+(n)是一个群.

GL(n)代表所有n×n的可逆复矩阵构成的集合, 那么GL(n)在矩阵乘法下也是一个群. 这个群被称为一般线性群. 定理14等价于以下结果.

推论. 对于每个BGL(n), 存在唯一的NT+(n)UU(n)使得B=NU.
证明. 根据定理14, 存在唯一的矩阵MT+(n)使得MBU(n). 令U=MBN=M1, 那么NT+(n)B=NU. 另一方面, 若NT+(n)UU(n)满足B=NU, 那么N1BU(n), 其中N1即是由定理14刻画的唯一的矩阵M. 而且, U必然为N1B.
例子28.x1x2是满足x12+x22=1的实数, 并且x10. 令B=[x1x20010001].应用Gram-Schmidt过程于B的行, 我们会得到向量α1=(x1,x2,0)α2=(0,1,0)x2(x1,x2,0)=x1(x2,x1,0)α3=(0,0,1)U是以α1,(α2/x1),α3为行的矩阵, 那么U是酉矩阵, 并且U=[x1x20x2x10001]=[100x2x11x10001][x1x20010001].现在左乘M=[100x2x11x10001]的逆, 我们得到[x1x20010001]=[100x2x10001][x1x20x2x10001].

现在让我们来简要考虑一下内积空间的坐标变换. 设V是一个有限维内积空间, 𝔅={α1,,αn}𝔅={α1,,αn}V的两个规范正交基, 那么存在唯一的(必然可逆的)n×n矩阵P使得[α]𝔅=P1[α]𝔅对于每个αV成立. 如果U是由Uαj=αj定义的唯一的V上的线性算子, 那么PU在有序基𝔅下的矩阵:αk=j=1nPj,kαj.既然𝔅𝔅都是规范正交基, 那么U是一个酉算子而P是一个酉矩阵. 如果TV上的一个线性算子, 那么[T]𝔅=P1[T]𝔅P=P[T]𝔅P.

定义.ABn×n的复矩阵. 我们称B酉等价于A, 如果存在一个n×n的酉矩阵P使得B=P1AP. 我们称B正交等价于A, 如果存在一个n×n的正交矩阵使得B=P1AP.
译者注记. 当然, 以上定义中, 酉等价里的P1AP可以换成PAP, 正交等价里的P1AP可以换成PtAP. 另外, 酉等价也可以被称为酉相似, 正交等价也可以被称为正交相似.

根据这个定义, 我们可以重新表述以上的观察如下: 如果𝔅𝔅V的两个规范正交基, 那么[T]𝔅酉等价于[T]𝔅. 在V是实内积空间的情形下, 这些矩阵是正交等价的, 通过一个实正交矩阵.

练习1. 找出一个不是正交矩阵的酉矩阵, 以及一个不是酉矩阵的正交矩阵.
练习2.Vn×n, 带有通常内积A|B=tr(AB). 对于每个MA, 令TM(A)=MAV上的线性算子. 证明TM是一个酉算子当且仅当M是一个酉矩阵.
练习3.V是被当作向量空间的复数域.
  1. 表明α|β=Re(αβ)定义了一个V上的内积.
  2. 找出一个从V到带有标准内积的2的(内积空间的)同构.
  3. 对于每个γV, 令Mγ(α)=γαV上的线性算子, 证明(Mγ)=Mγ.
  4. 对于什么样的复数γ, Mγ是自伴算子?
  5. 对于什么样的复数γ, Mγ是酉算子?
  6. 对于什么样的复数γ, Mγ是正定算子? [译注: 正定算子的定义见第9.3节.]
  7. det(Mγ)是多少?
  8. 找出Mγ在基{1,i}下的矩阵.
  9. 如果TV上的一个线性算子, 找出存在γ使得T=Mγ的充要条件.
  10. 找出一个V上的酉算子U, 但是不存在γ使得U=Mγ.
练习4.V是带有标准内积的2. 如果UV上的一个酉算子, 证明U在标准有序基下的矩阵是[cosθsinθsinθcosθ]或者[cosθsinθsinθcosθ]其中0θ<2π. 令Uθ是在标准有序基下以[cosθsinθsinθcosθ]为矩阵表示的线性算子, 即Uθ是逆时针旋转θ的变换. 现在读者应该说服自己, V上的每个酉矩阵, 要么是一个旋转, 要么是一个关于ε1轴的反射接着一个旋转. [译注: 对于后一种变换, 另外一种描述方法是关于角度为θ/2的轴的反射.]
  1. UθUϕ是什么?
  2. 表明Uθ=Uθ.
  3. ϕ是一个固定的实数, 𝔅={α1,α2}是由{ε1,ε2}经过逆时针旋转ϕ得到的规范正交基, 即αj=Uϕεj. 如果θ是另一个实数, 那么Uθ在有序基𝔅下的矩阵是什么?
练习5.V是带有标准内积的3. 令W是由α=(1,1,1)β=(1,1,2)张成的平面. 令U是按照以下方式几何地定义的线性算子: U是关于过原点正交于W的直线旋转θ的变换. 实际上存在两种这样的旋转, 选择一个即可. 找出U在标准有序基下的矩阵. (这里给出一种可行的方法. 找到W的一个规范正交基α1α2. 令α3是正交于W且范数为1的向量. 找出U在基{α1,α2,α3}的矩阵. 施行一次基变换.)
练习6.V是有限维的内积空间, WV的一个子空间, 那么V=WW, 即每个αV都可以唯一地被表示为α=β+γ的形式, 其中βWγW. 我们定义线性算子Uα=βγ.
  1. 证明U既是自伴算子又是酉算子.
  2. 如果V是带有标准内积的3W是由(1,0,1)张成的子空间, 找出U在标准有序基下的矩阵.
练习7.V是一个复内积空间而TV上的一个自伴线性算子, 证明
  1. α+iTα=αiTα.
  2. α+iTα=β+iTβ当且仅当α=β.
  3. I+iT是非奇异的.
  4. IiT是非奇异的.
  5. 现在设V是有限维的, 证明U=(IiT)(I+iT)1是一个酉算子. U被称为TCayley变换. 在某种意义上说, 令f(x)=(1ix)/(1+ix), 那么U=f(T).
练习8. 如果θ是一个实数, 证明[cosθsinθsinθcosθ][eiθ00eiθ]是酉等价的.
练习9.V是一个有限维内积空间而TV上的一个正定算子. 令pT(α,β)=Tα|βV上的内积. 令UV上的一个线性算子而U是其相对于|的伴随. 证明U是相对于内积pT的酉算子当且仅当T=UTU.
练习10.V是一个有限维内积空间, 对于每个α,βV, 定义V上的线性算子Tα,β(γ)=γ|βα, 证明以下命题.
  1. Tα,β=Tβ,α.
  2. trace(Tα,β)=α|β.
  3. Tα,βTγ,δ=Tα,β|γδ.
  4. 在何种条件下Tα,β是自伴算子?
练习11.V是域F上的一个n维内积空间, L(V,V)V上的所有线性算子构成的空间, 证明L(V,V)上存在唯一的一个内积使得对于任意的α,βV, Tα,β=α2β2, 其中Tα,β是练习10中那样定义的线性算子. 找到一个带有此内积的L(V,V)和带有内积A|B=tr(AB)的空间Fn×n之间的同构.
练习12.V是一个有限维内积空间. 在练习6中, 我们展示了如何构造一个V上既自伴又酉的算子. 现在证明对于每个V上的自伴酉算子, 都存在一个子空间W使得这个算子可由练习6中所描述的方法构造出来.
练习13.VW是有限维内积空间, U是从VW的同构, 证明
  1. 映射TUTU1是从向量空间L(V,V)到向量空间L(W,W)的同构.
  2. 对于每个TL(V,V), trace(UTU1)=trace(T).
  3. UTα,βU1=TUα,Uβ, 其中Tα,β于练习10中被定义.
  4. (UTU1)=UTU1.
  5. 如果我们装备L(V,V)以内积T1|T2=trace(T1T2), 并以类似的方式定义L(W,W)上的内积, 那么TUTU1是一个内积空间的同构.
练习14. 如果V是一个内积空间, 那么刚体运动是满足对于每个α,βVTαTβ=αβ的映射T:VV, 其中T不必是线性变换. 酉算子是刚体运动的一个例子. 另外一个例子是平移一个固定的向量γ:Tγ(α)=α+γ.
  1. V是带有标准内积的2, 设TV的一个刚体运动, 并且T(0)=0, 证明T是线性的, 而且是一个酉算子.
  2. 使用a的结果证明每个2的刚体运动都是由一个平移接着一个酉算子复合而成的.
  3. 现在证明2的刚体运动要么是一个平移接着一个旋转, 要么是一个平移接着一个反射接着一个旋转.
练习15. 4 (带有标准内积) 上的酉算子不过就是保持二次形式(x,y,z,t)2=x2+y2+z2+t2的线性算子, 即对于每个α4满足Uα2=α2的线性算子U. 在相对论的特定部分中, 寻找保持形式(x,y,z,t)L2=t2x2y2z2的线性算子T是令人感兴趣的. L2并不来源于内积, 而是某种被称为"Lorentz度量"的东西 (我们不会深入讨论这个). 出于这种原因, 4上的线性变换T, 若满足对于每个α4都有TαL2=αL2, 则被称为Lorentz变换.
  1. 说明由U(x,y,z,t)=[t+xy+izyiztx]定义的函数U是从4到由所有2×2的自伴复矩阵构成的实向量空间H的同构.
  2. 说明αL2=det(Uα).
  3. TH上的一个(实)线性算子, 说明L=U1TU4上的线性算子.
  4. M是任意的2×2复矩阵, 说明TM(A)=MAM定义了一个H上的线性算子. (一定要检查TM的确将H映入H.)
  5. 如果M2×2满足|det(M)|=1, 说明LM=U1TMU4上的一个Lorentz变换.
  6. 找到一个这样的Lorentz变换L, 不存在M2×2使得L=LM.

第8.5节 正规算子

本节的主要目标在于解决以下问题. 如果T是有限维内积空间V上的一个线性算子, 在何种条件下V拥有一个由T的特征向量构成的规范正交基? 换言之, 何时存在V的一个规范正交基𝔅使得T𝔅下的表示是一个对角矩阵.

我们先来推导一些T上的必要条件, 之后我们将逐步证明这些条件也是充分的. 设𝔅={α1,,αn}V的一个规范正交基, 并且满足性质Tαj=cjαj,j=1,,n.这不过就是在说T在有序基𝔅下的表示是以c1,,cn为对角线元素的对角矩阵. 伴随算子T在相同的有序基下的表示是该矩阵的共轭转置, 即以c1,,cn为对角线元素的对角矩阵. 如果V是一个实内积空间, 标量c1,,cn都是实数, 因而必然有T=T. 换言之, 对于有限维内积空间V和其上的线性算子T, 若存在一个全由T的特征向量构成的规范正交基, 那么T必然是自伴算子. 如果V是复内积空间, 那么标量c1,,cn不必是实数, T也就不必是自伴的了. 但是, 我们应该注意到T必然满足TT=TT.这是因为, 任意的两个对角矩阵都是交换的, 而TT同时在有序基𝔅下由对角矩阵表示. [译注: 读者可以回忆一下第6.5节的内容, 交换是同时对角化的充要条件.] 有趣的是, 在复情形下, 交换的条件实际上足以推出全由特征向量构成的规范正交基的存在性.

定义.V是一个有限维内积空间而TV上的一个线性算子, 我们称T正规算子, 如果其与它的伴随交换, 即TT=TT.

任意的自伴算子都是正规算子, 任意的酉算子也是正规算子. 正规算子的任意标量倍数都是正规的; 然而, 正规算子之和与积并不一定是正规的. 尽管并非必要, 我们将从考虑自伴算子开始我们对于正规算子的研究.

定理15. 如果V是一个内积空间而TV上的一个自伴算子, 那么T的特征值均为实数, 且不同的特征值所对应的特征向量之间是正交的.
证明.cT的一个特征值, 那么存在α0使得Tα=cα, 于是cα|α=cα|α=Tα|α=α|Tα=α|cα=cα|α鉴于α|α0, 我们必然有c=c. 现在设我们也有β0满足Tβ=dβ, 那么cα|β=Tα|β=α|Tβ=α|dβ=dα|β=dα|β如果cd, 那么α|β=0.

应该指出的是, 定理15并没有断言特征值或者说特征向量一定存在.

定理16. 在有限维内积空间上 (除开仅包含零向量的平凡空间), 每个自伴算子都拥有一个特征向量.
译者注记. 原文给特征向量之前加上了带括号的"non-zero", 这可能是为第6章找补, 因为那里的定义将零向量也视为特征向量. 但是, 自从第7章开始, 本书所提的特征向量的概念, 就不再包含零向量了, 这也与通行的定义保持一致.
证明.V是一个n维内积空间, 其中n>0, 而TV上的一个自伴算子. 挑选V的一个规范正交基𝔅而令A=[T]𝔅, 既然T=T, 我们有A=A. 现在令W是带有标准内积的n×1, 那么U(X)=AX定义了一个W上的自伴算子. 对于特征多项式det(xIA), 我们知道其在域上至少拥有一个根c. 鉴于U是自伴算子, 根据定理15, c是实数. 换言之, 存在c使得AcI是奇异的. 若V是复内积空间, 那么证明算是结束了, 因为TcI是奇异的. 而对于实内积空间V, 我们最好回忆一下第1章关于线性方程组的观察. 也就是说, 如果以AcI为系数矩阵的齐次线性方程组在复数域上有非平凡解, 那么其在实数域上也应该有非平凡解, 即AcI在实数域上当然也是奇异的. 因此, TcI是奇异的, 存在非零的向量αV使得Tα=cα.

关于这个证明, 我们应该作出数条评注.

  1. 在复情形下, 即便A不是Hermite矩阵 (或者说自伴矩阵), 也不影响A具有特征值和特征向量. 但是, 在实情形下, 自伴的条件就显得非常重要了, 因为它可以告诉我们A的特征多项式在域上的根均为实数.
  2. Hermite矩阵的特征多项式的系数一定是实数, 即便矩阵的各个元素可能不都是实数.
  3. 对于A是有限维空间的假设是必要的, 无限维内积空间上的自伴算子可能没有特征值.

例子29.V是单位区间上的连续复值 (或者实值) 函数构成的向量空间, 带有内积f|g=01f(t)g(t)dt."乘上t"的算子(Tf)(t)=tf(t)是自伴的. 让我们设Tf=cf, 那么(tc)f(t)=0,0t1于是, tcf(t)=0. 鉴于f是连续的, f=0, 因而T没有特征值.
定理17.V是一个有限维内积空间, TV上任意的线性算子. 设W是一个T不变子空间, 那么W的正交补在T下不变.
证明.βW, 对于每个αW, 因为WT下不变, 所以TαW, 那么α|Tβ=Tα|β=0.换言之, TβW, 即WT下不变.
定理18.V是一个有限维内积空间, TV上的一个自伴算子, 那么存在一个全由T的特征向量构成的V的规范正交基.
证明. 不妨设dimV>0. 根据定理16, T拥有一个特征向量α. 令α1=α/α, 那么α1也是T的一个特征向量, 并且α1=1. 如果dimV=1, 证明就结束了. 不然的话, 我们对于V的维数施行归纳. 设定理对于维数小于dimV的内积空间成立. 令W是由α1张成的一维子空间. 既然α1T的特征向量, 那么WT下不变. 根据定理17, 正交补WT=T下不变. 现在W在继承自V的内积下成为了一个dimV1维的内积空间. 令UTW上由限制导出的算子, 那么U是自伴的. 根据归纳假设, W拥有一个以U的特征向量构成的规范正交基{α2,,αn}. 当然, U的特征向量自然也是T的特征向量. 因此, 我们可以断言{α1,,αn}即是我们所要的V的基.
推论.A是一个n×n的Hermite矩阵 (自伴矩阵), 那么存在一个酉矩阵P使得P1AP是对角矩阵. (或者说, A酉等价于一个对角矩阵.) 若A是一个实对称矩阵, 那么存在一个实正交矩阵P使得P1AP成为对角矩阵.
证明.V是带有标准内积的n×1, 而T是在标准有序基下由A表示的线性算子. 既然A=A, 我们有T=T. 令𝔅={α1,,αn}是一个全由T的特征向量构成的V的规范正交基, 我们设Tαj=cjαj,j=1,,n. 如果D=[T]𝔅, 那么D是以c1,,cn为对角线元素的对角矩阵. 考虑由Uεj=αj定义的线性算子U, 令PU在标准有序基下的表示. 那么, P是一个酉矩阵, 并且D=P1AP.
对于推论的后半部分, 实际上取V为带有标准内积的n×1然后重复前述论证即可. 在此情形下, P仍然是一个酉矩阵, 只是其元素都是实数, 因而也是一个正交矩阵.

将定理18与本节开头的评注相结合, 我们就得到了以下结果: 如果V是一个有限维内积空间, 而TV上的一个线性算子, 那么V拥有一个全由T的特征向量构成的规范正交基当且仅当T是自伴算子. 等价地, 如果A是一个n×n的实矩阵, 那么存在实正交矩阵P使得PtAP为对角矩阵当且仅当A=At. 对于复对称矩阵我们没有这样的结果. 换言之, 对于复矩阵而言, 条件A=AtA=A有着显著的不同之处.

译者注记. 实矩阵的正交相似对角化的充要条件为对称.

解决了自伴的情况, 我们现在回到对于正规算子的一般性研究上来. 我们将在情形下对于正规算子证明定理18的类似物. 之所以我们要限制于复情形, 一个原因在于实内积空间上的正规算子可能压根就没有任何特征向量. 例如, 2中的旋转, 除开旋转0度和180度这两种特殊情况.

定理19.V是一个有限维内积空间, TV上的一个正规算子. 设非零向量αV, 那么αT在特征值c下所对应的特征向量当且仅当αT在特征值c下所对应的特征向量.
证明.UV上任意的正规算子, 根据UU=UU, 我们可以推出Uα|Uα=α|UUα=α|UUα=Uα|Uα换言之, Uα=Uα. 如果c是任意的标量, 那么(TcI)=TcI. 我们很容易验证TcI的确是一个正规算子, 于是(TcI)α=(TcI)α因而(TcI)α=0当且仅当(TcI)α=0, 证明就结束了.
定义. 一个n×n的复矩阵被称为正规矩阵, 如果AA=AA.

理解正规矩阵或者正规算子究竟具有什么意义并不容易. 然而, 为了建立一点对于这个概念的感觉, 或许读者知道{一个三角矩阵是一个正规矩阵当且仅当其是一个对角矩阵}是有用的.

定理20.V是一个有限维内积空间, TV上的一个线性算子, 𝔅V的一个规范正交基. 设T𝔅下的矩阵A是上三角的, 那么T是一个正规算子当且仅当A是一个对角矩阵.
证明. 既然𝔅是规范正交基, 那么AT𝔅下的矩阵. 若A是对角矩阵, 那么显然AA=AA, 这可以推出TT=TT. 反过来, 设T是正规算子而𝔅={α1,,αn}. 既然A是上三角矩阵, 那么Tα1=A1,1α1. 根据定理19, Tα1=A1,1α1. 另一方面, 我们有Tα1=j=1n(A)j,1αj=j=1nA1,jαj因此, 对于每个j>1, A1,j=0. 特别地, A1,2=0. 鉴于A是上三角矩阵, 可以推出Tα2=A2,2α2因而Tα2=A2,2α2, 于是对于j>2, A2,j=0. 按照这种手段继续下去, 我们最终可以证明A的确是一个对角矩阵.
定理21.V是一个有限维的复内积空间, TV上的一个线性算子, 那么存在规范正交基使得T在其下的矩阵为上三角的.
证明.n=dimV. 当n=1时, 这个定理显然成立. 我们对于n施行归纳, 假设结果对于n1维的复内积空间上的线性算子成立. 既然V是一个有限维复内积空间, 那么对于伴随T而言, 存在标量c和单位向量αV使得Tα=cα.W是由α张成的子空间的正交补, 根据定理17, WT下不变. 设ST由限制于W上导出的算子. 既然Wn1维的, 归纳假设告诉我们存在W的一个规范正交基{α1,,αn1}使得S在其下的矩阵是上三角的. 令αn=α, 那么{α1,,αn}V的一个规范正交基, 并且T在其下的表示是一个上三角矩阵.

这个定理推出了以下的矩阵版本.

推论. 对于每个n×n的复矩阵A, 存在一个酉矩阵U使得U1AU是上三角矩阵.
译者注记. 每个复矩阵都可以酉相似三角化 (Schur定理).

现在将定理20和定理21相结合, 我们就立即得到了定理18对于正规算子而言的类似物.

定理22.V是一个有限维复内积空间, TV上的一个正规算子, 那么存在一个全由T的特征向量构成的V的规范正交基.

当然, 这个定理也有一个矩阵解释.

推论. 对于每个n×n的(复)正规矩阵A, 存在一个酉矩阵P使得PAP是对角矩阵.
译者注记. 对于有限维复内积空间V, 设TV上的一个线性算子, 那么存在V的一个全由T的特征向量构成的规范正交基 (或者说T在某个V的规范正交基下呈现对角矩阵的形式) 当且仅当T是一个正规算子. 另外, 复矩阵酉相似对角化的充要条件为正规.
练习1. 对于以下每个实对称矩阵A, 找出一个实正交矩阵P使得PtAP成为对角矩阵.[1111],[1221],[cosθsinθsinθcosθ]
练习2. 复对称矩阵是自伴的吗? 是正规的吗?
练习3. 对于A=[123234345]存在实正交矩阵P使得PtAP=D是一个对角矩阵. 找出一个这样的对角矩阵D.
练习4.V是带有标准内积的2, TV上在标准有序基下由矩阵A=[1ii1]表示的线性算子. 证明T是正规算子, 并找到V的一个全由T的特征向量构成的规范正交基.
练习5. 给出一个2×2的矩阵A的例子, A2是正规的, 但是A不是正规的.
练习6.T是有限维复内积空间上的一个正规算子, 证明
  1. 如果T的每个特征值都是实数, 那么T是一个自伴算子.
  2. 如果T的每个特征值都是正数, 那么T是一个正定算子.
  3. 如果T的每个特征值的绝对值均为1, 那么T是一个酉算子.
练习7.T是有限维内积空间V上的一个线性算子, 设T既是正定算子又是酉算子, 证明T=I.
练习8. 证明有限维复内积空间上的线性算子T是正规的当且仅当存在交换的自伴算子T1T2使得T=T1+iT2.
练习9. 证明实对称矩阵具有实对称立方根, 即若A为实对称矩阵, 则存在实对称的B满足B3=A.
练习10. 证明每个正定矩阵都是某个正定矩阵的平方.
练习11.T是有限维复内积空间上的一个线性算子, 若T既是正规算子也是幂零算子, 那么T=0.
练习12. 如果T是有限维内积空间上的一个正规算子, 证明T的不同特征值所对应的特征向量之间是正交的.
练习13.T是有限维复内积空间上的一个正规算子, 证明存在复数域上的多项式f使得T=f(T). (表示T以对角矩阵, 看看f必须是什么.)
练习14. 如果有限维复内积空间上的两个正规算子交换, 证明它们的积也是正规算子.
译者注记. 以上诸多练习缺少条件, 经过译者考察, 绝大部分都应该是有限维复内积空间. 实际上, 读者也可以看到, 虽然正文中的正规算子也可以定义在实内积空间上, 但是理论构建的主要结果中只考虑复内积空间上的正规算子.

第9章 内积空间上的算子

第9.1节 引论

我们将第8章所处理的大部分议题视为基础的, 即每个人都应该知道的材料. 本章是面向更加优秀的学生以及那些迫不及待想要扩展自己关于内积空间上的算子的知识的读者的. 这里呈现的材料更加复杂, 一般牵涉更多的技术, 除了主轴定理, 其基本上就是重述定理18关于自伴算子的酉/正交对角化的结果, 以及第9.2节中关于形式的其他结果. 我们要求读者更加成熟, 就像第5章和第7章的后半部分那样. 论证和证明以更加凝缩的风格编写, 并且几乎没有多少用以润滑的例子. 然而, 我们已经预见到了这种困难, 所以为读者提供了大量的练习.

起初的三节致力于关于内积空间上的形式以及形式与线性算子之间的关系的结果. 接下来的一节处理谱论, 即第8章牵涉自伴算子和正规算子的对角化的定理18和22的推论. 最后一节里, 我们研究实内积空间上的正规算子, 由此我们检视了第6章的准素分解定理之于正规算子的意蕴.

第9.2节 内积空间上的形式

如果T是域F上的有限维内积空间V上的一个线性算子, 那么由f(α,β)=Tα|β定义的函数f:V×VF可以被视为T的一种替代物. 诸多关于T的问题都等价于关于f的问题. 实际上, 很容易看出来f可以确定T. 这是因为, 如果𝔅={α1,,αn}V的一个规范正交基, 那么T𝔅下的矩阵AAj,k=f(αk,αj)给出. 从更加抽象的角度理解为什么f可以确定T是重要的. f的重要性质在以下定义中得以描述.

定义. 一个域F (F是实数域或复数域) 上的向量空间V上的(半双线性)形式是一个函数f:V×VF满足对于任意的α,β,γV和任意的标量c
  1. f(cα+β,γ)=cf(α,γ)+f(β,γ);
  2. f(α,cβ+γ)=cf(α,β)+f(α,γ).

因此, 半双线性形式f使得f(α,β)在固定的β下是α的线性函数, 而在固定的α下是β的共轭线性函数. 在实情形下, f(α,β)对于每个参数都是线性的. 换言之, f是一个双线性形式. 在复情形下, 除非f=0, 否则半双线性形式f不会是双线性形式. 在本章的剩余部分里, 除非确有必要, 否则形容词"半双线性"一律省略.

如果fgV上的形式而c是任意的标量, 那么很容易验证cf+g也是一个形式. 换言之, 任意的形式的线性组合仍然是一个形式. 因此, V上的所有形式构成的集合是向量空间FV×V的一个子空间, 其中F是向量空间V的标量域.

定理1.V是一个有限维内积空间, fV上的一个形式, 那么存在唯一的V上的线性算子T满足对于任意的α,βV都有f(α,β)=Tα|β.并且, 由此定义的映射fT是从形式的空间到L(V,V)的一个同构.
证明. 固定一个向量βV, 那么αf(α,β)V上的一个线性泛函. 根据第8章的定理6, 存在唯一的向量βV使得对于每个α, 我们有f(α,β)=α|β. 定义函数U:VV,ββ, 那么f(α,cβ+γ)=α|U(cβ+γ)=cf(α,β)+f(α,γ)=cα|Uβ+α|Uγ=α|cUβ+Uγ对于任意的α,β,γV和任意的标量c成立. 因此, UV上的一个线性算子. 令T=U, 则有对于所有的α,βV, f(α,β)=Tα|β. 如果我们也有线性算子T使得f(α,β)=Tα|β, 那么TαTα|β=0.于是, 对于每个αV, Tα=Tα. 换言之, 对于每个形式f, 存在唯一的线性算子Tf使得对于每个α,βV, 我们有f(α,β)=Tfα|β.如果fg是形式而c是标量, 那么(cf+g)(α,β)=Tcf+gα|β=cf(α,β)+g(α,β)=cTfα|β+Tgα|β=(cTf+Tg)α|β对于任意的α,βV成立, 因而Tcf+g=cTf+Tg.换言之, fTf是一个线性映射. 对于每个fL(V,V), 等式f(α,β)=Tα|β定义了一个形式f使得Tf=T. 并且, 如果Tf=0, 那么f=0. 因此, fTf的确是一个同构.
推论. 等式f|g=tr(TfTg)定义了形式的空间上的一个内积, 并且对于每个V的规范正交基{α1,,αn}, 我们有f|g=j=1nk=1nf(αk,αj)g(αk,αj).
证明. 根据第8章的例子3, 很容易推出(T,U)tr(TU)L(V,V)上的一个内积. 既然fTf是一个同构, 第8章的例子6表明f|g=tr(TfTg)也是一个内积. [译注: 实际上, 前一个内积也是通过第8章的例子6得到的.] 现在设AB分别是TfTg在规范正交基𝔅={α1,,αn}下的矩阵, 那么Aj,k=Tfαk|αj=f(αk,αj)Bj,k=Tgαk|αj=g(αk,αj).这可以推出f|g=tr(TfTg)=tr(AB)=j=1nk=1nAj,kBj,k=j=1nk=1nf(αk,αj)g(αk,αj)
定义. 如果fV上的一个形式而𝔅={α1,,αn}V的一个有序基, 那么由Aj,k=f(αk,αj)定义的矩阵A被称为f在有序基𝔅下的矩阵.

𝔅是一个规范正交基时, f𝔅下的矩阵也是线性变换Tf𝔅下的矩阵, 但是在一般情况下并非如此.

如果Af在有序基𝔅={α1,,αn}下的矩阵, 那么f(s=1nxsαs,r=1nyrαr)=r=1ns=1nyrAr,sxs对于任意的标量xsyr成立. 换言之, 矩阵A具有f(α,β)=YAX的性质, 其中XY分别是αβ在有序基𝔅下的坐标矩阵.

f在另外一个基αj=i=1nPi,jαi,1jn下的矩阵由式子A=PAP给出, 这是因为Aj,k=f(αk,αj)=f(s=1nPs,kαs,r=1nPr,jαr)=r=1ns=1nPr,jAr,sPs,k=(PAP)j,k既然对于酉矩阵而言, 我们有P=P1, 因而与酉等价相关的结果也可应用于对形式的研究.

定理2.f是有限维复内积空间V上的一个形式, 那么存在V的一个规范正交基使得其下的f的矩阵是上三角的.
证明.TV上的线性算子, 其满足对于任意的α,βVf(α,β)=Tα|β. 根据第8章的定理21, 存在V的一个规范正交基𝔅={α1,,αn}使得T在其下的矩阵是上三角的. 根据之前的观察, 我们知道此时f的矩阵和T的矩阵是相同的. 换言之, f在规范正交基𝔅下的矩阵是上三角的.
定义. 实或复向量空间V上的形式f被称为Hermite的, 如果对于每个α,βVf(α,β)=f(β,α).

如果T是有限维内积空间V上的线性算子, 而f是由f(α,β)=Tα|β定义的形式, 那么f(β,α)=α|Tβ=Tα|β换言之, f是Hermite的当且仅当T是自伴的.

译者注记. 上述观察, 即便没有有限维的条件, 也同样成立.

f是一个Hermite形式, 那么对于每个向量α, f(α,α)是实数. 在复向量空间上, 这个性质就刻画了Hermite形式.

定理3.V是一个复向量空间而fV上的一个形式, 如果对于每个向量αVf(α,α)为实数, 那么f是一个Hermite形式.
证明.αβV中的向量, 我们必须证明f(α,β)=f(β,α). 现在我们有f(α+β,α+β)=f(α,α)+f(α,β)+f(β,α)+f(β,β).既然f(α+β,α+β), f(α,α), f(β,β)都是实数, f(α,β)+f(β,α)也应该是实数. 对于α+iβ施行相同的论证, 我们又可以得到if(α,β)+if(β,α)是实数. 我们知道实数的共轭等于其本身, 于是f(α,β)+f(β,α)=f(α,β)+f(β,α)if(α,β)+if(β,α)=if(α,β)if(β,α)给第二个等式乘上i, 然后再加上第一个等式, 我们就得到2f(α,β)=2f(β,α)f(α,β)=f(β,α).
推论.T是有限维复内积空间V上的一个线性算子, 那么T是自伴算子当且仅当对于每个αV, Tα|α是实数.
译者注记. 实际上, 即便没有有限维的条件, 以上推论仍然成立.
定理4. 主轴定理. 对于有限维内积空间V上的每个Hermite形式f, 存在V的一个规范正交基使得f在其下由一个实对角矩阵表示.
证明. 根据定理1, 存在唯一的线性算子T使得f(α,β)=Tα|β. 根据之前的观察, 既然f是Hermite形式, 那么T是自伴算子. 根据第8章的定理18, 我们知道存在V的一个规范正交基𝔅使得T由对角矩阵表示. 当然, 根据第8章的定理15, 这个对角矩阵的元素均为实数. 我们知道, f在规范正交基𝔅下的矩阵即T𝔅下的表示, 所以f𝔅下也由实对角矩阵表示.
推论. 对于有限维内积空间V上的Hermite形式f, 存在一个规范正交基𝔅使得对于每个α,βV, 若(x1,,xn)(y1,,yn)分别是αβ𝔅下的坐标, 那么f(α,β)=j=1ncjxjyj其中c1,,cn是固定的实数.
练习1. 请问下列函数f:2×2中哪些是2上的(半双线性)形式, 其中我们设α=(x1,x2), β=(y1,y2)?
  1. f(α,β)=1.
  2. f(α,β)=(x1y1)2+x2y2.
  3. f(α,β)=(x1+y1)2(x1y1)2.
  4. f(α,β)=x1y2x2y1.
练习2.f((x1,x2),(y1,y2))=x1y1+x2y22上的形式, 找出f在以下的每个基下的矩阵:{(1,0),(0,1)},{(1,1),(1,1)},{(1,2),(3,4)}.
练习3.A=[1ii2]g(X,Y)=YAX2×1上的形式, 那么g是一个内积吗?
练习4.V是一个复向量空间而fV上的一个对称的(半双线性)形式, 即f(α,β)=f(β,α), 那么f是什么呢?
练习5.f((x1,x2),(y1,y2))=x1y1+4x2y2+2x1y2+2x2y12上的形式, 找到一个有序基使得f由一个对角矩阵表示.
练习6. 称形式f为(左)非退化的, 如果对于每个向量βf(α,β)=0可以推出α=0. 令f是有限维内积空间V上的一个形式, 证明f是非退化的当且仅当其对应的线性算子Tf (定理1) 是非奇异的.
练习7.f是有限维向量空间V上的一个形式. 参考练习6给出的左非退化的概念, 定义右非退化, 并证明f是左非退化的当且仅当f是右非退化的.
练习8.f是有限维向量空间V上的一个非退化形式 (练习6和7), LV上的一个线性泛函, 证明存在唯一的βV使得对于每个αVL(α)=f(α,β).
练习9.f是有限维向量空间V上的一个非退化形式, 证明每个线性算子S都有一个"相对于f的伴随", 即一个线性算子S满足对于每个α,βVf(Sα,β)=f(α,Sβ).

第9.3节 正定形式

本节我们将讨论非负(半双线性)形式以及其与向量空间上的给定内积之间的关系.

定义. 给定实或复向量空间V, 其上的形式f被称为非负的, 如果f是Hermite的并且对于每个αVf(α,α)0; 其上的形式f被称为正定的, 如果f是Hermite的并且对于每个非零向量αVf(α,α)>0.
译者注记. "非负"这个术语现在一般被"半正定"所代替.

V上的正定形式实际上就是V上的内积. 非负形式几乎就是内积了, 除了某些非零向量可能"正交"于自身.

f是有限维向量空间V上的一个形式, 𝔅={α1,,αn}V的一个有序基, Af在基𝔅下的矩阵, 即Aj,k=f(αk,αj). 如果α=x1α1++xnαn, 那么f(α,α)=f(j=1nxjαj,k=1nxkαk)=j=1nk=1nxjxkf(αj,αk)=j=1nk=1nxkAk,jxj于是, 我们看出来f是非负形式当且仅当A=A[译注: 这是f为Hermite形式的充要条件] 且j=1nk=1nxkAk,jxj0对于任意的标量x1,,xn成立.为了使得f成为正定形式, 以上的不等式必须对于每个(x1,,xn)0严格成立. 刚才我们推导出的条件说明fV上的一个正定形式当且仅当函数g(X,Y)=YAX是列矩阵空间Fn×1上的正定形式, 其中F是向量空间V的标量域.

定理5.F是实数域或者复数域, A是域F上的一个n×n矩阵, 那么由g(X,Y)=YAX定义的函数gFn×1上的正定形式当且仅当存在一个可逆矩阵PFn×n满足A=PP.
证明. 对于任意的n×n矩阵A, 函数g都是列矩阵空间上的(半双线性)形式. 我们想要证明的是, g为正定的当且仅当A=PP. 首先, 设A=PP, 那么g是Hermite的, 并且g(X,X)=XPPX=(PX)PX0P是可逆的, 那么X0PX0, 于是(PX)PX>0.
现在, 设g是列矩阵空间上的正定形式, 那么g就是一个内积, 因而存在列矩阵Q1,,Qn使得δj,k=g(Qj,Qk)=QkAQj但是, 这不过就是在说, 如果Q是以Q1,,Qn为列的矩阵, 那么QAQ=I. 既然{Q1,,Qn}相对于内积g是一个规范正交基, 所以Q是可逆的. 令P=Q1, 我们就得到A=PP.

在实践中, 验证一个给定的矩阵A满足我们到目前为止给出的正定判则并非易事. 定理5的一个推论是, 若g为正定形式, 那么det(A)>0, 因为det(A)=det(PP)=(detP)(detP)=|det(P)|2.然而, det(A)>0并不足以保证g是正定形式. 不过, 存在与A相关联的n个行列式具有此性质: 如果A=A且这些行列式均为正数, 那么g是一个正定形式.

定义.A是域F上的一个n×n矩阵, 那么A顺序主子式 (principal minor)是由Δk(A)=det[A1,1A1,kAk,1Ak,k],1kn定义的n个标量Δ1(A),,Δn(A).
引理.A是域F上的一个n×n的可逆矩阵, 那么以下陈述是等价的.
  1. 存在一个主对角线元素全为1的上三角矩阵P使得B=AP是下三角矩阵.
  2. A的顺序主子式均异于0.
证明.P是任意的n×n矩阵, 置B=AP, 那么Bj,k=r=1nAj,rPr,k.如果P是一个主对角线均为1的上三角矩阵, 那么r=1k1Aj,rPr,k=Bj,kAj,k.既然B为下三角矩阵等价于j<k时有Bj,k=0, 因而B为下三角矩阵当且仅当r=1k1Aj,rPr,k=Aj,k,j<k.我们可以将以上式子看成是关于Pr,k的线性方程组, 那么陈述a就等价于该方程组有解.
实际上, 我们最好将这个大的线性方程组按照k拆分. 对于每个k=2,,n, 我们有一个关于未知元P1,k,,Pk1,k的具k1个方程的线性方程组, 其系数矩阵为[A1,1A1,k1Ak1,1Ak1,k1]这个矩阵的行列式即顺序主子式Δk1(A). 若陈述b成立, 那么这些线性方程组都有唯一解. 也就是说, 大的线性方程组也有唯一解. 于是, 陈述a成立, 并且矩阵P实际上是唯一的. 因此, 陈述b可以推出陈述a.
现在设a成立, 那么Δk(B)=Δk(AP)=Δk(A)Δk(P)=Δk(A)=B1,1Bk,k其中Δk(AP)=Δk(A)Δk(P)利用了P是上三角矩阵的事实. 既然AP均可逆, 那么B也可逆. 鉴于下三角矩阵B可逆等价于Bk,k0,k=1,,n, 于是Δk(A)0,k=1,,n.
定理6.f是有限维向量空间V上的一个形式, AfV的某个有序基𝔅下的矩阵, 那么f是正定形式当且仅当A=A并且A的顺序主子式均为正数.
证明. 让我们先来证明这个定理有趣的一半. 设A=A, 并且Δk(A)>0,1kn. 根据引理, 存在(唯一的)主对角线均为1的上三角矩阵P使得B=AP是下三角矩阵. 矩阵P当然是一个下三角矩阵, 于是PB=PAP也是下三角的. 既然A是自伴的, 那么D=PAP也是自伴的. 显然, 自伴的下三角矩阵必然是一个对角矩阵. 按照前面引理的证明里的类似手法, 我们可以推出Δk(D)=Δk(PB)=Δk(P)Δk(B)=Δk(B)=Δk(A)鉴于D是一个对角矩阵, 其顺序主子式为Δk(D)=D1,1Dk,k.因为A的顺序主子式均为正数, 所以D的顺序主子式也均为正数, 那么我们可以推出Dk,k>0,1kn.如果A是形式f在有序基𝔅={α1,,αn}下的矩阵, 那么D=PAP是形式f在有序基{α1,,αn}下的矩阵, 其中αj=i=1nPi,jαi.既然D是主对角线元素均为正数的对角矩阵, 那么显然有XDX>0,X0.这就说明f是一个正定形式.
现在反过来设f是正定形式. 我们知道A=A, 但是该怎么说明Δk(A)>0,1kn呢? 令Vk是由α1,,αk张成的子空间, 而fkfVk×Vk上的限制, 那么显然fkVk上的正定形式, 且fk在有序基{α1,,αk}下的表示为Ak=[A1,1A1,kAk,1Ak,k].作为定理5的推论, 我们注意到每个正定形式fk的矩阵表示Ak的行列式都应该是正数, 即A的每个顺序主子式Δk(A)均为正数.

这里有一些我们应该作出的评注, 以完成我们对于正定形式和正定矩阵之间的关系的讨论. 什么刻画了表示正定形式的矩阵? 如果f是有限维复向量空间上的一个形式, Af在某个有序基下的矩阵, 那么f是正定的当且仅当A=AXAX>0,X0.根据定理3, A=A的条件是多余的, 因为XAX>0,X0可以推出A=A. 另一方面, 如果f是有限维实向量空间上的形式而Af在某个有序基下的矩阵, 那么f是正定的当且仅当A=AtXtAX>0,X0.我们想要强调的是, 实情形下XtAX>0,X0无法推出A=At. 然而, 值得注意的是, 如果实矩阵A满足A=AtXtAX>0,X0, 那么即便对于每个复的列矩阵X, 我们也有XAX>0,X0.这是因为, 若X=Y+iZ, 其中Y,Zn×1, 那么(Y+iZ)A(Y+iZ)=(YtiZt)A(Y+iZ)=YtAY+ZtAZ+i(YtAZZtAY)而在A=At的情况下, 有YtAZ=ZtAY.

如果A是一个n×n的复矩阵并且满足XAX>0,X0那么我们就称A是一个正定矩阵. 我们已经知道, 有限维复向量空间上的形式是正定的当且仅当其在某个有序基下的矩阵是正定矩阵. (这里的"某个"也可以被替换为"每个".) 但是, 刚才的评注告诉我们, 即便是在实情形下, 我们还是可以断言形式正定的充要条件为其在某个有序基下的矩阵正定. 当然, 我们这里将实矩阵也视为复矩阵. 不过, 读者需要注意的是, 即便是实矩阵, 其正定的条件亦是相对于每个非零的复列矩阵而言的.

现在设V是一个有限维内积空间而fV上的一个非负形式, 那么存在唯一的V上的一个自伴算子T满足f(α,β)=Tα|β并且T还具有Tα|α0的额外性质.

定义.V是一个有限维内积空间. V上的一个线性算子T非负的, 如果T=T且对于每个αVTα|α0. V上的一个线性算子T正定的, 如果T=T且对于每个α0Tα|α>0.

如果V是一个有限维的(实或复)向量空间而|V上的一个内积, 那么V上有个与之相关联的正定算子类. 通过定理1所描述的映射, V上所有正定形式构成的集合与所有正定算子构成的集合之间存在一个双射. 我们将以本节的练习来强调正定算子, 正定形式, 正定矩阵之间的关系. 以下的总结或许是有用的.

如果A是一个复数域上的n×n矩阵, 那么以下陈述是等价的.

  1. A是正定矩阵, 即对于不全为零的复数x1,,xn, 我们有j=1nk=1nxkAk,jxj>0.
  2. X|Y=YAXn×1的复矩阵空间上的一个内积.
  3. 相对于n×1的复矩阵空间上的标准内积X|Y=YX, 线性算子XAX是正定的.
  4. 存在某个可逆的Pn×n满足A=PP.
  5. A=AA的顺序主子式均为正数.
A的每个元素均为实数, 那么以上这些又等价于
  1. A=At且对于不全为零的实数x1,,xn, 我们有j=1nk=1nxkAk,jxj>0.
  2. X|Y=YtAXn×1的实矩阵空间上的一个内积.
  3. 相对于n×1的实矩阵空间上的标准内积X|Y=YtX, 线性算子XAX是正定的.
  4. 存在某个可逆的Pn×n满足A=PtP.

练习1.V是带有标准内积的2, 对于什么样的向量αV, 存在一个正定算子T使得α=Tε1呢?
练习2.V是带有标准内积的2, 如果θ是一个实数, 令Tθ是逆时针旋转θ的线性算子, 即Tθ(x1,x2)=(x1cosθx2sinθ,x1sinθ+x2cosθ)θ为何值时Tθ是正定算子呢?
练习3.Vn×1, 而其上的内积为X|Y=YGX, 这里的Gn×n要使得该公式的确定义了一个内积. 令A是一个n×n的矩阵而线性算子T(X)=AX. 找出T. 如果YV的一个固定元素, 找出确定了线性泛函XYX的元素ZV. 换言之, 对于每个XVYX=X|Z.
练习4.V是一个有限维内积空间. 如果TUV上的正定算子, 证明(T+U)也是正定算子. 给出一个例子表明TU不必是正定的.
练习5.A=[1121213].
  1. 证明A是正定的.
  2. V2×1, 而其上的内积为X|Y=YtAX. 现在定义X1=[10],X2=[01]请应用Gram-Schmidt过程以找出V的一个规范正交基.
  3. 找出一个2×2的可逆实矩阵P使得A=PtP.
练习6. 以下哪些矩阵是正定的?[1234],[11+i1i3],[111211311],[11213121314131415]
练习7. 给出一个n×n矩阵的例子, 其所有顺序主子式均为正数, 但是并非正定矩阵.
练习8. (x1,x2)|(y1,y2)=x1y1+2x2y1+2x1y2+x2y2定义了2上的一个内积吗?
练习9. 证明正定矩阵的每个主对角线元素均为正数.
练习10.V是一个有限维内积空间. 如果TUV上的线性算子, 当UT为正定算子时我们记T<U. 证明以下断言:
  1. T<UU<T不能同时成立.
  2. 如果T<UU<S, 那么T<S.
  3. 如果T<U0<S, ST<SU不必成立.
练习11.V是一个有限维内积空间而EV在其某个子空间上的正交投影.
  1. 证明对于任意的正数c, 算子cI+E是正定的.
  2. E表达满足T2=I+E自伴线性算子T.
练习12.n是一个正整数而A=[112131n1213141n+11n1n+11n+212n1].证明A是正定的.
练习13.A是一个自伴的n×n矩阵, 证明存在正数c使得矩阵cI+A是正定的.
练习14. 证明两个正定线性算子之积是正定的当且仅当它们交换.
练习15.ST是正定算子, 证明ST的每个特征值都是正数.

第9.4节 更多关于形式的结果

本节包含两个结果, 其给出了关于(半双线性)形式的更加详细的信息.

定理7.V是一个实或复向量空间, WV的一个有限维子空间并且{α1,,αr}是其一个有序基. 令fV上的一个形式而M是由Mj,k=f(αk,αj)定义的r×r矩阵. 如果W={βV|对于任意的αWf(α,β)=0}那么WV的一个子空间, 并且WW={0}当且仅当M可逆. 当的确如此时, V=WW.
证明. 如果β,γWc是一个标量, 那么对于每个αW, 我们可以推出f(α,cβ+γ)=cf(α,β)+f(α,γ)=0.因此, W的确是V的一个子空间.
现在设α=k=1rxkαkβ=j=1ryjαj那么f(α,β)=k=1rj=1ryjMj,kxk=k=1r(j=1ryjMj,k)xk由此可知βW当且仅当方程组j=1ryjMj,k=0,1kr成立, 因而WW{0}当且仅当齐次线性方程组j=1rMj,kyj=0,1kr具有非平凡解. 换言之, WW={0}等价于M可逆, 但M可逆当且仅当M可逆.
M可逆并令A=(M)1=(M1)我们定义V上的函数gjgj(β)=k=1rAj,kf(αk,β)那么gj(cβ+γ)=k=1rAj,kf(αk,cβ+γ)=ck=1rAj,kf(αk,β)+k=1rAj,kf(αk,γ)=cgj(β)+gj(γ)也就是说, 每个gj的确都是V上的线性泛函. 因此, 我们可以定义V上的一个线性算子EEβ=j=1rgj(β)αj既然gj(αn)=k=1rAj,kf(αk,αn)=k=1rAj,kMk,n=(AM)j,n=δj,n我们可以推出E(αn)=αn,1nr换言之, 对于每个αW, Eα=α. 现在我们知道E的像是W并且E2=E, 即E是从VW上的投影. 若βV中任意的一个向量, 那么f(αn,Eβ)=f(αn,j=1rgj(β)αj)=j=1rgj(β)f(αn,αj)=j=1r(k=1rAj,kf(αk,β))f(αn,αj)既然A=M1, 我们可以推出f(αn,Eβ)=k=1r(j=1rAk,jf(αn,αj))f(αk,β)=k=1r(j=1rMk,j1Mj,n)f(αk,β)=k=1rδk,nf(αk,β)=f(αn,β)换言之, 对于每个αW, 我们有f(α,β)=f(α,Eβ), 于是f(α,βEβ)=0对于所有αWβV成立. 那么, (IE)βW, 根据等式β=Eβ+(IE)β我们可以断言V=W+W. 当然, 依照前面的论证, 这个和是一个直和, 即V=WW. 证明的最后, 还有一点值得提及的是, IE实际上是从VW的投影. 若βW, 那么Eβ=0, 因此(IE)β=β, 即WIE的像. 另外, 根据第6章的推理, IE的确是一个幂等线性算子.

证明中构造的投影E可由以下性质刻画: Eβ=α当且仅当αWβαW. 因此, E独立于其构造过程中用到的W的基. 因此, 我们可以称E是由直和分解V=WW确定的从VW上的投影. 注意到E是一个正交投影当且仅当W=W.

译者注记. 对于以上这段话, 读者应该回忆一下第6章和投影相关的内容. 另外, 译者觉得这最后一句话有点问题, 因为这个定理的条件并没有说V是一个内积空间, 所以这个空间里还没有正交的概念. 但是, 在一般的内积空间中, 这个论断的确是正确的, 并且W无需是有限维的.
定理8.V是一个有限维的实或复向量空间, fV上的一个形式而AfV的某个有序基{α1,,αn}下的矩阵. 如果A的顺序主子式均异于零, 那么存在唯一的主对角线元素全为1的上三角矩阵P使得PAP是一个上三角矩阵.
证明. 既然Δk(A)=Δk(A), A的顺序主子式也都异于零. 因此, 根据定理6的引理, 存在一个主对角线元素全为1的上三角矩阵P满足AP是一个下三角矩阵. 于是, PA=(AP)是一个上三角矩阵. 既然两个上三角矩阵之积仍然是上三角矩阵, PAP是一个上三角矩阵. 这表明了P的存在性, 但没有说明P的唯一性. 然而, 其实有一个更加几何的论证方法可以同时说明P的存在性和唯一性.
Wk是由α1,,αk张成的子空间, 而Wk={βV|对于任意的αWkf(α,β)=0}既然Δk(A)0, 那么由Mi,j=f(αj,αi)=Ai,j定义的k×k矩阵M是可逆的. 根据定理7, 我们有V=WkWk.Ek是由这个直和分解决定的从VWk上的投影, 并置E0=0, 设βk=αkEk1αk,1kn那么β1=α1, 而k>1时有Ek1αkWk1. 于是, 对于k>1, 存在唯一的标量Pj,k使得Ek1αk=j=1k1Pj,kαj.再置Pk,k=1以及j>kPj,k=0, 我们就得到了一个n×n的上三角矩阵P, 其主对角线元素均为1, 并且对于k=1,,n, 我们有βk=j=1kPj,kαj.1ii<k, 那么βiWiWiWk1. 既然βkWk1, 可以推出f(βi,βk)=0.Bf在有序基{β1,,βn}下的矩阵表示, 那么Bk,i=f(βi,βk).于是, k>iBk,i=0, 因而B是一个上三角矩阵. 另一方面, 根据关于形式的基变换的讨论, 我们有B=PAP.反过来, 设P是一个满足我们要求的矩阵, 即P是一个主对角线元素均为1的上三角矩阵使得PAP也是上三角的, 置βk=j=1nPj,kαj=j=1kPj,kαj,1kn那么{β1,,βk}显然是Wk的一个基. 对于k>1, {β1,,βk1}Wk1的一个基, 而且当i<k时有f(βi,βk)=0 [译注: 这是因为f(βi,βk)=(PAP)k,iPAP是一个上三角矩阵], 由此我们可以看出βkWk1. 定义βk的公式告诉我们αk=(j=1k1Pj,kαj)+βk.既然(j=1k1Pj,kαj)Wk1βkWk1又鉴于V=Wk1Wk1Ek1αk=(j=1k1Pj,kαj)这实际上就完全确定了P1,k,,Pk1,k的可能性, 进而完全确定了矩阵P. 当然, 我们可以很容易看出这个P正是我们之前说明存在性时所构造出来的矩阵.

第9.5节 谱论

本节我们探求牵涉自伴算子和正规算子的对角化的第8章的定理18和22的推论.

定理9. 谱定理.T是有限维复内积空间V上的一个正规算子, 或者是有限维实内积空间V上的一个自伴算子, 设c1,,ckT的不同的特征值, 令Wj是特征值cj所对应的特征空间, EjVWj上的正交投影, 那么不同的WiWj相互正交, VW1,,Wk的直和, 并且T=c1E1++ckEk.
证明.αWj, βWi, 并设ij, 那么cjα|β=Tα|β=α|Tβ=α|ciβ=ciα|β鉴于cicj, 可以推出α|β=0, 即不同的WiWj是相互正交的.
根据V拥有全由T的特征向量构成的规范正交基这一事实 (见第8章的定理18和22), 立即可以得到V=W1Wk.因此, E1++Ek=I并且T=TI=T(E1++Ek)=TE1++TEk=c1E1++ckEk
译者注记. 以上证明中使用了第8章的定理19. 另外, 这个证明对于E1++Ek=I没有任何解释, 其实并非那么平凡. 实际上, 如果α=α1++αk,αiWi当然这种分解是唯一的, 那么我们可以证明Eiα=αi这是因为, 当ij时, Eiαj=0, 鉴于αj正交于WiEiVWi上的正交投影.

这个定理中出现的分解, 我们将其称为T谱分解 (spectral resolution). 某些物理应用导致了有限维向量空间上的线性算子的谱 (spectrum)被定义为线性算子的特征值的集合, 而这是我们使用谱分解这一术语的部分缘由. 另外, 注意到正交投影E1,,EkT唯一确定也是重要的; 实际上, 它们是应用多项式于T得到的结果. [译注: 也请读者参考第6章的定理11.]

推论. 如果ej=ij(xcicjci)那么Ej=ej(T),1jk.
证明. 译者就不翻译这里的证明了, 因为它实际上只是第6章的定理11的证明之后的讨论的重复.

因为E1,,EkT唯一确定并且I=E1++Ek投影族{E1,,Ek}被称为T定义的单位分解 (resolution of the identity defined by T).

关于谱定理的证明我们有需要作出的评注. 我们运用关于自伴算子和正规算子对角化的第8章的定理18和22推导出了这个定理. 实际上还有一个更加代数的证明方法, 其需要先证明正规算子的极小多项式是不同的素因子之积. 然后, 我们以类似于证明准素分解定理 (第6章的定理12) 的方式进行处理. 下一节我们将会给出这种证明.

在各种应用中, 有时知道我们能否计算关于算子或者矩阵的特定函数 (例如平方根) 是必要的, 而这对于可对角化的正规算子而言是简单的.

定义.T是有限维内积空间上的一个可对角化正规算子, 并且T=j=1kcjEj是其谱分解. 如果函数f的定义域包括T的谱而取值于标量域, 那么我们定义线性算子f(T)f(T)=j=1kf(cj)Ej.
定理10.T是有限维内积空间V上的一个谱为S的可对角化正规算子, 设f是一个定义域包含S而值取于标量域的函数, 那么f(T)是一个谱为f(S)的可对角化正规算子. 如果V也是一个有限维内积空间而U是一个从VV的酉映射, 并且T=UTU1, 那么S也是T的谱而f(T)=Uf(T)U1.
证明. f(T)的正规性可以根据定义和f(T)=j=1kf(cj)Ej这一事实通过简单的计算推得. 而且, 显然对于每个αEj(V), 我们有f(T)α=f(cj)α.因此, 集合f(S)f(T)的谱的子集. 反过来, 设α0并且f(T)α=bα那么根据α=j=1kEjα由此可以推出f(T)α=j=1kf(T)Ejα=j=1kf(cj)Ejα=j=1kbEjα因而j=1k(f(cj)b)Ejα=j=1k|f(cj)b|2Ejα2=0所以, 我们可以断言f(cj)=b或者Ejα=0. 根据假设, α0, 故存在一个下标i使得Eiα0. 然后我们就可以推出f(ci)=b, 也就是说f(S)的确是f(T)的谱. 实际上, 设f(S)={b1,,br}其中当mnbmbn, 也就是互异, 令Xm={i|1ikf(ci)=bm}, 置Pm=iXmEi那么Pm是从Vf(T)与特征值bm相关联的特征空间的正交投影, 而且f(T)=m=1rbmPmf(T)的谱分解.
现在设U是从VV的酉变换, 并且T=UTU1, 那么等式Tα=cα成立当且仅当TUα=cUα因此ST的谱, 并且UT的每个特征空间映射成相对应的T的特征空间. 实际上, 根据定义, 我们可以看出T=j=1kcjEj,Ej=UEjU1T的谱分解. 因此, 我们又可以推出f(T)=j=1kf(cj)Ej=j=1kf(cj)UEjU1=U(j=1kf(cj)Ej)U1=Uf(T)U1
译者注记. 以上存在一些需要澄清的地方. 首先, 酉映射其实指的就是内积空间的同构. 其次, 事实f(T)=j=1kf(cj)Ej的推出需要伴随的基本性质, Ej是正交投影, 还有正交投影是自伴算子. 之所以Ej是正交投影, 实际上是因为我们发现可对角化正规算子的条件就足够推出定理9的那些结论了, 当然或许读者还需要结合第6章的定理11的讨论看看. 至于证明正交投影是自伴算子, 第8章的例子17实际上已经提供了一个证明. 接着, 为了推出f(cj)=b或者Ejα=0, 其实不一定要用勾股定理, 也可以根据直和的性质得到. 最后, 这个证明没有提及T=UTU1的正规性, 但是我们可以发现(T)=UTU1, 鉴于Tα|β=UTU1α|β=TU1α|U1β=U1α|TU1β=α|UTU1β其中α,βV, 并且我们用到了酉变换的保持内积的特性.

在思考前述的讨论时, 我们一定要记得正规算子T的谱是集合S={c1,,ck}而且这些cj是互异的. 当T在某个由特征向量构成的基下由一个对角矩阵表示时, 每个cj都需要重复相对应的特征空间的维数次. 这是我们在以下结果中改换记号的原因.

推论. 在定理10的假设下, 设T在某个有序基𝔅={α1,,αn}下由对角矩阵D表示, 并且D的对角线为d1,,dn, 那么在有序基𝔅下, f(T)由对角矩阵f(D)表示, 其对角线为f(d1),,f(dn). 如果𝔅={α1,,αn}是任意的有序基并且P是从𝔅𝔅的基变换矩阵, 即αj=i=1nPi,jαi那么P1f(D)Pf(T)在基𝔅下的矩阵.
证明.

第9.6节 正规算子的更深刻性质

第10章 双线性形式

第10.1节 双线性形式

本章中, 我们处理有限维向量空间上的双线性形式. 读者可能会发现其与

第10.2节 对称双线性形式

第10.3节 斜对称双线性形式

第10.4节 保持双线性形式的群

附录

这个附录逻辑上分为两个部分. 第一部分由前三节构成, 包含了整本书 (实际上是整个数学) 会出现的特定基础概念. 对于本书而言其更像引论而非附录. 第二部分则诚然作为本书的实际附录出现.

第1节包含了对于集合以及交集和并集的讨论.

第A.1节 集合

第A.2节 函数

一个函数包含以下资料:

  1. 一个集合X, 被称为函数的定义域;
  2. 一个集合Y, 被称为函数的陪域 (codomain);
  3. 一个规则 (或者说对应关系) f, 其将X的每个元素x联系以Y的单独一个元素f(x).
如果(X,Y,f)是一个函数, 我们也称f是一个从XY的函数. 这稍微有些混乱了, 因为f本身不是函数, 而是函数的规则. [译注: 实际上, XY可以被视为附着在规则f上的元数据. 另外, 规则在现代数学中通常被解释/实现为序对的集合, 这是外延性的观念.] 然而, 对于函数和规则使用相同的符号为我们提供了更加容易的讨论函数的方式. 因此, 当我们说f是从XY的函数, 或者Xf的定义域, Yf的陪域时, 这意味着(X,Y,f)是一个如之前所定义的那样的函数. 许多词汇经常用于代替函数, 例如变换, 算子, 映射. 它们在特定的上下文中使用以暗示函数所扮演的角色.

如果f是一个从XY的函数, 那么f的值域 (或者说像) 是由所有Xxf(x)构成的集合. 换言之, f的值域由Y中所有满足存在X中的x使得y=f(x)的元素y构成. 如果f的值域是整个Y, 那么我们称f是从XY的满射, 或者就说f是一个满射. f的值域经常被记为f(X). [译注: 这里术语稍有修改, 以符合数学界的潮流.]

例子2.
  1. X是实数集, Y=X, 那么由f(x)=x2定义的从XY的函数f的值域是非负实数构成的集合, 所以f不是满射.

第A.3节 等价关系

第A.4节 商空间

V是域F上的一个向量空间, WV的子空间. 一般来说, 存在许多与W互补的子空间W, 即满足V=WW的子空间. 如果V上定义了一个内积, 而且W是有限维的, 在某种意义上存在可以称得上是自然的W的补子空间, 即W的正交补. 但是, 如果V没有附加于其向量空间结构之上的其他结构, 那么我们并不能挑选出一个自然的补子空间. 然而, 我们可以从VW中构造出向量空间V/W, 所谓的VW的商, 其可以扮演W的自然的补的角色. 这个商空间并非V的子空间, 但是其仅由VW定义, 并且同构于任何与W互补的子空间W.

WV的一个子空间, 如果αβV中任意的向量, 那么我们称αWβ同余, 若向量(αβ)W之中. 如果αWβ同余, 我们将其记为αβ(modW).现在模W的同余关系是V上的一个等价关系.

  1. αα(modW), 因为αα=0W之中.
  2. 如果αβ(modW), 那么βα(modW), 因为向量(αβ)W中当且仅当向量(βα)W中.
  3. 如果αβ(modW)βγ(modW), 那么αγ(modW), 因为若(αβ)(βγ)都在W中, 则有αγ=(αβ)+(βγ)W之中.

这个等价关系的等价类被称为W的陪集. 一个向量α的等价类 (陪集) 是什么样的呢? 其由所有V中所有满足(βα)属于W的向量β构成. 换言之, 其由所有具有形式β=α+γ的向量β构成, 其中γW中. 出于此缘由, α的陪集记作α+W.在某种意义上, 将α相对于W的陪集想成是将子空间W平移向量α得到的集合是合理的. 为了描绘出这些陪集, 读者或许可以想象一下以下的特殊情形. 令V是空间2, WV的一个一维子空间. 如果我们将V画成是Euclid平面, 那么W就是穿过原点的一条直线. 如果α=(x1,x2)V中的一个向量, 那么陪集α+W是经过点(x1,x2)且与W平行的直线.

所有W的陪集构成的集合被记为V/W. 我们现在定义V/W上的向量加法与标量乘法如下:(α+W)+(β+W)=(α+β)+Wc(α+W)=(cα)+W换言之, α的陪集加上β的陪集是(α+β)的陪集, 标量cα的陪集的乘积是向量cα的陪集. 既然V中许多不同的向量都可能拥有相同的相对于W的陪集, 那么我们必须验证向量加法和标量乘法只依赖于其所牵涉的陪集. 也就是说, 我们必须证明以下事实:

  1. 如果αα(modW)ββ(modW), 那么α+βα+β(modW).
  2. 如果αα(modW), 那么cαcα(modW).
这些事实是容易验证的. a. 如果αα属于Wββ属于W, 那么因为(α+β)(α+β)=(αα)+(ββ), 我们看到α+βWα+β同余. b. 如果αα属于Wc是任意的标量, 那么cαcα=c(αα)也属于W.

现在很容易验证V/W在上述向量加法和标量乘法下是一个域F上的向量空间. 读者必须直接验证向量空间的每条公理. 向量加法和标量乘法的每条性质都是从相应的V中的运算性质推得的. 还有要说的一件事情是, V/W的零向量是V的零向量的陪集. 换言之, WV/W的零向量.

向量空间V/W被称为VW的商 (在这种情况下偶尔也有人使用"差"). 存在一个自然的从VV/W的满射的线性变换Q, 其由Q(α)=α+W定义. 根据刚才定义的V/W上的运算, 变换Q的线性性质是显然的. 注意到Q的零空间恰是子空间W. 我们称Q是从VV/W的商变换 (或者商映射).

现在我们可以陈述商空间V/WW的补子空间之间的关系了.

定理.W是向量空间V的一个子空间, Q是从VV/W的商变换. 设WV的一个子空间, 那么V=WW当且仅当QW的限制是从WV/W的同构.
证明.

第A.5节 线性代数中的等价关系

第A.6节 选择公理