线性代数

第3章 线性变换

第3.1节 线性变换

我们将引入线性变换, 本书的剩余部分我们将研究的对象. 读者或许会发现阅读 (或重读) 附录里关于函数的部分是有用的, 因为我们将自由地使用其中的术语.

定义.VW是域F上的向量空间. 一个从VW的线性变换是一个从VW的函数T满足T(cα+β)=c(Tα)+Tβ对于所有Vαβ以及所有F中标量c成立.
例子1. 如果V是任意的向量空间, 恒等变换I, 由Iα=α定义, 是一个从VV的线性变换. 零变换, 由0α=0定义, 也是一个从VV的线性变换.
例子2.F是一个域, V是从FF的多项式函数f构成的空间, ff(x)=c0+c1x++ckxk给定. 令(Df)(x)=c1+2c1x++kckxk1.那么D是一个从VV的线性变换, 即微分变换.
例子3.A是域F上一个固定的m×n矩阵, 由T(X)=AX定义的函数T是一个从Fn×1Fm×1的线性变换. 由U(α)=αA定义的函数U是一个从FmFn的线性变换.
例子4.P是域F上一个固定的m×m矩阵, 令Q是域F上一个固定的n×n矩阵. 定义一个从Fm×n到自身的函数T, T(A)=PAQ. 那么T是一个线性变换, 因为T(cA+B)=P(cA+B)Q=(cPA+PB)Q=cPAQ+PBQ=cT(A)+T(B)
例子5.V是所有从的连续函数构成的空间, 由(Tf)(x)=0xf(t)dt定义T, 那么T是一个从VV的线性变换. 函数Tf不仅是连续的, 还拥有连续的一阶导数. 积分的线性性质是其根本性质之一.

读者验证例子1, 2, 3, 5是线性变换是没有难度的. 当我们了解更多关于线性变换的东西时, 例子也会随之得到扩展.

注意到以下事实是重要的. 如果T是一个从VW的线性变换, 那么T(0)=0. 人们可以从定义中看出来, 因为T(0)=T(0+0)=T(0)+T(0).这点对于线性代数的初学者而言有时令人迷惑, 因为他可能已经接触过术语"线性函数"一个稍微有点不同的用法. 扼要的注记应该能够扫清这种迷惑. 设V是向量空间1, 那么一个从VV的线性变换是一种特定的实数轴上的实值函数. 在一个微积分课程中, 人们可能会将图像是直线的函数称为线性的. 一个从11的线性变换, 根据我们的定义, 将会是一个从的函数, 其图像是经过原点的直线.

不仅是T(0)=0, 让我们指出一般的线性变换T的另一个性质. 这样的线性变换"保持"线性组合, 也就是说, 如果α1,,αnV中的向量, c1,,cn是标量, 那么T(c1α1++cnαn)=c1(Tα1)++cn(Tαn)这可由定义直接推得, 例如T(c1α1+c2α2)=c1(Tα1)+T(c2α2)=c1(Tα1)+c2(Tα2)

定理1.V是一个域F上的有限维向量空间, 令{α1,,αn}V的一个有序基. 令W也是域F上的一个向量空间, 并且令β1,,βnW中任意的向量. 那么, 恰存在唯一的从VW的线性映射T满足Tαj=βj,j=1,,n
证明. 为了证明存在某个线性变换T满足Tαj=βj我们按照以下方式推进. 给定V中的α, 存在唯一的n元组(x1,,xn)满足α=x1α1++xnαn.对于这个向量α我们定义Tα=x1β1++xnβn.那么T是一个将每个V中的向量α与一个W中的向量Tα联系起来的良定义的规则. 从此定义中显然可以看出对于每个jTαj=βj. 为了说明T是线性的, 令β=y1α1++ynαnV中的向量, 令c是任意的标量. 现在cα+β=(cx1+y1)α1++(cxn+yn)αn于是根据定义T(cα+β)=(cx1+y1)β1++(cxn+yn)βn另一方面c(Tα)+Tβ=ci=1nxiβi+i=1nyiβi=i=1n(cxi+yi)βi因此T(cα+β)=c(Tα)+Tβ.如果U也是一个满足Uαj=βj,j=1,,n的从VW的线性变换, 那么对于向量α=i=1nxiαi我们有Uα=U(i=1nxiαi)=i=1nxi(Uαi)=i=1nxiβi因此U恰是我们之前所定义的规则T. 这表明满足Tαj=βj的线性变换T是唯一的.

定理1是相当初等的. 然而, 它是如此基本以至于我们形式化地陈述了该定理. 函数的概念是非常一般的. 如果VW是(非零的)向量空间, 那么从VW的函数存在相当多样的可能性. 定理1强调了线性函数是极其特殊的.

例子6. 向量α1=(1,2),α2=(3,4)是线性无关的, 因此构成了2的一个基. 根据定理1, 存在唯一的一个从23的线性变换满足Tα1=(3,2,1),Tα2=(6,5,4)如果是这样的话, 我们必须能够找出T(ε1). 我们先找到满足ε1=c1α1+c2α2的标量c1c2, 然后我们就知道Tε1=c1Tα1+c2Tα2. 如果(1,0)=c1(1,2)+c2(3,4), 那么c1=2c2=1, 因此T(1,0)=2(3,2,1)+(6,5,4)=(0,1,2)
例子7.T是一个从m元组空间Fmn元组空间Fn的线性变换. 定理1告诉我们T由向量的序列β1,,βm唯一地确定, 其中βi=Tεi,i=1,,m.简而言之, T由其在标准基向量下的像唯一地确定, 而这个确定就是α=(x1,,xm),Tα=x1β1++xmβm.如果B是一个以β1,,βm为行向量的m×n矩阵, 那么上面就是在说Tα=αB.换言之, 如果βi=(Bi,1,,Bi,n), 那么T(x1,,xm)=[x1xm][B1,1B1,nBm,1Bm,n].这是一种对于线性变换相当显式的刻画. 在第3.4节我们将严肃地研究线性变换和矩阵之间的关系. 之后我们并不会追求Tα=αB这种特定的描述, 因为它将矩阵B置于向量α的右边, 而这可能会引起一些困惑. 这个例子的要点在于展现了我们对于所有从FmFn的线性变换可以给出显式且相当简单的描述.

如果T是一个从VW的线性变换, 那么T的像不仅是W的子集, 而且是W的子空间. 令RTT的像, 即满足存在某个Vα使得β=Tα的所有W中向量β构成的集合. 令β1β2RT的元素, 令c是一个标量. 存在V中向量α1α2满足Tα1=β1Tα2=β2. 既然T是线性的, 那么T(cα1+α2)=cTα1+Tα2=cβ1+β2这表明cβ1+β2也在RT之中.

另一个与线性变换T相关的有趣子空间是由所有满足Tα=0V中的向量α构成的集合N. 它是V的一个子空间, 因为

  1. T(0)=0, 于是N非空;
  2. 如果Tα1=Tα2=0, 那么T(cα1+α2)=cTα1+Tα2=c0+0=0于是cβ1+β2也在N之中.

定义.VW是域F上的向量空间, 令T是一个从VW的线性变换. T的零空间是所有满足Tα=0V中向量α构成的集合. 如果V是有限维的, 那么称T的像的维数为T的秩, T的零空间的维数为T的零化度.

以下是线性代数中最重要的结果之一.

定理2.VW是域F上的向量空间, 令T是一个从VW的线性变换, 设V是有限维的, 那么rank(T)+nullity(T)=dimV.
证明.{α1,,αk}N的一个基, NT的零空间. 存在V中向量αk+1,,αn满足{α1,,αn}V的一个基. 我们将证明{Tαk+1,,Tαn}T的像的一个基. 向量Tα1,,Tαn当然能够张成T的像, 并且既然对于jkTαj=0, 我们可以看出Tαk+1,,Tαn能够张成像. 为了看出这些像是线性无关的, 设我们有标量ci满足i=k+1nci(Tαi)=0.这说明T(i=k+1nciαi)=0并且可知α=i=k+1nciαiT的零空间中. 既然α1,,αk构成了N的一个基, 那么必须存在标量b1,,bk满足α=i=1kbiαi.因此i=1kbiαij=k+1ncjαj=0并且既然α1,,αn是线性无关的, 我们必须有b1==bk=ck+1==cn=0.如果rT的秩, 那么Tαk+1,,Tαn构成了T的像的基的事实告诉我们r=nk. 既然kT的零化度而nV的维数, 证明结束了.
定理3. 如果A是域F上的一个m×n矩阵, 那么row-rank(A)=column-rank(A).
证明.T是由T(X)=AX定义的从Fn×1Fm×1的线性变换. T的零空间是线性方程组AX=0的解空间, 即由所有满足AX=0的列矩阵X构成的集合. T的像是由所有满足线性方程组AX=Y有解的m×1的列矩阵Y构成的集合. 如果A1,,AnA的列, 那么AX=x1A1++xnAn于是T的像是由A的列张成的子空间. 换句话说, T的像就是A的列空间, 因此rank(T)=column-rank(A).定理2告诉我们如果S是线性方程组AX=0的解空间, 那么dimS+column-rank(A)=n.我们现在引用第2章的例子15. 我们的意图在于, 如果rA的行空间的维数, 那么解空间S拥有一个由nr个向量构成的基:dimS=nrow-rank(A).现在显然有row-rank(A)=column-rank(A).

刚刚我们给出的对于定理3的证明依赖于和线性方程组有关的显式计算. 实际上存在一个不依赖于这样的计算的概念性证明. 我们将在第3.7节给出这个证明.

练习1. 以下哪些函数T是从22的线性变换呢?
  1. T(x1,x2)=(1+x1,x2);
  2. T(x1,x2)=(x2,x1);
  3. T(x1,x2)=(x12,x2);
  4. T(x1,x2)=(sinx1,x2);
  5. T(x1,x2)=(x1x2,0).
练习2. 找出有限维向量空间V上的零变换和恒等变换的像, 秩, 零空间, 零化度.
练习3. 描述例子2的微分变换和例子5的积分变换的像和零空间.
练习4. 存在从32的线性变换满足T(1,1,1)=(1,0)T(1,1,1)=(0,1)吗?
练习5. 如果α1=(1,1),β1=(1,0),α2=(2,1),β2=(0,1),α3=(3,2),β3=(1,1)存在从22的线性变换T满足Tαi=βi对于i=1,2,3成立吗?
练习6. 显式描述 (如练习1和2) 满足Tε1=(a,b),Tε2=(c,d)的从F2F2的线性变换T.
练习7.F是一个复数域的子域, 令T是由T(x1,x2,x3)=(x1x2+2x3,2x1+x2,x12x2+2x3)定义的从F3F3的函数.
  1. 验证T是一个线性变换.
  2. 如果(a,b,c)F3中向量, 那么a,b,c满足什么条件时向量在T的像中? T的秩是多少?
  3. a,b,c满足什么条件时(a,b,c)T的零空间中? T的零化度是多少?
练习8. 显式描述一个从33的线性变换, 其像是由(1,0,1)(1,2,2)张成的子空间.
练习9.V是域F上的所有n×n矩阵构成的向量空间, 令B是一个固定的n×n矩阵. 如果T(A)=ABBA验证T是一个从VV的线性变换.
练习10.V是所有复数的集合, 其被当作实数域上的向量空间 (在通常的运算下). 找出一个从VV的线性变换, 但不是1上的线性变换, 即不是复线性的.
练习11.VF上的n×1矩阵的空间, 令WF上的m×1矩阵的空间. 令AF上的一个固定的m×n矩阵, 令T是由T(X)=AX定义的从VW的线性变换. 证明T是零变换当且仅当A是零矩阵.
练习12.V是域F上的一个n维向量空间, 令T是一个从VV的线性变换, 并且T的像和零空间是相等的. 证明n是偶数. (你能给出这样的线性变换T的例子吗?)
练习13.V是一个向量空间, 令T是一个从VV的线性变换. 证明以下两个关于T的陈述是等价的.
  1. T的像与零空间之交是V的零子空间.
  2. 如果T(Tα)=0, 那么Tα=0.

第3.2节 线性变换的代数

在研究从VW的线性变换时, 这些变换的集合继承了自然的向量空间结构具有根本的重要性. 从空间V到自身的线性变换的集合甚至有着更多的代数结构, 因为通常的函数复合提供了这样的变换的"乘法". 我们将在本节探索这些想法.

定理4.VW是域F上的向量空间. 令TU是从VW的线性变换. 由(T+U)(α)=Tα+Uα定义的函数(T+U)是一个从VW的线性变换. 如果cF任意的元素, 那么由(cT)(α)=c(Tα)定义的函数(cT)是一个从VW的线性变换. 所有从VW的线性变换的集合, 与其上定义的加法和标量乘法一起, 构成了一个域F上的向量空间.
证明.TU是从VW的线性变换, 而(T+U)定义如上, 那么(T+U)(cα+β)=T(cα+β)+U(cα+β)=c(Tα)+Tβ+c(Uα)+Uβ=c(Tα+Uα)+(Tβ+Uβ)=c(T+U)(α)+(T+U)(β)这表明(T+U)是一个线性变换. 类似地,(cT)(dα+β)=c[T(dα+β)]=c[d(Tα)+Tβ]=cd(Tα)+c(Tβ)=d[c(Tα)]+c(Tβ)=d[(cT)α]+(cT)β这表明(cT)是一个线性变换.
为了验证从VW的线性变换的集合 (以及这些运算) 是一个向量空间, 我们还必须直接检验每个向量加法和数乘上的条件是否满足. 我们将这些工作留给读者, 并满足于以下的评论: 这个空间里的零向量是零变换, 其将每个V的向量送至W的零向量; 这两个运算的每个性质都对应于空间W的运算的相应性质.

或许我们应该提及另一种看待这个定理的方式. 如果我们如果上面那样定义和与标量积, 那么所有从VW的函数构成了一个域F上的向量空间. 这与V是向量空间无关, V是一个非空集合足矣. 当V是向量空间的时候我们可以定义从VW的线性变换, 那么定理4告诉我们这些变换构成了从VW的所有函数构成的空间的一个子空间.

我们将从VW的线性变换的空间记作L(V,W). 我们提醒读者只有当VW是定义于同一个域上的向量空间时L(V,W)才有定义.

定理5.V是域F上的n维向量空间而W是域F上的m维向量空间, 那么L(V,W)是有限维的, 并且维数是mn.
证明.𝔅={α1,,αn}𝔅={β1,,βm}分别是VW的有序基. 对于每个满足1pm1qn的整数序对(p,q), 我们定义从VW的线性变换Ep,q如下.Ep,q(αi)={0, 如果iqβp, 如果i=q=δi,qβp根据定理1, 存在唯一的从VW的线性变换满足这些条件. 我们要证明的是这mn个线性变换构成了L(V,W)的一个基.
T是从VW的线性变换. 对于每个j,1jn, 令A1,j,,Am,j是向量Tαj相对于有序基𝔅的坐标, 即Tαj=p=1mAp,jβp.我们想要表明T=p=1mq=1nAp,qEp,q.U是上面这个式子右侧的线性变换, 那么对于每个j,Uαj=p=1mq=1nAp,qEp,q(αj)=p=1mq=1nAp,qδj,qβp=p=1mAp,jβp=Tαj因此U=T. 目前我们已经证明了Ep,q可以张成L(V,W), 我们必须还要证明它们是线性无关的, 然而从我们上面写下的东西来看这是显然的, 因为如果变换U=p=1mq=1nAp,qEp,q是零变换, 那么对于每个jUαj=0, 于是p=1mAp,jβp=0βp的线性无关性质又可推出对于每个pj我们有Ap,j=0.
定理6.V,W,Z是域F上的向量空间, 令T是从VW的线性变换, 令U是从WZ的线性变换, 那么由(UT)(α)=U(T(α))定义的复合函数UT是一个从VZ的线性变换.
证明. UT(cα+β)=U[T(cα+β)]=U(cTα+Tβ)=c[U(Tα)]+U(Tβ)=c(UT)(α)+(UT)(β)

接下来, 我们将主要关注从一个向量空间到自身的线性变换. 鉴于我们经常得说"T是一个从VV的线性变换", 以后我们将说"TV上的一个线性算子".

定义. 如果V是域F上的一个向量空间, 那么一个V上的线性算子就是一个从VV的线性变换.

在定理6的情况下, 当V=W=Z时, 以至于UT都是空间V上的线性算子, 那么其复合UT也是一个V上的线性算子. 因此, 空间L(V,V)有一个乘法定义于其上, 即复合. 当然算子TU也是有定义的, 不过读者应该注意一般UTTU, 即UTTU0. 我们还应该特别注意如果T是一个V上的线性算子, 那么我们可以将TT复合. 我们将使用记号T2=TT, 而一般地, 对于n=1,2,3,, Tn=TT(nT相乘). 我们定义T0=I, 如果T0. [译注: T=0时定义T0=I也是合理且必要的.]

引理.V是域F上的向量空间, 令U,T1,T2V上的线性算子, 令cF的元素.
  1. IU=UI=U;
  2. U(T1+T2)=UT1+UT2; (T1+T2)U=T1U+T2U;
  3. c(UT1)=(cU)T1=U(cT1).
证明.
  1. 这个关于恒等函数的性质是显然的, 我们列在这里仅是为了强调一下.
  2. [U(T1+T2)](α)=U[(T1+T2)(α)]=U(T1α+T2α)=U(T1α)+U(T2α)=(UT1)(α)+(UT2)(α)于是U(T1+T2)=UT1+UT2. 另外,[(T1+T2)U](α)=(T1+T2)(Uα)=T1(Uα)+T2(Uα)=(T1U)(α)+(T2U)(α)于是(T1+T2)U=T1U+T2U. (读者或许注意到了这两个分配律的证明并没有用到T1T2是线性的这个事实, 而且第二个证明也没有用到U是线性的.)
  3. 我们将c的证明留给读者.

这个引理的内容和定理5的一部分告诉我们向量空间L(V,V)和复合运算构成了一个叫做含幺元的线性代数的结构. 我们将在第4章讨论这个东西. [译注: 其实在一般的代数学书籍里这种结构就叫代数.]

例子8. 如果A是一个元素来源于Fm×n矩阵, 我们可以由T(X)=AX定义一个从Fn×1Fm×1的线性变换T. 如果B是一个p×m的矩阵, 那么我们可以通过U(Y)=BY定义一个从Fm×1Fp×1的线性变换U. 它们的复合UT是很容易描述的:(UT)(X)=U(T(X))=U(AX)=B(AX)=(BA)X因此UT即"左乘积矩阵BA".
例子9.F是一个域而V是所有从FF的多项式函数构成的向量空间. 令D是例子2所定义的微分算子, 令T是"乘上x"的线性算子:(Tf)(x)=xf(x).那么DTTD. 实际上, 读者应该很容易验证DTTD=I, 即恒等算子.

即便我们定义的L(V,V)上的乘法并不交换, 其与L(V,V)的向量空间运算有着很好的联系.

例子10.𝔅={α1,,αn}是向量空间V的一个有序基. 考虑定理5的证明中出现的线性算子Ep,q:Ep,q(αi)=δi,qαp.n2个线性算子构成了V上的线性算子空间的一个基. Ep,qEr,s是什么呢? 我们有(Ep,qEr,s)(αi)=Ep,q(δi,sαr)=δi,sEp,q(αr)=δi,sδr,qαp因此Ep,qEr,s={0, 如果rqEp,s, 如果q=rT是一个V上的线性算子, 我们在定理5的证明中表明如果Aj=[Tαj]𝔅,A=[A1,,An]那么T=p=1nq=1nAp,qEp,q.如果U=r=1ns=1nBr,sEr,sV上另一个线性算子, 那么上一条引理告诉我们TU=(p=1nq=1nAp,qEp,q)(r=1ns=1nBr,sEr,s)=p=1nq=1nr=1ns=1nAp,qBr,sEp,qEr,s我们注意到, 这巨大的求和之中只有满足q=r的项才能活下来, 又因为Ep,rEr,s=Ep,s, 我们有TU=p=1ns=1n(r=1nAp,rBr,s)Ep,s=p=1ns=1n(AB)p,sEp,s因此, 复合TU的效用相当于矩阵AB相乘.

在我们对于线性变换的代数运算的讨论中, 我们还没有说任何与可逆性相关的东西. 我们所特别关心的问题之一是, 对于向量空间V上什么样的线性算子T存在线性算子T1满足TT1=T1T=I? [译注: 读者应该将这里的T1当作一个整体, 而不是T的逆, 因为还没有定义逆运算.]

VW的函数称为可逆的, 如果存在一个从WV的函数U满足UTV上的恒等函数而TUW上的恒等函数. 如果T是可逆的, 那么函数U是唯一的, 我们将其记作T1. (见附录.) 而且, T可逆当且仅当

  1. T是一一的, 即Tα=Tβ可以推出α=β;
  2. T是映上的, 即T的像是(整个的)W.
[译注: 一一和映上是过时的术语, 之后我们将用单射和满射.]

定理7.VW是域F上的向量空间, 令T是从VW的线性变换. 如果T是可逆的, 那么逆函数是一个从WV的线性变换. [译注: 这里说的可逆是函数的可逆.]
证明. 这里我们重复以强调一个点. 当T是单射且是满射, 那么存在唯一决定的从WV的逆函数T1满足T1TV上的恒等函数而TT1W上的恒等函数. 现在我们要证明的是, 如果线性函数T是可逆的, 那么其逆T1也是线性的.
β1β2W的向量而c是一个标量, 我们想要证明T1(cβ1+β2)=cT1β1+T1β2.αi=T1βi,i=1,2, 即令αiV中唯一满足Tαi=βi的向量. 既然T是线性的, 那么T(cα1+α2)=cTα1+Tα2=cβ1+β2因此cα1+α2V中唯一的由T送至cβ1+β2的向量, 于是T1(cβ1+β2)=cα1+α2=c(T1β1)+T1β2

设我们有一个从VW的可逆的线性变换T和一个从WZ的可逆的线性变换U, 那么UT是可逆的并且(UT)1=T1U1. 这个结论并不需要线性性质, 也不需要分开检验UT是单射和满射. 所有需要做的事情只是验证T1U1既是UT的左逆也是UT的右逆.

如果T是线性的, 那么T(αβ)=TαTβ. 因此, Tα=Tβ当且仅当T(αβ)=0. 这极大地简化了对于T是否为单射的验证. 让我们称一个线性变换是非奇异的, 如果Tγ=0可以推出γ=0, 即T的零空间是{0}. 显然, T是单射当且仅当T非奇异. 这个评注的一个扩展是非奇异的线性变换就是那些保持线性无关的线性变换.

定理8.T是一个从VW的线性变换, 那么T是非奇异的当且仅当V的每个线性无关子集在T下的像是W的线性无关子集.
证明. 首先设T是非奇异的. 令SV的一个线性无关子集. 如果α1,,αkS中的向量 [译注: 不同的向量], 那么Tα1,,Tαk是线性无关的, 因为如果c1(Tα1)++ck(Tαk)=0那么T(c1α1++ckαk)=0既然T是非奇异的, 那么c1α1++ckαk=0从中我们可以得出每个ci=0, 因为S是一个线性无关的集合. 这个论证表明ST下的像是线性无关的.
T将线性无关的子集映射至线性无关的子集. 令αV的一个非零向量, 那么仅包含α的集合S是线性无关的. S的像是仅包含向量Tα的集合, 而这个集合是线性无关的. 因而Tα0, 否则的话就是线性相关的了. 这表明T的零空间是零子空间, 即T是非奇异的.
例子11.F是一个复数域的子域 (或者特征为零的域), 令V是域F上的多项式函数的空间. 考虑例子9的微分算子D和"乘上x"的算子T. 既然D将每个常函数送至0, D是奇异的. 然而, 因为V不是有限维的, D的像是整个V, 于是定义一个D的右逆是有可能的. 例如, 如果E是不定积分算子:E(c0+c1x++cnxn)=c0x+12c1x2++1n+1cnxn+1那么EV上的线性算子并且DE=I. 另一方面, EDI, 因为ED将每个常函数都送至0. 与之相对地, 算子T是非奇异的, 因为如果对于每个xxf(x)=0, 那么f=0. 因此, 可以找到T的一个左逆. 例如, 如果U是"移除常数项并除以x"的操作:U(c0+c1x++cnxn)=c1+c2x++cnxn1那么U是一个V上的线性算子并且UT=I. 但是TUI, 因为每个TU的像中的函数自然也在T的像中, 而T的像是所有满足f(0)=0的函数f构成的空间. [译注: 而不是整个V.]
例子12.F是一个域而T是一个F2上的线性算子, 其由T(x1,x2)=(x1+x2,x1)定义. 那么, T是非奇异的, 因为如果T(x1,x2)=0, 我们有{x1+x2=0x1=0于是x1=x2=0. 我们也看出T是满射, 因为如果令(z1,z2)F2中任意的向量, 为了证明(z1,z2)T的像中, 我们必须找出满足{x1+x2=z1x1=z2的标量x1x2, 而x1=z2,x2=z1z2就是显而易见的解. 这个计算为我们提供了T1的显式公式, 即T1(z1,z2)=(z2,z1z2).

在例子11之中我们看到一个线性变换可能是非奇异的但不是满射, 或者可能是满射但不是非奇异的. 然而, 上面这个例子为我们刻画了一种情形, 其中例子11的这种事情不可能发生.

定理9.VW是域F上的有限维向量空间, 并且dimV=dimW. 如果T是一个从VW的线性变换, 那么以下陈述是等价的:
  1. T是可逆的.
  2. T是非奇异的.
  3. T是满射, 即T的像是W.
证明.n=dimV=dimW, 从定理2我们知道rank(T)+nullity(T)=n.既然T是非奇异的当且仅当nullity(T)=0, T的像是W当且仅当rank(T)=n (因为n=dimW), 而且零化度是0当且仅当秩为n, 那么T是非奇异的当且仅当T(V)=W. 于是, 只要ii或iii其中之一成立, 那么另一条也成立, 那么T就是可逆的了.

我们提醒读者一下, 除非有限维和dimV=dimW的条件都满足, 否则就不要应用定理9. 在定理9的假设下, 条件i, ii, iii还等价于以下陈述.

  1. 如果{α1,,αn}V的一个基, 那么{Tα1,,Tαn}W的一个基.
  2. 存在V的某个基{α1,,αn}使得{Tα1,,Tαn}W的一个基.
我们将给出一个这五个条件等价的证明, 它不同于之前给出的三个条件等价的证明.

i推出ii. 如果T是可逆的, T当然是非奇异的. ii推出iii. 设T是非奇异的. 令{α1,,αn}V的一个基, 那么根据定理8, {Tα1,,Tαn}W的一个线性无关集合. 而且, 因为W的维数也是n, 所以这个集合也构成了W的一个基. 现在令βW任意的向量, 那么存在标量c1,,cn满足β=c1(Tα1)++cn(Tαn)=T(c1α1++cnαn)这表明βT的像之中. iii推出iv. 现在我们假定T是满射. 如果{α1,,αn}V任意的基, 那么{Tα1,,Tαn}可以张成T的像, 根据假设也就是整个W. 既然W的维数是n, 那么这n个向量必然是线性无关的, 也就是说构成了W的一个基. iv推出v. 这不需要证明. v推出i. 设存在V的某个基满足{Tα1,,Tαn}W的一个基. 既然Tαi可以张成W, 那么显然T的像是整个W. 如果α=c1α1++cnαnT的零空间之中, 那么T(c1α1++cnαn)=0或者c1(Tα1)++cn(Tαn)=0既然Tαi是线性无关的, 那么每个ci=0, 因此α=0. 我们已经证明了T的像是WT是非奇异的, 所以T是可逆的.

一个空间V上的可逆线性算子, 连带着复合运算, 提供了一个代数中被称为"群"的例子. 尽管我们没有时间细致地讨论群, 但是我们至少可以给出群的定义.

定义. 一个群由以下资料构成.
  1. 一个集合G;
  2. 一个法则 (或者说一个运算), 其联系G中每对元素xy以一个G中元素xy, 并且满足
    1. 对于所以Gx,y,z, x(yz)=(xy)z;
    2. 存在一个G中的元素e满足对于每个G中的xex=xe=x;
    3. 对于每个G的元素x存在一个G中元素x1与之对应, 满足xx1=x1x=e.

我们已经证明了复合(U,T)UT联系空间V上的每对可逆线性算子以另一个V上的可逆线性算子. 复合是一个结合运算. 恒等算子I对于每个TIT=TI=T. 对于可逆的T, (根据定理7)存在一个可逆的线性算子T1满足TT1=T1T=I. 因此, V上的可逆线性算子的集合, 连带着复合运算, 构成了一个群. 以矩阵乘法作为运算的n×n可逆矩阵的集合是另一个群的例子. 一个群是交换的, 如果它满足对于每个xyxy=yx. 以上两个我们给出的例子一般不是交换群. 人们经常将交换群的运算写成(x,y)x+y而不是(x,y)xy, 并用符号0表示"恒元"e. 向量空间的向量的集合, 连带着向量加法, 是一个交换群. 一个域可以被描述为一个带有加法和乘法运算的集合, 其在加法下是一个交换群, 而非零元素在乘法下也构成了一个交换群, 并且分配律x(y+z)=xy+xz成立.

练习1.TU2上由T(x1,x2)=(x2,x1)U(x1,x2)=(x1,0)定义的线性算子.
  1. 如何几何地描述TU?
  2. 像定义TU一样给出刻画(U+T),UT,TU,T2,U2的规则.
练习2.T3上满足Tε1=(1,0,i),Tε2=(0,1,1),Tε3=(i,1,0)的(唯一的)线性算子. T可逆吗?
练习3.T3上由T(x1,x2,x3)=(3x1,x1x2,2x1+x2+x3)定义的线性算子. T可逆吗? 如果可逆的话, 像定义T一样给出T1的规则.
练习4. 对于练习3的线性算子T, 证明(T2I)(T3I)=0.
练习5.B=[1144]T是由T(A)=BA定义的2×2上的线性算子. T的秩是多少? 你能描述T2吗?
练习6.T是从32的线性变换, 令U是从23的线性变换. 证明变换UT是不可逆的. 给出这个定理的一般化版本.
练习7. 找出2上两个线性算子TU满足TU=0但是UT0.
练习8.V是域F上的向量空间, 令TV上的一个线性算子. 如果T2=0, 关于T的像和零空间的关系你有什么可说的? 给出一个2上的线性算子T的例子, 其满足T2=0T0.
练习9.T是有限维向量空间V上的一个线性算子. 设存在一个V上的线性算子U满足TU=I. 证明T是可逆的, 并且U=T1. 给出一个例子表明在V不是有限维的情况下这是错的. (提示: 令T=D, 多项式函数空间上的微分算子.)
练习10.A是域F上的一个m×n矩阵, 令T是由T(X)=AX定义的从Fn×1Fm×1的线性变换. 说明在m<n的情况下T可以是满射但不是非奇异的. 类似地, 说明在m>n的情况下T可以是非奇异的但不是满射.
练习11.V是一个有限维向量空间, 令TV上的一个线性算子. 设rank(T2)=rank(T). 证明T的像和零空间是不相交的 (disjoint), 即只有零向量作为共同元素.
练习12.p,m,n是正整数而F是一个域. 令V是域F上的m×n矩阵的空间, W是域F上的p×n矩阵的空间. 令B是一个固定的p×m矩阵而T是一个由T(A)=BA定义的从VW的线性变换. 证明T可逆当且仅当p=mB是一个可逆的m×m矩阵.

第3.3节 同构

如果VW是域F上的向量空间, 那么任何从VW的双射的线性变换T都被称为从VW的同构. 如果存在从VW的同构, 那么就称V同构于W. [译注: 更直接和正确的说法其实是可逆而不是双射, 不过在向量空间的情况下这二者是等价的.]

注意到V平凡地同构于V, 恒等算子是一个从VV的同构. 并且, 如果V通过T同构于W, 那么W也同构于V, 因为T1是一个从WV的同构. 读者应该很容易验证如果V同构于WW同构于Z, 那么V同构于Z. 简而言之, 同构是向量空间的类上的等价关系. [译注: 这里的用词是class而不是set, 因为所有的向量空间的确不构成一个集合.] 当存在一个从VW的同构时, 我们有时也说VW是同构的, 而不说V同构于W. 鉴于V同构于W当且仅当W同构于V, 这不会引起歧义.

定理10. 每个域F上的n维向量空间都同构于空间Fn.
证明.V是域F上的n维向量空间, 令𝔅={α1,,αn}V的一个有序基. 我们按照以下方式定义从VFn的函数T: 如果αV中, 令Tαα相对于有序基𝔅的坐标n元组(x1,,xn), 即满足α=x1α1++xnαnn元组. 根据我们第2章对于坐标的讨论, 我们验证这个T是线性的且是双射的.

出于许多目的我们可以将同构的向量空间视为"相同的", 尽管空间中的向量和运算可能是相当不同的. 我们目前不会详细讨论这个想法, 但将在我们对于向量空间的研究中积累对于同构的理解以及同构空间是"相同的"这个感觉.

我们将作出一些简要的评注. 设T是一个从VW的同构. 如果SV的一个子集, 那么定理8告诉我们S是线性无关的当且仅当集合T(S)W中是线性无关的. 因此, 在判断S是否线性无关时, 检视S还是T(S)是无关紧要的. 从中我们可以看出, 同构是"维数保持的", 也就是说对于V任意的有限维子空间, 其在T下的像有着相同的维数. 现在我们给出这个想法的一个非常简单的刻画. 设A是域F上的一个m×n矩阵, 实际上我们给过两种对于矩阵A的解空间的定义. 第一种是Fn中所有满足线性方程组AX=0的每个方程的n元组(x1,,xn)构成的集合. 第二种是所有满足AX=0n×1列矩阵X构成的集合. 第一种解空间是Fn的子空间, 第二种解空间是Fn×1的子空间. 实际上FnFn×1之间有一个显见的同构, 即(x1,,xn)[x1xn].在这个同构下, A的第一种解空间被映射至第二种解空间. 这两个空间有着相同的维数, 于是在证明关于解空间的维数的定理时, 选择那个空间来讨论是无关紧要的. 实际上, 读者或许并不会产生一点犹豫, 如果我们选择将FnFn×1视为等同的. 当方便的时候, 我们就会这么做, 而不方便的时候, 我们就不这么做.

练习1.V是复数集, 令F是实数域. 在通常的运算下, VF上的一个向量空间. 显式描述一个从该空间到2的同构.
练习2.V是复数域上的向量空间, 并设存在一个从V3的同构T. 令α1,α2,α3,α4V中向量, 满足Tα1=(1,0,i),Tα2=(2,1+i,0),Tα3=(1,1,1),Tα4=(2,i,3).
  1. α1α2α3张成的子空间中吗?
  2. W1α1α2张成的子空间, 令W2α3α4张成的子空间, 那么W1W2的交是什么呢?
  3. 找出一个这四个向量αj张成的V的子空间的基.
练习3.W是所有2×2的复Hermite矩阵构成的集合. 正如我们在第2章的例子6中所指出的, 在通常的运算下, W是一个实数域上的向量空间. 验证(x,y,z,t)[t+xy+izyiztx]是一个从4W的同构.
练习4. 表明Fm×n同构于Fmn.
练习5.V是复数集, 其可以被视为实数域上的向量空间 (练习1). 我们按照以下方式定义一个从V2×2实矩阵空间的函数T. 如果z=x+iy, 其中xy是实数, 那么T(z)=[x+7y5y10yx7y].
  1. 验证T是一个单射的(实)线性变换.
  2. 验证T(z1z2)=T(z1)T(z2).
  3. 你如何描述T的像?
练习6.VW是域F上的有限维向量空间. 证明VW同构当且仅当dimV=dimW.
练习7.VW是域F上的向量空间, U是一个从VW的同构. 证明TUTU1是一个从L(V,V)L(W,W)的同构.

第3.4节 通过矩阵表示变换

V是域F上的n维向量空间, 令W是域F上的m维向量空间. 令𝔅={α1,,αn}V的一个有序基, 令𝔅={β1,,βm}W的一个有序基. 如果T是任意的从VW的线性变换, 那么T由其施加于向量αj的作用决定. 每个向量Tαj皆可唯一地表示为βi的线性组合Tαj=i=1mAi,jβi其中A1,j,,Am,jTαj在有序基𝔅下的坐标. 于是, 变换T可由mn个标量Ai,j决定. 由A(i,j)=Ai,j定义的m×n矩阵A被称为T相对于有序基𝔅𝔅的矩阵. 我们即时的任务在于显式地理解矩阵A是如何决定线性变换T的.

如果α=x1α1++xnαnV中的一个向量, 那么Tα=T(j=1nxjαj)=j=1nxj(Tαj)=j=1nxji=1mAi,jβi=i=1m(j=1nAi,jxj)βi如果Xα在有序基𝔅下的坐标矩阵, 那么以上的计算表明AX是向量Tα在有序基𝔅下的坐标矩阵, 因为标量j=1nAi,jxj是列矩阵AXi行的元素. 让我们也观察到如果A是域F上任意的m×n矩阵, 那么T(j=1nxjαj)=i=1m(j=1nAi,jxj)βi定义了一个从VW的线性变换T, 并且其相对于𝔅𝔅的矩阵是A. 我们形式地总结如下:

定理11.V是域F上的n维向量空间, 令W是域F上的m维向量空间. 令𝔅={α1,,αn}V的一个有序基, 令𝔅={β1,,βm}W的一个有序基. 对于每个从VW的线性变换T, 存在一个域F上的m×n矩阵A满足[Tα]𝔅=A[α]𝔅对于每个V中向量α成立. 并且, TA是一个从所有从VW的线性变换构成的集合到所有域F上的m×n矩阵构成的集合的一一对应.

定理11中与T相关联着的矩阵A被称为T相对于有序基𝔅𝔅的矩阵. 注意到式子Tαj=i=1mAi,jβi是说矩阵A的列A1,,AnAj=[Tαj]𝔅,j=1,,n给出. 如果U是另一个从VW的线性变换, 并且B=[B1,,Bn]U相对于有序基𝔅𝔅的矩阵, 那么cA+BcT+U相对于有序基𝔅𝔅矩阵. 这是显然的, 因为cAj+Bj=c[Tαj]𝔅+[Uαj]𝔅=[cTαj+Uαj]𝔅=[(cT+U)αj]𝔅

定理12.V是域F上的n维向量空间, 令W是域F上的m维向量空间. 对于VW相应的每对有序基𝔅𝔅, 为线性变换T赋予其相对于𝔅𝔅的矩阵的函数是一个空间L(V,W)Fm×n之间的同构.
证明. 我们观察到这个函数是线性的 [译注: 就是上一段], 并且如定理11所言, 这个函数是L(V,W)Fm×n之间的双射.

我们将特别关心从一个空间到自身的线性变换的矩阵表示, 也就是线性算子的矩阵表示. 在这种情况下使用相同的基是方便的, 即取𝔅=𝔅. 我们将称这个表示矩阵为T相对于有序基𝔅的矩阵. 因为这个概念是如此重要, 以至于我们将重复这个定义. 如果T是有限维向量空间V上的一个线性算子而𝔅={α1,,αn}V的一个有序基, 那么T相对于𝔅的矩阵 (或者说, T在有序基𝔅下的矩阵) 是一个n×n矩阵A, 其元素Ai,j由式子Tαj=i=1nAi,jαi,j=1,,n定义. 读者必须记住这个表示T的矩阵依赖于有序基𝔅, 而V的每个有序基下都有一个T的表示矩阵. (如果是从一个空间V到另一个空间W的线性变换, 那就是依赖于两个有序基, 一个是V的有序基, 另一个是W的有序基.) 为了不忘记这个依赖关系, 我们将使用记号[T]𝔅表示线性算子T在有序基𝔅下的矩阵. 这个矩阵以及相关的有序基刻画T的方式在于对于每个V中的α[Tα]𝔅=[T]𝔅[α]𝔅.

例子13.V是域F上的n×1列矩阵构成的空间, 令W是域F上的m×1列矩阵构成的空间, 令A是域F上一个固定的m×n矩阵. 令T是一个从VW的线性变换, 由T(X)=AX定义. 令𝔅V的有序基, 其类似于Fn的标准有序基, 也就是说, 𝔅的第i个向量是n×1矩阵Xi, 其第i行是1, 而其他元素为0. 令𝔅W的有序基, 其定义方式与V的这个有序基类似. 那么, T相对于𝔅𝔅的矩阵就是A本身. 这是显然的, 因为矩阵AXj就是A的第j列.
例子14.F是一个域, 令TF2上的一个线性算子, 由T(x1x2)=(x1,0)定义. 令𝔅F2的标准有序基, 𝔅=(ε1,ε2). 既然Tε1=T(1,0)=(1,0)=1ε1+0ε2,Tε2=T(0,1)=(0,0)=0ε1+0ε2,那么T在有序基𝔅下的矩阵是[T]𝔅=[1000].
例子15.V是所有具有形式f(x)=c0+c1x+c2x2+c3x3的从的多项式函数构成的向量空间, 即次数小于等于三的多项式函数的空间. 例子2的微分算子D映射VV, 鉴于D是"降次的". 令𝔅V的有序基, 其由四个函数f1,f2,f3,f4构成, 通过fj(x)=xj1定义, 那么(Df1)(x)=0,Df1=0f1+0f2+0f3+0f4(Df2)(x)=1,Df2=1f1+0f2+0f3+0f4(Df3)(x)=2x,Df3=0f1+2f2+0f3+0f4(Df4)(x)=3x2,Df4=0f1+0f2+3f3+0f4于是D在有序基𝔅下的矩阵是[D]𝔅=[0100002000030000].

我们已经见过把变换相加时表示矩阵会怎么变化了, 即把矩阵相加. 现在我们想问把变换复合起来时会发生些什么. 更准确地说, 令V,W,Z是域F上相应维数为n,m,p的向量空间. 令T是一个从VW的线性变换, 令U是一个从WZ的线性变换. 设V,W,Z相应的有序基分别为𝔅={α1,,αn},𝔅={β1,,βm},𝔅={γ1,,γp}.AT相对于𝔅𝔅的矩阵, 令BU相对于𝔅𝔅的矩阵. 那么, 很容易看出来变换UT相对于𝔅𝔅的矩阵C就是BA的积. 这是因为, 如果αV中任意的向量, 那么[Tα]𝔅=A[α]𝔅,[U(Tα)]𝔅=B[Tα]𝔅于是[(UT)(α)]𝔅=(BA)[α]𝔅根据表示矩阵的定义和唯一性, 我们必有C=BA. 读者也可通过施行以下计算来看出这点.(UT)(αj)=U(Tαj)=U(k=1mAk,jβk)=k=1mAk,j(Uβk)=k=1mAk,ji=1pBi,kγi=i=1p(k=1mBi,kAk,j)γi于是我们必有Ci,j=k=1mBi,kAk,j.之前我们定义矩阵乘法的动机在于矩阵行上的操作. 这里我们看到线性变换的复合也提供了强烈的动机. 让我们形式化地总结一下这个结果.

定理13.V,W,Z是域F上的有限维向量空间. 令T是从VW的线性变换, U是从WZ的线性变换. 如果𝔅,𝔅,𝔅分别是V,W,Z的有序基, 如果AT相对于𝔅𝔅的矩阵, BU相对于𝔅𝔅的矩阵, 那么变换的复合UT相对于𝔅𝔅的矩阵是积C=BA.

注意到定理13给我们了一个矩阵乘法是结合运算的证明, 这个证明不需要计算, 并且独立于我们在第1章给出的证明. 我们还应该指出我们在例子10中证明了定理13的特殊情况. [译注: 原文是例子12, 疑似应该是例子10.]

如果TU是空间V上的线性算子, 并且我们以单一的有序基𝔅表示这两个变换, 那么定理13呈现出特别简单的形式[UT]𝔅=[U]𝔅[T]𝔅. 因此, 在这种情况下由𝔅所决定的算子和矩阵之间的对应不仅是向量空间的同构, 还保持乘法. 这个事实的一个简单推论是线性算子T可逆当且仅当矩阵[T]𝔅可逆. 这是因为恒等算子I在任意的有序基下都由恒等矩阵表示, 于是UT=TU=I等价于[U]𝔅[T]𝔅=[T]𝔅[U]𝔅=I.当然, T可逆时有[T1]𝔅=[T]𝔅1.

现在我们想要探究当有序基改变时表示矩阵会怎样变化. 为了简单起见, 我们将只考虑空间V上的线性算子, 于是我们可以只使用一个有序基. 我们想问的特定问题如下. 令T是有限维向量空间V上的一个线性算子, 并令𝔅={α1,,αn}𝔅={α1,,αn}V的两个有序基. 矩阵[T]𝔅[T]𝔅之间有什么联系呢? 正如我们在第2章所观察到的那样, 存在一个唯一的n×n(可逆)矩阵P满足对于每个V的向量α[α]𝔅=P[α]𝔅.这个矩阵即P=[P1,,Pn], 其中Pj=[αj]𝔅. 根据定义,[Tα]𝔅=[T]𝔅[α]𝔅.将坐标变换公式应用于Tα, 我们就得到[Tα]𝔅=P[Tα]𝔅.结合这三个式子, 我们有[T]𝔅P[α]𝔅=P[Tα]𝔅或是P1[T]𝔅P[α]𝔅=[Tα]𝔅因此就得到[T]𝔅=P1[T]𝔅P.这回答了我们的问题.

在形式化陈述这个结果之前, 让我们观察一下以下事实. 存在唯一的一个线性算子U将有序基𝔅映射成𝔅, 其由Uαj=αj,j=1,,n定义. 这个算子U是可逆的, 因为它将V的一个基映射至V的另一个基. 上面的矩阵P恰是U在有序基𝔅下的表示, 因为P是由αj=i=1nPi,jαi定义的, 既然Uαj=αj, 这个式子也可以写成Uαj=i=1nPi,jαi于是P=[U]𝔅, 根据定义.

定理14.V是一个域F上的有限维向量空间. 令𝔅={α1,,αn}𝔅={α1,,αn}V的有序基. 设TV上的一个线性算子. 如果P=[P1,,Pn]是一个以Pj=[αj]𝔅为列的n×n矩阵, 那么[T]𝔅=P1[T]𝔅P.或者说, 如果U是由Uαj=αj,j=1,,n定义的V上的可逆线性算子, 那么[T]𝔅=[U]𝔅1[T]𝔅[U]𝔅.
例子16.T2上由T(x1,x2)=(x1,0)定义的线性算子. 在例子14中我们表明T在标准有序基𝔅={ε1,ε2}下的矩阵是[T]𝔅=[1000].𝔅2的有序基, 其由向量ε1=(1,1)ε2=(2,1)构成, 那么ε1=ε1+ε2,ε2=2ε1+ε2于是P是矩阵P=[1211].根据简单的计算P1=[1211].因此[T]𝔅=P1[T]𝔅P=[1211][1000][1211]=[1211][1200]=[1212]我们很容易验证这是正确的, 因为Tε1=(1,0)=ε1+ε2,Tε2=(2,0)=2ε1+2ε2.
例子17.V是从的次数小于等于3的多项式函数构成的向量空间. 如例子15, 令DV上的微分算子, 并令𝔅={f1,f2,f3,f4}V的有序基, 其由fi(x)=xi1定义. 令t是一个实数, 定义gi(x)=(x+t)i1, 即g1=f1g2=tf1+f2g3=t2f1+2tf2+f3g4=t3f1+3t2f2+3tf3+f4既然矩阵P=[1tt2t3012t3t20013t0001]很容易看出来是可逆的, 并有P1=[1tt2t3012t3t20013t0001]从中我们得知𝔅={g1,g2,g3,g4}V的一个有序基. 在例子15里, 我们发现D在有序基𝔅下的矩阵为[D]𝔅=[0100002000030000].因此D相对于有序基𝔅的矩阵为P1[D]𝔅P=[1tt2t3012t3t20013t0001][0100002000030000][1tt2t3012t3t20013t0001]=[1tt2t3012t3t20013t0001][012t3t20026t00030000]=[0100002000030000]于是D在有序基𝔅𝔅下由相同的矩阵表示. 当然, 或许我们可以更直接地看出这点来, 因为Dg1=0,Dg2=g1,Dg3=2g2,Dg4=3g3.这个例子刻画了很好的一点. 如果读者已知一个线性算子在某个有序基𝔅下的矩阵, 并想要找出其在另一个有序基𝔅下的矩阵, 经常的情况是使用可逆矩阵P施行坐标变换是最方便的. 然而, 有时直接诉诸定义来寻找表示矩阵可能要简单得多.
定义.AB是域F上的n×n矩阵. 我们称BF上相似于A, 如果存在一个域F上的可逆矩阵P满足B=P1AP.

根据定理14, 我们知道: 如果V是一个域F上的n维向量空间而𝔅𝔅V的两个有序基, 那么对于每个V上的线性算子T, 矩阵B=[T]𝔅相似于矩阵A=[T]𝔅. 我们也可以从另一个方向看待这个事情. 设AB是域F上的n×n矩阵, 令𝔅V的一个有序基. 令TV上的线性算子, 其在基𝔅下由A表示. 如果B=P1AP, 令𝔅是经P𝔅得到的V的有序基, 即αj=i=1nPi,jαi,那么T在有序基𝔅下的矩阵就是B.

因此, 陈述B相似于A意味着在每个域F上的n维空间上, 矩阵AB在两个(可能)不同的有序基下表示着相同的线性变换.

注意到每个n×n矩阵A都相似于自身, 只需令P=I; 如果B相似于A, 那么A相似于B, 因为B=P1AP可以推出A=(P1)1BP1; 如果B相似于AC相似于B, 那么C相似于A, 因为B=P1APC=Q1BQ可以推出C=(PQ)1A(PQ). 因此, 相似性是域F上的n×n矩阵的集合上的一个等价关系. 读者还应该注意到唯一与恒等矩阵I相似的矩阵就是I本身, 唯一与零矩阵相似的矩阵就是零矩阵本身.

练习1.T2上由T(x1,x2)=(x1,x2)定义的线性算子. 令𝔅2的标准有序基而𝔅={α1,α2}是由α1=(1,i),α2=(i,2)定义的有序基.
  1. T相对于𝔅𝔅的矩阵是什么?
  2. T相对于𝔅𝔅的矩阵是什么?
  3. T在有序基𝔅下的矩阵是什么?
  4. T在有序基{α2,α1}下的矩阵是什么?
练习2.T是从32的线性变换, 其由T(x1,x2,x3)=(x1+x2,2x3x1)定义.
  1. 如果𝔅3的标准有序基而𝔅2的标准有序基, 那么T相对于𝔅𝔅的矩阵是什么?
  2. 如果𝔅={α1,α2,α3}𝔅=(β1,β2), 其中α1=(1,0,1),α2=(1,1,1),α3=(1,0,0),β1=(0,1),β2=(1,0)T相对于𝔅𝔅的矩阵是什么?
练习3.TFn上的线性算子, 令ATFn的标准基下的矩阵, 令W是由A的列向量张成的Fn的子空间. 请问WT有何关系?
练习4.V是域F上的一个二维向量空间, 令𝔅V的一个有序基. 如果TV上的一个线性算子, 并且[T]𝔅=[abcd]证明T2(a+d)T+(adbc)I=0.
练习5.T3上的线性算子, 其在标准有序基下的矩阵为A=[121011134].找出T的像的一个基和T的零空间的一个基.
练习6.T2上由T(x1,x2)=(x2,x1)定义的线性算子.
  1. T2的标准基下的矩阵是什么?
  2. T在有序基𝔅={α1,α2}下的矩阵是什么, 其中α1=(1,2)α2=(1,1)?
  3. 证明对于每个实数c, 算子(TcI)都是可逆的.
  4. 证明如果𝔅2任意的有序基并且[T]𝔅=A, 那么A1,2A2,10.
练习7.T3上的线性算子, 由T(x1,x2,x3)=(3x1+x3,2x1+x2,x1+2x2+4x3)定义.
  1. T3的标准有序基下的矩阵是什么?
  2. T在有序基{α1,α2,α3}下的矩阵是什么, 其中α1=(1,0,1),α2=(1,2,1),α3=(2,1,1)?
  3. 证明T是可逆的, 并如定义T一样给出T1的规则.
练习8.θ是一个实数. 证明以下两个矩阵在复数域上是相似的:[cosθsinθsinθcosθ],[eiθ00eiθ](提示: 令T2上的线性算子, 其在标准有序基下由第一个矩阵表示. 接着, 找出向量α1α2使得Tα1=eiθα1,Tα2=eiθα2并且{α1,α2}是一个基.)
练习9.V是域F上的一个有限维向量空间. 令STV上的线性算子. 我们问: 什么时候存在V的有序基𝔅𝔅使得[S]𝔅=[T]𝔅? 证明这样的基存在当且仅当存在一个V上的可逆线性算子U使得T=USU1. (证明大纲: 如果[S]𝔅=[T]𝔅, 令U是将𝔅映射成𝔅的线性算子, 然后表明S=UTU1. 反过来, 如果对于某个可逆的UT=USU1, 令𝔅V任意的有序基, 令𝔅是其在U下的像 [译注: 当然要保持顺序], 然后表明[S]𝔅=[T]𝔅.)
练习10. 我们已经知道由T(x1,x2)=(x1,0)定义的2上的线性算子T在标准有序基下由矩阵A=[1000]表示. 这个算子满足T2=T. 证明如果S是一个2上满足S2=S的线性算子, 那么S=0, 或者S=I, 或者存在2的一个有序基使得[S]𝔅=A.
练习11.W是域F上所有n×1矩阵构成的空间. 如果A是域F上的一个n×n矩阵, 那么A通过左乘定义了一个W上的线性算子LA: LA(X)=AX. 证明每个W上的线性算子都是左乘某个n×n矩阵, 即是对于某个矩阵A而言的LA.
现在设V是域F上的一个n维向量空间, 令𝔅V的一个有序基. 对于每个V中的α, 定义Uα=[α]𝔅. 证明U是一个从VW的线性算子. 如果T是一个V的线性算子, 那么UTU1是一个W上的线性算子. 于是, UTU1是一个左乘某个n×n矩阵A的变换, 那么A是什么呢?
练习12.V是域F上的一个n维向量空间, 令𝔅={α1,,αn}V的一个有序基.
  1. 根据定理1, 存在唯一的V上的线性算子T满足Tαj=αj+1,j=1,,n1,Tαn=0.T在有序基𝔅下的矩阵A是什么?
  2. 证明Tn=0但是Tn10.
  3. SV上任意的满足Sn=0但是Sn10的线性算子. 证明存在V的有序基𝔅使得S𝔅下的表示是a里的矩阵A.
  4. 证明如果MN是域F上满足Mn=Nn=0但是Mn10Nn10n×n矩阵, 那么MN是相似的.
练习13.VW是域F上的有限维向量空间. 令T是一个从VW的线性变换. 如果𝔅={α1,,αn}𝔅={β1,,βm}分别是VW的有序基, 如定理5的证明一样定义线性变换Ep,q: Ep,q(αi)=δi,qβp, 那么Ep,q,1pm,1qn构成了L(V,W)的一个基, 并且对于特定的标量Ap,qT=p=1mq=1nAp,qEp,q.Ap,qT在这个L(V,W)的基下的坐标. 证明以A(p,q)=Ap,q为元素的矩阵A就恰是T相对于𝔅𝔅的表示矩阵.

第3.5节 线性泛函

如果V是一个域F上的向量空间, 那么从V到标量域F的线性变换f也被称为V上的线性泛函. 如果我们从头开始, 那么这意味着f是一个从VF的函数, 并且满足f(cα+β)=cf(α)+f(β)对于所有V中的αβ以及所有F中的标量c成立. 线性泛函这个概念的重要性在于它有助于组织和澄清关于子空间, 线性方程和坐标的讨论.

例子18.F是一个域而a1,,anF中标量, 我们根据f(x1,,xn)=a1x1++anxn定义一个Fn上的函数f, 那么fFn上的一个线性泛函. 它是这样的泛函, 其在Fn的标准有序基和F的基{1}下由矩阵[a1an]表示:aj=f(εj),j=1,,n.[译注: 其实{1}就是F的标准有序基.] 每个Fn上的线性泛函都具有这种形式, 对于某些标量a1,,an而言. 这是由线性泛函的定义立即得到的, 因为如果我们定义aj=f(εj)并使用线性性质, 那么f(x1,,xn)=f(j=1nxjεj)=j=1nxjf(εj)=j=1najxj
例子19. 这里给出一个线性泛函的重要例子. 令n是一个正整数而F是一个域, 如果A是一个以F中标量为元素的n×n矩阵, 那么A的迹是标量tr(A)=A1,1+A2,2++An,n.迹函数是一个矩阵空间Fn×n上的线性泛函, 因为tr(cA+B)=i=1n(cAi,i+Bi,i)=ci=1nAi,i+i=1nBi,i=ctr(A)+tr(B)
例子20.V是所有从域F到自身的多项式函数构成的空间. 令tF的一个元素. 如果我们定义Lt(p)=p(t)那么Lt是一个V上的线性泛函. 人们经常这样描述这个泛函, 对于每个t, "在t处求值"是一个多项式函数空间上的线性泛函. 或许我们应该指出, 在这个例子里多项式函数实际上并不发挥任何作用, 对于所有从FF的函数构成的空间, 在t处求值同样也是一个线性泛函.
例子21. 这或许是数学中最重要的线性泛函. 令[a,b]是实轴上的一个闭区间, C([a,b])[a,b]上的连续实值函数构成的空间, 那么L(g)=abg(t)dt定义了一个C([a,b])上的线性泛函L.

如果V是一个向量空间, 那么所有V上的线性泛函自然地构成了一个向量空间, 此即L(V,F), 我们记作V并将其称为V的对偶空间:V=L(V,F).

如果V是有限维的, 那么我们可以得到一个对于对偶空间V相当显式的描述. 从定理5我们知道了一件关于V的事情, 即dimV=dimV.𝔅={α1,,αn}V的一个基. 根据定理1, (对于每个i)存在唯一的V上的线性泛函fi满足fi(αj)=δi,j.用这种方法我们从𝔅得到了n个不同的V上的线性泛函f1,,fn. 这些泛函也是线性无关的, 因为若设f=i=1ncifi那么f(αj)=i=1ncifi(αj)=i=1nciδi,j=cj特别地, 如果f是零泛函, 那么对于每个jf(αj)=0, 因此标量cj都是0. 现在f1,,fnn个线性无关的泛函, 而且我们知道V的维数是n, 那么𝔅={f1,,fn}必然是V的一个基, 其被称为𝔅的对偶基.

定理15.V是域F上的一个有限维向量空间, 令𝔅={α1,,αn}V的一个基. 那么, 存在唯一的V的对偶基𝔅={f1,,fn}, 其满足fi(αj)=δi,j. 对于每个V上的线性泛函f, 我们有f=i=1nf(αi)fi以及对于每个V中的α, 我们有α=i=1nfi(α)αi.
证明. 上面我们已经说明了存在唯一的基与𝔅"对偶". 如果f是一个V上的线性泛函, 那么f即是fi的某个线性组合, 并且我们观察到标量cj必然由cj=f(αj)给出. 类似地, 如果α=i=1nxiαiV的一个向量, 那么fj(α)=i=1nxifj(αi)=i=1nxiδi,j=xj因此α作为αi的线性组合的唯一表达为α=i=1nfi(α)αi.

上面这个式子给我们提供了一种刻画对偶基的绝佳方式. 它是说, 如果𝔅={α1,,αn}V的一个有序基, 并且𝔅={f1,,fn}是其对偶基, 那么fi就恰是那个赋予V中的向量α相对于有序基𝔅的第i个坐标的函数. 因此, 我们也可以将fi称为𝔅的坐标函数. 定理15实际上告诉了我们以下事实: 如果fV中而令f(αi)=ai, 那么当α=x1α1++xnαn时, 我们有f(α)=a1x1++anxn.换言之, 如果我们选定了V的一个有序基𝔅并描述V中的每个向量以其相对于𝔅n元坐标组(x1,,xn), 那么每个V上的线性泛函都具有f(α)=a1x1++anxn的形式. 这是例子18的自然泛化, 其为V=Fn𝔅={ε1,,εn}的特别情形.

例子22.V是所有从的次数小于等于2的多项式函数构成的向量空间, 令t1,t2,t3是三个不同的实数, 令Li(p)=p(ti).那么, L1,L2,L3V上的线性泛函. 这些线性泛函是线性无关的, 因为若设L=c1L1+c2L2+c3L3L=0时, 即对于每个V中的p都有L(p)=0, 那么应用L于特定的多项式"函数"1,x,x2, 我们就得到{c1+c2+c3=0t1c1+t2c2+t3c3=0t12c1+t22c2+t32c3=0从中我们得到c1=c2=c3=0, 因为(根据简单的计算可知)矩阵[111t1t2t3t12t22t32]t1,t2,t3互异时是可逆的. 既然Li是线性无关的并且V的维数是3, 这些泛函构成了V的一个基. 它是什么V的基的对偶呢? 这样一个V的基{p1,p2,p3}必然满足Li(pj)=δi,j或者说pj(ti)=δi,j.很容易看出这些多项式函数应该是p1(x)=(xt2)(xt3)(t1t2)(t1t3),p2(x)=(xt1)(xt3)(t2t1)(t2t3),p3(x)=(xt1)(xt2)(t3t1)(t3t2).V的基{p1,p2,p3}是有趣的, 因为根据定理15, 对于每个V中的p我们有p=p(t1)p1+p(t2)p2+p(t3)p3.因此, 如果c1,c2,c3是任意的实数, 那么恰存在唯一的上的次数至多为2的多项式函数p满足p(tj)=cj,j=1,2,3. 这个多项式函数为p=c1p1+c2p2+c3p3.

现在让我们来讨论线性泛函和子空间之间的关系. 如果f是一个非零的线性泛函, 那么f的秩就是1, 因为其像是标量域的非零子空间, 必然是标量域本身. 如果潜在的空间V是有限维的, 那么秩加零化度定理 (定理2) 告诉我们零空间Nf的维数dimNf=dimV1.

在一个n维空间中, 具有n1维的子空间被称为超空间. 这样的空间有时也被称为超平面或者余维数为1的子空间. 每个超空间都是某个线性泛函的零空间吗? 答案很容易看出来是yes. 而且, 证明以下事实也并不更加困难. n维空间的每个d维子空间都是(nd)个线性泛函的零空间之交. (下面的定理16)

定义. 如果V是域F上的向量空间而SV的一个子集, S的零化子S0V上所有这样的线性泛函f构成的集合, 其对于每个S中的αf(α)=0.

读者应该很容易看出S0V的子空间, 不论S是否是V的子空间. 如果S仅包含零向量, 那么S0=V. 如果S=V, 那么S0V的零子空间. (在V是有限维的情况下很容易看出来.)

定理16.V是域F上的有限维向量空间, 令WV的子空间, 那么dimW+dimW0=dimV.
证明.kW的维数而{α1,,αk}W的一个基. 选择V中向量αk+1,,αn使得{α1,,αn}V的一个基. 令{f1,,fn}V的基, 其对偶于这个V的基. 我们现在证明{fk+1,,fn}是零化子W0的一个基. 显然对于ik+1我们知道fi属于W0, 因为fi(αj)=δi,j于是当ik+1jk时有δi,j=0. 从中我们可知当αα1,,αk的线性组合时, 对于ik+1fi(α)=0. 因为泛函{fk+1,,fn}是线性无关的, 所以剩下来我们必须要做的就是证明它们可以张成W0. 设fV中, 既然f=i=1nf(αi)fi,于是若fW0中, 我们有f(αi)=0对于ik成立, 那么f=i=k+1nf(αi)fi.我们证明了如果dimW=kdimV=n, 那么dimW0=nk.
推论. 如果Wn维向量空间Vk维子空间, 那么WV(nk)个超空间之交.
证明. 这是定理16证明的推论而不是定理16本身的推论. 在这个证明的记号下, W恰是满足fi(α)=0,i=k+1,,n的所有向量α的集合. 在k=n1的情形, W即是fn的零空间.
推论. 如果W1W2是某个有限维向量空间的子空间, 那么W1=W2当且仅当W10=W20.
证明. 如果W1=W2, 那么显然有W10=W20. 如果W1W2, 那么其中之一的子空间包含有不在另一个子空间的向量. 不妨设向量αW2之中但不在W1中. 根据前面的推论 (或者定理16的证明), 存在一个线性泛函f满足对于所有的W1βf(β)=0f(α)0, 那么fW10之中但不在W20中, 即W10W20.

接下来的一节我们将给出这两个推论的不同的证明. 第一个推论是说, 如果我们挑选了空间的某个有序基, 那么每个k维的子空间都可以由(nk)个相对于基的坐标上的齐次线性条件刻画.

让我们从线性泛函的视角简要看看齐次线性方程组. 设我们有一个想要求解的齐次线性方程组{A1,1x1++A1,nxn=0Am,1x1++Am,nxn=0如果我们令fi,i=1,,m是由fi(x1,,xn)=Ai,1x1++Ai,nxn定义的Fn上的线性泛函, 那么其实我们就是在寻找一个Fn的子空间, 其由所有满足fi(α)=0,i=1,,mα构成. 换言之, 我们在寻找被f1,,fm零化的子空间. 对于系数矩阵进行行规约为我们提供了找出这个子空间的系统方法. n元组(Ai,1,,Ai,n)给出了线性泛函fi相对于与Fn的标准基对偶的基的坐标. 系数矩阵的行空间因此可被视为由f1,,fm张成的线性泛函的空间, 而解空间是被这个泛函的空间零化的子空间.

现在我们或许可以从"对偶"的角度看待线性方程组, 即给定Fn中的m个向量αi=(Ai,1,,Ai,n)我们希望寻找由这些向量张成的子空间的零化子. 既然Fn上一个典型的线性泛函具有形式f(x1,,xn)=c1x1++cnxn那么f在这个零化子之中的条件即j=1nAi,jcj=0,i=1,,m换言之, (c1,,cn)是线性方程组AX=0的一个解. 从此观点来看, 行规约为我们提供了一种系统性的方法来寻找由给定的Fn的有限子集张成的子空间的零化子.

例子23. 现在我们给出4上的三个线性泛函:f1(x1,x2,x3,x4)=x1+2x2+2x3+x4f2(x1,x2,x3,x4)=2x2+x4f3(x1,x2,x3,x4)=2x14x3+3x4它们所零化的子空间可以通过显式寻找矩阵A=[122102012043]的行简化阶梯形式得到. 经过简单的计算, 或者看看第2章的例子21, 我们知道R=[102001000001].因此, 线性泛函g1(x1,x2,x3,x4)=x1+2x3g2(x1,x2,x3,x4)=x2g3(x1,x2,x3,x4)=x4f1,f2,f3张成了相同的(4)的子空间, 并且零化了相同的4的子空间. 被零化的子空间由所有满足x1=2x3,x2=x4=0的向量构成.
例子24.W是由α1=(2,2,3,4,1),α2=(1,1,2,5,2),α3=(0,0,1,2,3),α4=(1,1,2,3,0)张成的5的子空间. 人们该如何描述W0, 即W的零化子呢? 让我们构造一个以α1,α2,α3,α4为行向量的矩阵A, 并找出行等价于A的行简化阶梯矩阵R:A=[22341112520012311230]R=[11010001200000100000].如果f5上的一个线性泛函:f(x1,,x5)=j=15cjxj那么fW0中当且仅当f(αi)=0,i=1,2,3,4, 即当且仅当j=15Ai,jcj=0,1i4.这等价于j=15Ri,jcj=0,1i3或者c1c2c4=0c3+2c4=0c5=0我们可以通过给c2c4赋任意的值以得到所有这样的线性泛函f, 例如令c2=ac4=b, 然后找出相应的c1=a+b,c3=2b,c5=0. 于是, W0由所有具有形式f(x1,x2,x3,x4,x5)=(a+b)x1+ax22bx3+bx4的线性泛函f构成. W0的维数是2, 而W0的一个基{f1,f2}可由先令a=1,b=0再令a=0,b=1得到:f1(x1,,x5)=x1+x2f2(x1,,x5)=x12x3+x4上面W0中一般的ff=af1+bf2.
练习1.3中, 令α1=(1,0,1),α2=(0,1,2),α3=(1,1,0).
  1. 如果f3上满足f(α1)=1,f(α2)=1,f(α3)=3的线性泛函, 并且α=(a,b,c), 找出f(α).
  2. 显式描述3上满足f(α1)=f(α2)=0但是f(α3)0的线性泛函f.
  3. f是任意的满足f(α1)=f(α2)=0并且f(α3)0的线性泛函. 如果α=(2,3,1), 表明f(α)0.
练习2.𝔅={α1,α2,α3}3的基, 其由α1=(1,0,1),α2=(1,1,1),α3=(2,2,0)定义. 找出𝔅的对偶基.
练习3. 如果AB是域F上的n×n矩阵, 证明trace(AB)=trace(BA), 接着证明相似矩阵有着相同的迹.
练习4.V是从的所有次数小于等于2的多项式函数p:p(x)=c0+c1x+c2x2构成的向量空间. 定义三个V上的线性泛函如下:f1(p)=01p(x)dx,f2(p)=02p(x)dx,f3(p)=01p(x)dx.证明{f1,f2,f3}V的基, 通过找出以其为对偶的V的基.
练习5. 如果ABn×n的复矩阵, 证明ABBA=I是不可能的.
练习6.mn是正整数而F是一个域. 令f1,,fmFn上的线性泛函. 对于Fn中的α, 定义Tα=(f1(α),,fm(α)).证明T是一个从FnFm的线性变换, 接着表明每个从FnFm的线性变换都具有以上形式, 对于特定的f1,,fm而言.
练习7.α1=(1,0,1,2)α2=(2,3,1,1), 令Wα1α2张成的4的子空间. 哪些线性泛函f:f(x1,x2,x3,x4)=c1x1+c2x2+c3x3+c4x4W的零化子之中呢?
练习8.W5的子空间, 其由下列向量张成:α1=ε1+2ε2+ε3,α2=ε2+3ε3+3ε4+ε5,α3=ε1+4ε2+6ε3+4ε4+ε5.找出W0的一个基.
练习9.V是实数域上的所有2×2矩阵的向量空间, 令B=[2211].WV的子空间, 其由所有满足AB=0的矩阵A构成. 令fV上的线性泛函, 其在W的零化子之中. 设f(I)=0f(C)=3, 其中I2×2的恒等矩阵而C=[0001].找出f(B).
练习10.F是复数域的一个子域. 我们通过fk(x1,,xn)=j=1n(kj)xj,1kn定义Fn上的n个线性泛函, 其中n2. 由f1,,fn零化的子空间维数是多少呢?
练习11.W1W2是有限维向量空间V的子空间.
  1. 证明(W1+W2)0=W10W20.
  2. 证明(W1W2)0=W10+W20.
练习12.V是域F上的一个有限维向量空间. 令WV的一个子空间. 如果fW上的线性泛函, 证明存在一个V上的线性泛函g满足对于每个W中的αg(α)=f(α).
练习13.F是复数域的一个子域. 令V是域F上任意的向量空间. 设fgV上的线性泛函, 并且满足由h(α)=f(α)g(α)定义的函数h仍然是V上的线性泛函. 证明f=0g=0.
练习14.F是特征为零的域. 令V是域F上的一个有限维向量空间. 如果α1,,αmV中有限多个向量, 并且每个都异于零向量, 证明存在V上的线性泛函f满足f(αi)0,i=1,,m.
练习15. 根据练习3, 相似的矩阵拥有相同的迹. 因此, 我们可以将有限维空间上的线性算子的迹定义为其在任意有序基下的矩阵的迹. 这是良定的, 因为所有这样的表示矩阵都是相似的.
现在令V是域F上的2×2矩阵的向量空间, 令P是一个固定的2×2矩阵. 令T是由T(A)=PA定义的V上的线性算子. 证明trace(T)=2trace(P).
练习16. 证明n×n矩阵上的迹泛函在以下意义上唯一. 如果W是域F上的n×n矩阵的空间, 如果fW上满足对于W中的每个ABf(AB)=f(BA)的线性泛函, 那么f是迹函数的标量倍数. 另外, 如果f(I)=n, 那么f就是迹函数.
练习17.W是域F上的n×n矩阵的空间. 令W0是由所有具有形式C=ABBA的矩阵C张成的子空间. 证明W0恰好就是迹为零的矩阵构成的子空间. (提示: 迹为零的矩阵的空间的维数是什么? 使用矩阵"单元", 即恰具有一个非零元素的矩阵, 来构造足够多具有ABBA形式的线性无关的矩阵.)

第3.6节 二次对偶

上一节我们还有一个没有回答的问题, 即是否每个V的基都是某个V的基的对偶. 一种回答这个问题的方式是考虑V⁎⁎, 即V的对偶空间.

如果αV中的一个向量, 那么α导出了一个V上的线性泛函, 即Lα(f)=f(α),fV.Lα是线性的这一事实不过就是对于V中的线性泛函的定义的重述:Lα(cf+g)=(cf+g)(α)=(cf)(α)+g(α)=cf(α)+g(α)=cLα(f)+Lα(g)如果V是有限维的并且α0, 那么Lα0. 换言之, 存在线性泛函f满足f(α)0. 证明非常简单, 在第3.5节已经给过了: 选择一个V的有序基𝔅={α1,,αn}, 其中α1=α, 令f是赋予每个V中向量其在有序基𝔅下的坐标的第一分量的线性泛函. [译注: 换句话说, f即满足f(α1)=1f(αi)=0,2in的存在且唯一的那个线性泛函.]

定理17.V是域F上的一个有限维向量空间. 对于每个V中的向量α, 定义Lα(f)=f(α),fV.映射αLα是一个从VV⁎⁎的同构.
证明. 我们已经证明过对于每个α函数Lα是线性的了. 设αβV中而cF中, 令γ=cα+β, 那么对于V中的每个fLγ(f)=f(γ)=f(cα+β)=cf(α)+f(β)=cLα(f)+Lβ(f)=(cLα+Lβ)(f)于是Lγ=cLα+Lβ.这表明映射αLα是一个从VV⁎⁎的线性变换. 这个变换是非奇异的, 因为根据之前的评注, Lα=0当且仅当α=0. 既然αLα是从VV⁎⁎的非奇异的线性变换, 并且dimV⁎⁎=dimV=dimV定理9告诉我们这个变换是可逆的, 因而是一个从VV⁎⁎的同构.
推论.V是域F上的一个有限维向量空间. 如果LV的对偶空间V上的一个线性泛函, 那么V中存在唯一的向量α满足L(f)=f(α)对于V中的每个f成立.
推论.V是域F上的一个有限维向量空间. 每个V的基都是某个V的基的对偶.
证明.𝔅={f1,,fn}V的一个基. 根据定理15, 存在V⁎⁎的一个基{L1,,Ln}满足Li(fj)=δi,j.使用上面的推论, 对于每个i存在V中唯一的向量αi满足Li(f)=f(αi)对于V中的每个f成立, 即Li=Lαi. 立刻就能得到{α1,,αn}V的一个基, 并且𝔅是这个基的对偶.

在定理17的观点下, 我们通常将αLα视为等同的, 并称V"是"V的对偶空间或者说空间VV自然地相互对偶. 上面的推论中, 我们描述了该定理是怎样可能有用的. 下面我们给出更进一步的刻画.

如果EV的一个子集, 那么零化子E0(从技术上说)是V⁎⁎的一个子集. 如果我们选择如定理17那样将VV⁎⁎视为等同的, 那么E0是一个V的一个子空间, 即所有满足对于每个E中的ff(α)=0V中向量α构成的集合. 在定理16的一个推论中我们注意到每个子空间W是由其零化子W0决定的. 然而是怎样决定的呢? 答案是W是被所有W0中的f零化的子空间 [译注: 这个也是定理16的推论], 即所有W0中的f的零空间之交. 在我们现有的零化子的记号下, 这个定理可以被简单地陈述为: W=(W0)0.

定理18. 如果S是有限维向量空间V的子集, 那么(S0)0是由S张成的子空间.
证明.W是由S张成的子空间. 显然W0=S0. 因此, 我们要证明的是W=W00. 我们已经给出了一个证明, 现在我们给出另一个. 根据定理16, 我们有dimW+dimW0=dimV,dimW0+dimW00=dimV既然dimV=dimV, 于是dimW=dimW00.因为WW00的子空间, 所以我们知道W=W00.

本节的结果对于任意的向量空间也是成立的. 然而, 证明就需要使用所谓的选择公理 (Axiom of Choice). 我们想避免被卷入对于这个公理的冗长讨论之中, 所以我们不会对于一般的向量空间处理零化子的结果. 然而, 有两个关于一般向量空间上的线性泛函的结果是如此基本, 以至于我们要涵盖它们.

V是一个向量空间. 我们想要定义V中的超空间. 除非V是有限维的, 否则我们不能通过维数来定义超空间. 但是, 我们可以用以下的方式来表达一个空间N差一个维度就能填满V的想法:

  1. NV的一个真子空间;
  2. 如果W是一个包含N的子空间, 那么要么W=N要么W=V.
条件1和2表达了N是一个真子空间并且没有更大的真子空间, 换言之, N是极大的真子空间.

定义. 如果V是一个向量空间, 那么V中的一个超空间就是V的一个极大的真子空间.
定理19. 如果f是向量空间V上的一个非零的线性泛函, 那么f的零空间就是V中的一个超空间. 反过来说, 每个V中的超空间都是某个V上(并不唯一的)非零的线性泛函的零空间.
证明.fV上一个非零的线性泛函, 并且Nf是其零空间. 我们令α是一个不在Nf中的V的向量, 即一个满足f(α)0的向量. 我们将证明V中的每个向量都在Nfα张成的子空间之中. 这个子空间由所有具有形式γ+cα,γNf,cF的向量构成. 令βV中的向量, 定义c=f(β)f(α)这个定义是合理的, 因为f(α)0. 那么, γ=βcαNf之中, 因为f(γ)=f(βcα)=f(β)cf(α)=0于是β在由Nfα张成的子空间中.
现在令NV中的一个超空间. 固定α为某个不在N中的向量. 既然N是极大的真子空间, 那么由Nα张成的子空间就是整个空间V. 因此, 每个V中的向量β都具有形式β=γ+cα,γN,cF.向量γ和标量c是由β唯一确定的. 如果我们也有β=γ+cα,γN,cF,那么(cc)α=γγ.如果cc0, 那么α就应该在N中了, 因而有c=cγ=γ. 另一种表述这个结论的方式如下: 如果βV中, 那么存在唯一的标量c使得βcαN中. 称这个标量为g(β). 很容易看出来gV上的一个线性泛函并且Ng的零空间.
引理. 如果fg是一个向量空间V上的线性泛函, 那么gf的标量倍数当且仅当g的零空间包含f的零空间, 即当且仅当f(α)=0可以推出g(α)=0.
证明. 如果f=0, 那么也有g=0, g平凡地是f的标量倍数. 设f0, 于是其零空间NfV中的一个超空间. 选择V中的某个向量α使得f(α)0, 并且令c=g(α)f(α).线性泛函h=gcfNf上是0, 因为fg在其上都是0. 并且, 我们还有h(α)=g(α)cf(α)=0. 因此, h在由Nfα张成的子空间上都是0, 而这个子空间就是V. 于是, 我们得出结论h=0, 即g=cf.
定理20.g,f1,,fr是向量空间V上的线性泛函, 设其相应的零空间分别为N,N1,,Nr. 那么, gf1,,fr的线性组合当且仅当 (if and only if) N包含交集N1Nr.
证明. 如果g=c1f1++crfr且对于每个ifi(α)=0, 那么显然g(α)=0. 因此, N包含N,N1,,Nr.
我们将通过数字r上的归纳证明另一个方向 (定理的"if"一半). 之前的引理处理了r=1的情况. 设我们已知结果对于r=k1成立, 并且令f1,,fk是分别以N1,,Nk为零空间的线性泛函, 满足N1NkN的子集, Ng的零空间. 令g,f1,,fk1分别是g,f1,,fk1于子空间Nk上的限制, 那么g,f1,,fk1是向量空间Nk上的线性泛函. 而且, 如果α是一个Nk中的向量并有fi(α)=0,i=1,,k1, 那么αN1Nk之中, 因而有g(α)=0. 根据归纳 (r=k1的情形), 存在标量ci满足g=c1f1++ck1fk1.现在令h=gi=1k1cifi,那么h是一个V上的线性泛函, 并且h的定义告诉我们对于每个Nk中的αh(α)=0. 根据之前的引理, hfk的一个标量倍数. 如果h=ckfk, 那么g=i=1kcifi.
练习1.n是一个正整数而F是一个域. 令WFn中所有满足x1++xn=0(x1,,xn)构成的集合.
  1. 证明W0由所有具有形式f(x1,,xn)=cj=1nxj的线性泛函f构成.
  2. 证明W的对偶空间W可被"自然地"等同为Fn上所有满足c1++cn=0的线性泛函f(x1,,xn)=c1x1++cnxn构成的集合.
练习2. 运用定理20来证明以下事实. 如果W是一个有限维向量空间V的子空间, 并且如果{g1,,gr}W0任意的基, 那么W=i=1rNgi.
练习3.S是一个集合, F是一个域, 以及V(S;F)是所有从SF的函数构成的空间:(f+g)(x)=f(x)+g(x),(cf)(x)=cf(x).WV(S;F)任意的n维子空间. 证明存在S中的点x1,,xnW中的函数f1,,fn满足fi(xj)=δi,j.

第3.7节 线性变换的转置

设我们有两个域F上的向量空间VW, 以及一个从VW的线性变换T, 那么T按照以下方式导出了一个从WV的线性变换. 设gW上的一个线性泛函, 对于每个V中的α, 令f(α)=g(Tα)那么这就定义了一个从VF的函数f, 即T (一个从VW的函数) 与g (一个从WF的函数) 相复合. 既然Tg都是线性的, 那么定理6告诉我们f也是线性的, 即f是一个V上的线性泛函. 因此, T给我们提供了一个规则Tt, 其为每个W上的线性泛函g赋一个V上的线性泛函f=Ttg, 如上面的式子所定义的那样. 读者也应该注意到Tt实际上是一个从WV的线性变换, 因为如果g1g2W中而c是一个标量, 那么[Tt(cg1+g2)](α)=(cg1+g2)(Tα)=cg1(Tα)+g2(Tα)=c(Ttg1)(α)+(Ttg2)(α)于是Tt(cg1+g2)=cTtg1+Ttg2. 让我们总结一下.

定理21.VW是域F上的向量空间. 对于每个从VW的线性变换, 存在唯一的从WV的线性变换Tt满足(Ttg)(α)=g(Tα)对于每个W中的gV中的α成立.

我们将称TtT转置. 这个变换Tt也常被称作T的伴随. 然而, 我们不会使用这个术语.

定理22.VW是域F上的向量空间, T是一个从VW的线性变换. Tt的零空间是T的像的零化子. 如果VW是有限维的, 那么
  1. rank(Tt)=rank(T);
  2. Tt的像是T的零空间的零化子.
证明. 如果gW中, 那么根据定义有(Ttg)(α)=g(Tα)对于每个V中的α成立. gTt的零空间之中的意思是对于每个V中的αg(Tα)=0. 因此, Tt的零空间就恰是T的像的零化子.
VW是有限维的, 比如说dimV=ndimW=m. 对于i: 令rT的秩, 即T的像的维数. 根据定理16, T的像的零化子的维数是(mr). 根据这个定理的第一条陈述, 我们知道Tt的零化度必然是(mr). 但是如果这样的话, 既然Tt是一个m维空间上的线性变换, 那么Tt的秩就应该是m(mr)=r, 于是TTt有着相同的秩. 对于ii: 令NT的零空间. 每个Tt的像之中的线性泛函都在N的零化子之中, 因为若设对于某个W中的gf=Ttg, 那么如果αN中, 有f(α)=(Ttg)(α)=g(Tα)=g(0)=0.现在我们知道Tt的像是空间N0的一个子空间, 并且dimN0=ndimN=rank(T)=rank(Tt)于是Tt的像必然就恰是N0.
定理23.VW是域F上的有限维向量空间. 令𝔅V的一个有序基, 其对偶基是𝔅. 令𝔅W的一个有序基, 其对偶基是𝔅. 令T是一个从VW的线性变换, 令AT相对于𝔅𝔅的矩阵. 令BTt相对于𝔅𝔅的矩阵, 那么Bi,j=Aj,i.
证明.𝔅={α1,,αn},𝔅={β1,,βm},𝔅={f1,,fn},𝔅={g1,,gm}.根据定义,Tαj=i=1mAi,jβi,j=1,,n,Ttgj=i=1nBi,jfi,j=1,,m.另一方面,(Ttgj)(αi)=gj(Tαi)=gj(k=1mAk,iβk)=k=1mAk,igj(βk)=k=1mAk,iδj,k=Aj,i对于V上任意的线性泛函f我们有f=i=1nf(αi)fi.如果我们将此公式应用于泛函f=Ttgj并运用(Ttgj)(αi)=Aj,i的事实, 那么我们有Ttgj=i=1nAj,ifi从中立即可以得出Bi,j=Aj,i.
定义. 如果A是域F上的一个m×n矩阵, 那么A的转置At是由Ai,jt=Aj,i定义的n×m矩阵.

定理23是说如果T是一个从VW的线性变换, 其在某对有序基下的矩阵是A, 那么转置变换Tt在与之对偶的一对有序基下由转置矩阵At表示.

定理24.A是域F上任意的m×n矩阵, 那么A的行秩等于A的列秩.
证明.𝔅Fn的标准有序基, 𝔅Fm的标准有序基. 令T是从FnFm的线性变换, 其相对于𝔅𝔅的矩阵是A, 即T(x1,,xn)=(y1,,ym)其中yi=j=1nAi,jxj.A的列秩等于变换T的秩, 因为T的像由所有这样的m元组构成, 其是A的列向量的线性组合. [译注: 在同构的意义下]
相对于对偶基𝔅𝔅, 转置变换Tt由矩阵At表示. 既然At的列即A的行, 以相同的推理我们看出A的行秩 (At的列秩) 等于Tt的秩. 根据定理22, TTt有着相同的秩, 因此A的行秩等于A的列秩.

现在我们知道如果A是一个域Fm×n矩阵而T是一个按照以上方式定义的从FnFm的线性变换, 那么rank(T)=row-rank(A)=column-rank(A).我们将简单地称这个数字为A的秩.

例子25. 这个例子是一般性质的——与其说是例子, 不如说是讨论. 令V是域F上的一个n维向量空间, 令TV上的一个线性变换. 设𝔅={α1,,αn}V的一个有序基. T在有序基𝔅下的矩阵被定义为n×n矩阵A, 即Tαj=i=1nAi,jαi.换言之, Ai,j是向量Tαj在有序基𝔅下的第i个坐标. 如果{f1,,fn}𝔅的对偶基的话, 这可以被简单地陈述为Ai,j=fi(Tαj).让我们看看若改变基会发生什么. 设𝔅={α1,,αn}V的另一个有序基, 其对偶基是{f1,,fn}. 如果BT在有序基𝔅下的矩阵, 那么Bi,j=fi(Tαj).U是满足Uαj=αj的可逆线性算子, 那么U的转置由Utfi=fi给出. 读者很容易验证如果U是可逆的, 那么Ut(Ut)1=(U1)t也是可逆的. 因此, fi=(U1)tfi,i=1,,n. 于是,Bi,j=fi(Tαj)=[(U1)tfi](Tαj)=fi(U1Tαj)=fi(U1TUαj)那么这说明了什么呢? 嗯, fi(U1TUαj)U1TU在有序基𝔅下的矩阵的第ij列元素. 上面的计算表明这个标量也是T在有序基𝔅下的第ij列元素. 换句话说,[T]𝔅=[U1TU]𝔅=[U1]𝔅[T]𝔅[U]𝔅=[U]𝔅1[T]𝔅[U]𝔅而这恰好就是我们之前推导出来的基变换公式.
练习1.F是一个域, 令fF2上由f(x1,x2)=ax1+bx2定义的线性泛函. 对于以下的每个线性算子T, 令g=Ttf, 找出g(x1,x2).
  1. T(x1,x2)=(x1,0);
  2. T(x1,x2)=(x2,x1);
  3. T(x1,x2)=(x1x2,x1+x2).
练习2.V是实数域上的多项式函数的向量空间. 令ab是固定的实数, 令fV上由f(p)=abp(x)dx定义的线性泛函. 如果DV上的微分算子, 那么Dtf是什么呢?
练习3.A是域Fn×n矩阵的向量空间, 令B是一个固定的n×n矩阵. 如果TV上由T(A)=ABBA定义的线性算子, f是迹函数, 那么Ttf是什么呢?
练习4.V是域F上的一个有限维向量空间, 令TV上的一个线性算子. 令c是一个标量, 设V中存在非零的向量α使得Tα=cα. 证明V上存在一个非零的线性泛函f使得Ttf=cf.
练习5.A上的m×n矩阵. 证明A=0当且仅当trace(AtA)=0.
练习6.n是一个正整数, 令V是实数域上次数不超过n的多项式函数构成的向量空间, 即所有具有形式f(x)=c0+c1x++cnxn的函数构成的空间. 令DV上的微分算子. 找出转置算子Dt的零空间的一个基.
练习7.V是域F上的一个有限维向量空间. 证明TTt是一个从L(V,V)L(V,V)的同构.
练习8.V是域F上的n×n矩阵构成的向量空间.
  1. 如果B是一个固定的n×n矩阵, 以fB(A)=trace(BtA)定义一个V上的函数fB. 证明fBV上的一个线性泛函.
  2. 证明每个V上的线性泛函都具有以上形式, 即是某个B下的fB.
  3. 证明BfB是一个从VV的同构.