线性代数

第2章 向量空间

第2.1节 向量空间

在数学的许多部分中, 人们经常会遇到这样的集合, 其中处理对象的线性组合是有趣的. 例如, 我们发现在对于线性方程的研究中, 考虑矩阵的行的线性组合是相当自然的. 很有可能读者学过微积分, 那里处理函数的线性组合, 特别是学习微分方程的时候. 或许读者有些与三维Euclid空间打交道的经历, 特别是处理其中向量的线性组合.

不严格地说, 线性代数是这样的数学分支, 它讨论其中线性组合是有意义的代数系统的共同性质. 本节我们将定义一种数学对象, 经验表明它是此类代数系统最有用的抽象.

定义. 一个向量空间 (或者说线性空间) 包含以下资料:
  1. 一个标量域F;
  2. 一个对象的集合V, 这些对象被称为向量;
  3. 一个法则 (或者说运算), 被称为向量加法, 联系每对V中向量αβ以一个V中向量α+β, 其被称为αβ之和, 并且该运算满足
    1. 加法是交换的, α+β=β+α;
    2. 加法是结合的, α+(β+γ)=(α+β)+γ;
    3. V中存在唯一的向量0, 被称为零向量, 满足α+0=α对于V中所有向量α成立;
    4. 对于每个V中向量α, 存在唯一的V中向量α满足α+(α)=0;
  4. 一种法则 (或者说运算), 被称为标量乘法, 联系每个F中标量cV中向量α以一个V中向量cα, 其被称为cα之积, 并且该运算满足
    1. 1α=α对于每个V中的α成立;
    2. c1(c2α)=(c1c2)α;
    3. c(α+β)=cα+cβ;
    4. (c1+c2)α=c1α+c2α.

注意到, 正如定义所言, 一个向量空间是一个复合对象, 包含一个域, 一集"向量", 和两个带有特别性质的运算. 相同的向量集合可能是其他不同向量空间的组成部分 (见以下的例子5). 当没有歧义的时候, 我们就简单地以V引用这个向量空间, 或者当我们想要刻画域的时候, 我们就说V是一个域F上的向量空间. "向量"这个名字应用于集合V的元素很大程度上只是为了方便起见. 这个名字的由来可以从以下的例子1中找到, 但读者不应该给这个名字附加太多的重要性, 因为作为向量出现的各种对象可能与读者对于向量预先赋予的概念并无类似之处. 我们将在下面的一连串例子中尽力传达这点. 随着我们开始研究向量空间, 例子也会丰富起来.

例子1. n元组空间, Fn.F是任意的域, 令V是所有n元组α=(x1,x2,,xn)构成的集合, 其中xiF中的标量. 如果β=(y1,y2,,yn), 其中yiF中的标量, 那么αβ的和由α+β=(x1+y1,x2+y2,,xn+yn)定义. 标量c和向量α的积由cα=(cx1,cx2,,cxn)定义. 这向量加法和标量乘法满足条件3和4是容易验证的, 运用F的元素的加法和乘法的类似性质即可.
例子2. m×n矩阵的空间, Fm×n.F是任意的域, 并令mn是正整数. 令Fm×n是域F上所有m×n矩阵构成的集合. Fm×n中的两个向量AB的和由(A+B)i,j=Ai,j+Bi,j定义. 标量c和矩阵A的积由(cA)i,j=cAi,j定义. 注意到F1×n=Fn. [译注: 在同构的意义上.]
例子3. 从一个集合到一个域的函数的空间.F是任意的域, 令S是一个非空集合. 令V是所有从集合S到域F的函数构成的集合. V中两个向量fg之和是向量f+g, 即一个从SF的函数, 由(f+g)(s)=f(s)+g(s)定义. 标量c和函数f的积是函数cf, 由(cf)(s)=cf(s)定义. 前述例子不过就是这个的特殊情形. 对于F的元素的n元组而言, 其或可被视为从整数1,,n的集合SF的一个函数. 类似地, 一个域F上的m×n矩阵是一个从整数序对(i,j),1im,1jn的集合S到域F的函数. 对于这第三个例子, 我们将指明读者该如何验证条件3和4. 对于向量加法:
  1. 既然F中的加法是交换的,f(s)+g(s)=g(s)+f(s)对于每个S中的s成立, 于是函数f+gg+f是等同的.
  2. 既然F中的加法是结合的,f(s)+[g(s)+h(s)]=[f(s)+g(s)]+h(s)对于每个s成立, 于是f+(g+h)(f+g)+h是相同的函数.
  3. 唯一的零向量就是零函数, 其赋S的每个元素以F中的标量0.
  4. 对于每个V中的f, (f)是由(f)(s)=f(s)给定的函数.
读者应当发现验证标量乘法满足条件4是容易的, 通过施行类似于我们上面对于向量加法的论证.
例子4. F上的多项式函数的空间.F是一个域, 令V是所有具有如下形式的从FF的函数f(x)=c0+c1x++cnxn构成的集合, 其中c0,c1,,cnF中固定的标量 (独立于x). 一个这种类型的函数被称为F上的一个多项式函数. 令加法和标量乘法如例子3所定义的那样. 读者必须观察到如果fg是多项式函数而cF中, 那么f+gcf也是多项式函数.
例子5. 复数域可以被当作实数域上的向量空间. 更一般地, 令F实数域, 而令Vn元组(x1,,xn)的集合, 其中x1,,xn是复数. 如例子1一样定义向量的加法和标量乘法, 这般我们就得到了一个实数域上的向量空间, 其与nn相当不同.

从向量空间的定义中我们几乎立刻就能推出一些简单的事实, 接下来我们将推导它们. 如果c是一个标量而0是零向量, 那么根据3c和4cc0=c(0+0)=c0+c0加上(c0)并使用3d, 我们就得到了c0=0类似地, 对于标量0和任意的向量α我们发现0α=0如果c是一个非零标量而α是一个向量满足cα=0那么根据c0=0, 我们有c1(c0)=0, 但是又因为c1(c0)=(c1c)α=1α=α于是α=0. 因此, 我们看到如果c是一个标量而α是一个向量, 并且cα=0, 那么要么c标量零, 要么α是零向量.
如果αV中任意的向量, 那么0=0α=(11)α=1α+(1)α=α+(1)α从中就推出(1)α=α最后, 向量加法的结合和交换性质可以推出牵扯到数个向量的和独立于这些向量组合和结合的方式. 例如, 如果α1,α2,α3,α4V中向量, 那么(α1+α2)+(α3+α4)=[α2+(α1+α3)]+α4并且这样一个和可以无歧义地被写成α1+α2+α3+α4

定义. V中一个向量β被称为V中向量α1,,αn的线性组合, 只要存在F中的标量c1,,cn满足β=c1α1++cnαn=i=1nciαi

对于向量加法的结合性质以及标量乘法的分配性质4c和4d的其他扩展可以施行于线性组合之上:i=1nciαi+i=1ndiαi=i=1n(ci+di)αici=1nciαi=i=1n(cci)αi

线性代数的特定部分与几何紧密关联. "空间"暗示了某种几何的东西, "向量"对于大多数人也是如此. 当我们进一步研究向量空间时, 读者将会发现许多术语的确拥有几何的内涵. 在结束介绍向量空间的本节之前, 我们将在某种程度上讨论向量空间和几何之间的关系, 至少能够指明"向量空间"这个名字的由来. 这将会是简要的直觉性的讨论.

让我们考虑向量空间3. 在解析几何中, 人们将实数三元组(x1,x2,x3)和三维Euclid空间中的点视为等同的. 在这样的上下文之中, 一个向量经常被定义成一个有向线段PQ, 从点P的位置到点Q. 这相当于对从PQ的"箭头"的想法进行小心的形式化. 当向量被使用时, 意图在于它们应该由它们的长度和方向所决定. 因此, 当两个有向线段具有相同的长度和相同的方向时, 人们必须将其视为等同的.

P=(x1,x2,x3)Q=(y1,y2,y3)的有向线段PQ与从原点O=(0,0,0)到点(y1x1,y2x2,y3x3)的有向线段具有相同的长度和方向. 并且, 这是自原点出发而与PQ具有相同长度和方向的唯一一条有向线段. 因此, 如果读者同意仅处理从原点出发的向量, 那么与每个给定的长度和方向相关联着的仅恰有一个向量.

从原点至P=(x1,x2,x3)的向量OP完全由P决定, 因此将这个向量与点P视为等同是可能的. 在我们对于向量空间3的定义中, 那些向量就简单地被定义成三元组(x1,x2,x3).

给定点P=(x1,x2,x3)Q=(y1,y2,y3), 向量OPOQ之和的定义可以被几何地给出. 如果这两个向量不是平行的, 那么线段OPOQ确定了一个平面, 并且这两条线段是该平面中的一个平行四边形的两条边 (见图1). 该平行四边形的一条对角线自O延伸至点S, 而OPOQ之和就被定义成向量OS. 点S的坐标为(x1+y1,x2+y2,x3+y3), 因此这向量加法的几何定义就等价于例子1的代数定义.

P(x1,x2,x3)Q(y1,y2,y3)S(x1+y1,x2+y2,x3+y3)
图1

标量乘法拥有一个简单的几何解释. 如果c是一个实数, 那么c与向量OP之积是一个向量, 其自原点出发, 长度为|c|乘以OP的长度, 方向在c>0时与OP相同, c<0时与OP相反. 这标量乘法就产生向量OT, 其中T=(cx1,cx2,cx3), 因此也与为3给出的代数定义一致.

时不时地, 读者可能会发现"几何地思考"向量空间很有助益. 也就是说, 出于自身的需要, 通过绘图来刻画和启发一些想法. 的确, 读者应该这么做. 然而, 在绘制这样的图形时, 读者必须记住, 由于我们是把向量空间作为代数系统进行处理的, 所有我们给出的证明在性质上都是代数的.

练习1. 如果F是一个域, 验证Fn (在例子1中被定义) 是一个域F上的向量空间.
练习2. 如果V是一个域F上的向量空间, 验证(α1+α2)+(α3+α4)=[α2+(α3+α1)]+α4对于V中所有向量α1,α2,α3,α4成立.
练习3. 如果是复数域, 那么3中哪些向量是(1,0,1),(0,1,1),(1,1,1)的线性组合?
练习4.V是所有实数序对(x,y)的集合, 令F是实数域, 定义(x,y)+(x1,y1)=(x+x1,y+y1),c(x,y)=(cx,cy)V在这些运算下是一个实数域上的向量空间吗?
练习5.n上定义两个运算αβ=αβ,cα=cα右侧的运算即通常的运算, 那么(n,,)满足哪些向量空间的公理?
练习6.V是所有满足f(t)=f(t)的实数轴上的复值函数f的集合. 横杠代表复共轭. 证明V, 对于运算(f+g)(t)=f(t)+g(t),(cf)(t)=cf(t)是一个实数域上的向量空间. 给出V中一个不是实值函数的例子.
练习7.V是实数序对(x,y)的集合, 令F是实数域, 定义(x,y)+(x1,y1)=(x+x1,0),c(x,y)=(cx,0)V在这些运算下是一个向量空间吗?

第2.2节 子空间

本节我们引入一些研究向量空间的基本概念.

定义.V是域F上的向量空间. V的子空间是V的子集W, 其在V的加法和数乘之下是域F上的向量空间.

对于向量空间的公理的直接检视表明, V的子集W是一个子空间, 如果对于每个W中的αβ, 向量α+β也在W中; 零向量0W之中; 对于每个W中的α, 向量(α)W之中; 对于每个W中的α和每个标量c, 向量cαW之中. 向量加法的交换律和结合律, 以及标量乘法的性质4a, 4b, 4c, 4d并不需要验证, 因为这些是V上的运算所固有的性质. 判断的标准还可以进一步得到简化.

定理1. V的非空子集WV的一个子空间当且仅当对于W中的每对向量αβ以及F中的每个标量c, 向量cα+β仍然在W之中. [译注: 空集显然不是子空间, 因为向量空间至少包含零向量.]
证明.WV是一个非空子集, 其满足对于W中所有的向量αβ以及F中所有的标量ccα+β属于W. 既然W是非空的, W中存在一个向量ρ, 因此(1)ρ+ρ=0也在W中. 然后, 如果αW中的任意向量, c是任意的标量, 那么向量cα=cα+0W中. 特别地, (1)α=αW中. 最后, 如果αβW中, 那么α+β=1α+βW中. 因此, WV的一个子空间.
反过来, 如果WV的一个子空间, αβW中, c是一个标量, 当然有cα+βW中.

有些人倾向于使用定理中的cα+β性质作为子空间的定义. 这没有什么区别. 重要的是, 如果W是一个V的非空子集满足对于W中的αβ以及F中的ccα+βV之中, 那么W (在继承自V的运算下) 是一个向量空间. 这给我们提供了许多向量空间的新例子.

例子6.
  1. 如果V是任意的向量空间, 那么VV的一个子空间; 仅包含零向量的子集也是V的子空间, 被称为V的零子空间.
  2. Fn中, 满足x1=0n元组(x1,,xn)的集合是一个子空间; 然而, 满足x1=1+x2n元组的集合不是一个子空间 (n2).
  3. F上的多项式函数的空间是从FF的所有函数的空间的子空间.
  4. F上的一个n×n矩阵A是对称的, 如果对于每个ijAi,j=Aj,i. 对称矩阵形成了一个域F上的n×n矩阵的空间的子空间.
  5. 上的一个n×n矩阵A是Hermite的 (或者说自伴的), 如果Aj,k=Ak,j对于每个jk成立, 其中横杠代表复共轭. 一个2×2矩阵是Hermite的当且仅当其具有如下形式[zx+iyxiyw]其中x,y,z,w是实数. 所有Hermite矩阵的集合不是上的n×n矩阵空间的子空间, 因为如果A是Hermite的, 那么它的对角线元素A1,1,A2,2,都是实数, 但是iA的对角线元素不总是实数. 另一方面, 很容易验证n×n的复Hermite矩阵的集合是一个域上的向量空间 (在通常的运算下).
例子7. 齐次线性方程组的解空间.A是域F上的一个m×n矩阵, 那么满足AX=0的所有n×1矩阵X构成的集合是域F上的n×1矩阵空间的一个子空间. 为了证明这个事实, 我们必须证明当AX=0, AY=0以及cF中任意标量时有A(cX+Y)=0, 而这可由以下的一般性事实立即得到.
引理. 如果A是域F上的一个m×n矩阵而BC是域F上的n×p矩阵, 那么A(dB+C)=d(AB)+AC对于每个F中的标量d成立.
证明. [A(dB+C)]i,j=kAi,k(dB+C)k,j=k(dAi,kBk,j+Ai,kCk,j)=dkAi,kBk,j+kAi,kCk,j=d(AB)i,j+ACi,j=[d(AB)+AC]i,j

类似地, 还可以证明(dB+C)A=d(BA)+CA, 若矩阵的和与积确有定义.

定理2.V是域F上的一个向量空间, 那么V的任何子空间族的交是V的子空间.
证明.{Wα}V的一个子空间族, 令W=αWα是其交. 回忆一下, W被定义成属于每个Wα的所有元素的集合 (见附录). 既然每个Wα都是子空间, 那么每个都包含零向量, 于是其交W也包含零向量, W非空. 令αβW中的向量, 令c是一个标量. 根据W的定义, αβ都属于每个Wα, 并且因为每个Wα都是一个子空间, 向量(cα+β)在每个Wα之中, 于是(cα+β)也在W里. 根据定理1, WV的一个子空间.

根据定理2, 若SV的任意子集, 那么存在一个包含S的最小的V的子空间, 最小的意思即这个包含S的子空间是其他每个包含S的子空间的子集.

定义.S是一个向量的集合, 其来自于一个向量空间V. 由S张成的子空间被定义为所有包含SV的子空间的交W. 当S是有限的向量集时, 如S={α1,α2,,αn}, 我们也将W简单地称为由向量α1,α2,,αn张成的子空间.
定理3. 由向量空间V的一个非空子集S张成的子空间是S中向量所有的线性组合构成的集合.
证明.WS张成的子空间, 那么S中的向量α1,α2,,αm的每个线性组合α=x1α1+x2α2++xmαm显然在W之中. 因此, W包含集合L, LS中向量的所有线性组合的集合. 另一方面, 集合L包含S, 是非空的. 如果αβ属于L, 那么α是一个线性组合,α=x1α1+x2α2++xmαm其中αiS中, 并且β是一个线性组合,β=y1β1+y2β2++ynβn其中βjS中. 对于每个标量c,cα+β=i=1m(cxi)αi+j=1nyjβj因此, cα+β属于L, 于是LV的一个子空间.
现在我们已经证明L是包含S的一个V的子空间, 并且任何包含S的子空间也包含L, 于是L是所有包含S的子空间之交, 即L是由集合S张成的子空间.
定义. 如果S1,S2,,Sk是向量空间V的子集, 那么所有形式为α1+α2++αk的和 (其中αiSi之中) 构成的集合被称为子集S1,S2,,Sk的和, 用记号S1+S2++Sk表达, 或者i=1kSi如果W1,W2,,WkV的子空间, 那么和W=W1+W2++Wk显然是V的一个子空间, 其包含每个子空间Wi. 从中可以得到, 正如定理3的证明, W是由W1,W2,,Wk之并张成的子空间.
例子8.F是复数域的一个子域, 设α1=(1,2,0,3,0),α2=(0,0,1,4,0),α3=(0,0,0,0,1)根据定理3, 一个向量α在由α1,α2,α3张成的F5的子空间W之中当且仅当存在F中的标量c1,c2,c3满足α=c1α1+c2α2+c3α3因此W由所有形式为α=(c1,2c1,c2,3c1+4c2,c3)的向量构成, 其中c1,c2,c3F中任意的标量. 换句话说, W可以被描述为由满足x2=2x1,x4=3x1+4x35元组α=(x1,x2,x3,x4,x5)构成的集合, 其中xiF中. 因此, (3,6,1,5,2)W中, 而(2,4,6,7,8)不在.
例子9.F是复数域的一个子域, 令V是域F上所有2×2矩阵的向量空间. 令W1是包含所有形式为[xyz0]的矩阵的V的子集, 其中x,y,zF中任意的标量. 最后, 令W2是包含所有形式为[x00y]的矩阵的V的子集, 其中xyF中任意的标量. 那么, W1W2V的子空间, 并且V=W1+W2因为[abcd]=[abc0]+[000d]子空间W1W2包含所有形式为[x000]的矩阵.
例子10.A是域F上的一个m×n矩阵. A的行向量是Fn中的向量, 其由αi=(Ai,1,,Ai,n),i=1,,m给定. 由A的行向量张成的Fn的子空间被称为A的行空间. 例子8中所考虑的子空间是矩阵A=[120300014000001]的行空间. 它也是矩阵B=[12030001400000148180]的行空间.
例子11.V是所有域F上的多项式函数的空间, 令SV的一个子集, 包含多项式函数f0,f1,f2,, 其由fn(x)=xn,n=0,1,2,定义, 那么V是由S张成的子空间.
练习1. 以下哪些n中的向量α=(a1,,an)的集合是n的子空间 (n3)?
  1. 所有满足a10α;
  2. 所有满足a1+3a2=a3α;
  3. 所有满足a2=a12α;
  4. 所有满足a1a2=0α;
  5. 所有a2为有理数的α.
练习2.V是所有从的函数f构成的(实)向量空间, 以下哪些函数的集合是V的子空间?
  1. 所有满足f(x2)=[f(x)]2f;
  2. 所有满足f(0)=f(1)f;
  3. 所有满足f(3)=1+f(5)f;
  4. 所有满足f(1)=0f;
  5. 所有连续的f.
练习3. 向量(3,1,0,1)在由向量(2,1,3,2),(1,1,1,3),(1,1,9,5)张成的4的子空间之中吗?
练习4.W是满足{2x1x2+43x3x4=0x1+23x3x5=09x13x2+6x33x43x5=0的所有5中的(x1,x2,x3,x4,x5)的集合. 找出一个张成W的向量的有限集合.
练习5.F是一个域, n是一个大于等于2的正整数. 令V是域F上所有n×n矩阵的向量空间. 以下哪些V中矩阵A的集合是V的子空间?
  1. 所有可逆的A;
  2. 所有不可逆的A;
  3. 所有满足AB=BAA, 其中BV中一个固定的矩阵;
  4. 所有满足A2=AA.
练习6.
  1. 证明1的子空间仅有1和零子空间.
  2. 证明2的子空间是2, 或是零子空间, 或是由某个2中固定的(非零)向量的标量倍数构成. (最后一种类型的子空间, 从直觉上说, 是一条通过原点的直线.)
  3. 你能描述3的子空间吗?
练习7.W1W2是向量空间V的子空间, 满足W1W2之并也是子空间. 证明其中一个空间Wi是另一个的子集.
练习8.V是所有从的函数f的向量空间, 令Ve是偶函数的子集, 即满足f(x)=f(x)的函数, 令Vo是奇函数的子集, 即满足f(x)=f(x)的函数.
  1. 证明VeVoV的子空间.
  2. 证明Ve+Vo=V.
  3. 证明VeVo={0}.
练习9.W1W2是向量空间V的子空间, 满足W1+W2=VW1W2={0}. 证明对于每个V中的向量α存在唯一的W1中的向量α1W2中的向量α2满足α=α1+α2.

第2.3节 基和维数

现在我们转向为特定的向量空间赋一个维数的任务. 尽管我们通常将"维数"与某种几何的东西联系起来, 我们必须为向量空间的维数寻找一个合适的代数定义. 这将通过向量空间的基的概念来完成.

定义.V是域F上的一个向量空间. V的一个子集S被称为线性相关的, 如果存在S中不同的向量α1,α2,,αnF中的不全为0的标量c1,c2,,cn满足c1α1+c2α2++cnαn=0不是线性相关的集合被称为线性无关的. 如果集合S仅包含有限多个向量α1,α2,,αn, 有时我们称α1,α2,,αn是线性相关的 (或线性无关的) 而不是说S是线性相关的 (或线性无关的).

以下陈述是定义的简单推论.

  1. 任何包含线性相关集合的集合是线性相关的.
  2. 线性无关集合的任意子集是线性无关的.
  3. 任何包含零向量的集合是线性相关的, 因为10=0.
  4. 一个集合S是线性无关的当且仅当S的每个有限子集是线性无关的, 即当且仅当对于S的不同向量α1,,αnc1α1++cnαn=0可以推出每个ci=0.

定义.V是一个向量空间. V的一个基是一个能够张成V的线性无关的向量集合. V被称为有限维的, 如果它拥有一个有限的基.
例子12.F是一个的子域. 在F3中, 向量α1=(3,0,3),α2=(1,1,2),α3=(4,2,2),α4=(2,1,1)是线性相关的, 因为2α1+2α2α3+0α4=0向量ε1=(1,0,0),ε2=(0,1,0),ε3=(0,0,1)是线性无关的.
例子13.F是一个域, 令S是由ε1,ε2,,εn构成的Fn的子集, 其中ε1=(1,0,0,,0),ε2=(0,1,0,,0),,εn=(0,0,0,,1)x1,x2,,xnF中标量, 置α=x1ε1+x2ε2++xnεn, 那么α=(x1,x2,,xn)这表明ε1,,εn可以张成Fn. 因为α=0当且仅当x1=x2==xn=0, 所以向量ε1,,εn是线性无关的. 因此, S={ε1,,εn}Fn的一个基, 我们将其称为Fn的标准基.
例子14.P是域F上的一个n×n的可逆矩阵, 那么P的列P1,,Pn构成了列矩阵空间Fn×1的一个基, 理由如下. 如果X是一个列矩阵, 那么PX=x1P1++xnPn既然PX=0仅有平凡解X=0, 那么{P1,,Pn}是一个线性无关的集合. 为什么它能够张成Fn×1呢? 令Y是任意的列矩阵, 如果X=P1Y, 那么Y=PX, 即Y=x1P1++xnPn于是{P1,,Pn}Fn×1的一个基.
例子15.A是一个m×n矩阵, S是齐次线性方程组AX=0 (例子7) 的解空间. 令R是行等价于A的一个行简化阶梯形式, 那么S也是方程组RX=0的解空间. 如果R具有r个非零行, 那么RX=0就简单地将未知元x1,,xn中的r个表达为了基于剩余nr个未知元xj的线性组合. 设非零行的首非零元出现在第k1,,kr列, 令J是除去k1,,kr剩下的nr个索引的集合:J={1,,n}{k1,,kr}那么方程组RX=0具有如下形式{xk1+Jc1,jxj=0xkr+Jcr,jxj=0其中ci,j是特定的标量. 所有的解都可由以下方式获得, 对于每个J中的j, 给xj赋(任意的)值, 然后计算相应的xk1,,xkr的值. 若对于每个J中的j, Ej是令xj=1, 其余xi=0 (iJ中异于j的索引) 得到的解, 那么我们断言这(nr)个向量Ej构成了解空间的一个基.
因为列矩阵Ej的第j行为1, 而由J中其余元素索引的行是0, 根据例子13的推理, 这表明这些向量构成的集合是线性无关的. 以下是这些向量能够张成解空间的理由. 如果列矩阵T (其元素依次为t1,,tn) 在解空间之中, 那么矩阵N=JtjEj同样也在解空间之中, 并且满足对于每个J中的jxj=tj. 具有这样性质的解是唯一的, 因此N=T, 而T就在诸向量Ej张成的空间之中.
例子16. 现在我们将给出一个无穷基的例子. 令F是复数域的一个子域, VF上的多项式函数的空间. 回忆一下, 这些从FF的函数具有如下形式f(x)=c0+c1x++cnxnfk(x)=xk,k=0,1,2,, 那么(无限的)集合{f0,f1,f2,}V的一个基. 显然, 它能张成V, 因为(上面的)函数f可以表示为f=c0f0+c1f1++cnfn读者应该看出来这事实上不过就是重复一遍多项式函数的定义, 即一个从FF的函数f是多项式函数当且仅当存在一个整数n和标量c0,,cn满足c0f0++cnfn. 那么为什么这些函数线性无关呢? 为了证明集合{f0,f1,f2,}是线性无关的, 只需要证明其每个有限子集是线性无关的即可, 实际上证明对于每个n, 集合{f0,,fn}是线性无关的就够了. 设c0f0++cnfn=0这等价于说c0+c1x++cnxn=0对于每个F中的x成立. 换句话说, 每个F中的x都是多项式函数f(x)=c0+c1x++cnxn的根. 我们假定读者已经知道一个n阶的复系数多项式不可能拥有多于n个的不同的根, 于是就有c0=c1==cn=0.
我们已经给出了V的一个无限的基, 那么这是否意味着V不是有限维的? 实际上的确如此, 但这不能通过定义直接得到, 因为就目前我们所知, 或许V还拥有一个有限的基. 不过, 这种可能性很容易被排除. (我们将于下一个定理中在一般情况下排除它.) 假设我们拥有一个有限数目的多项式函数g1,,gr, 那么g1(x),,gr(x)中将出现一个最高的x的幂次. 如果该幂次是k, 那么显然fk+1(x)=xk+1不在g1,,gr的线性扩张之中, 因此V不可能是有限维的. [译注: 当然, 存在一种极端情况, 即每个多项式函数都是零函数, 那就不存在最高的幂次, 不过这种情况可以被特殊对待, 论证仍然完全合理.]

关于这个例子的最后一条评注就位了. 无限的基同"无限的线性组合"毫无关系. 若是读者不能抵制将幂级数k=0ckxk注入这个例子之中, 那么他就应该再一次好好琢磨一下这个例子. 如果还是没有疗效的话, 从现在开始他就应该考虑将注意力限制在有限维空间上.

定理4.V是一个由有限多个向量β1,β2,,βm张成的向量空间, 那么V中任意线性无关的集合都是有限的, 并且拥有的元素不超过m个.
证明. 为了证明这个定理, 只需要证明V的每个拥有超过m个元素的子集S是线性相关的就够了. 令S就是这样一个集合. 在S中, 存在n个互异的向量α1,α2,,αn, 其中n>m. 因为β1,,βm能够张成V, 所以存在F中的标量Ai,j满足αj=i=1mAi,jβi对于n个标量x1,x2,,xn, 我们有x1α1++xnαn=j=1nxjαj=j=1nxj(i=1mAi,jβi)=j=1ni=1m(Ai,jxj)βi=i=1m(j=1nAi,jxj)βi既然n>m, 那么根据第1章的定理6, 存在不全为零的x1,x2,,xn满足j=1nAi,jxj=0,1im因此x1α1+x2α2++xnαn=0, 这表明S是线性相关的集合.
推论1. 如果V是一个有限维向量空间, 那么任意两个V的基都具有相同(有限)数目的元素.
证明. 既然V是有限维的, 它拥有一个有限的基{β1,β2,,βm}[译注: 这个记号隐含了β1,β2,,βm互异之意, 但请读者注意, 这并非集合论公理的要求, 只是一个常见的默认约定罢了.] 根据定理4, 每个V的基都应该是有限的, 并且拥有的元素不超过m个. 因此, 如果{α1,α2,,αn}是一个基, 那么nm. 根据相同的论证, 有mn, 于是m=n.

这个推论允许我们将有限维向量空间的维数定义为V的一个基的元素个数. 我们将用dimV表示有限维向量空间V的维数. 这允许我们重新表述定理4如下.

推论2.V是一个有限维向量空间, 令n=dimV, 那么
  1. 任何包含多于n个向量的V的子集是线性相关的;
  2. 没有包含少于n个向量的V的子集可以张成V.
例子17. 如果F是一个域, 那么Fn的维数是n, 因为Fn的标准基包含n个向量. 矩阵空间Fm×n的维数是mn. 若与Fn的情况进行类比, 这应该是很显然的, 因为mn个矩阵, 其中每个矩阵的第ij列是1, 其余位置是0, 构成了Fm×n的一个基. 如果A是一个m×n的矩阵, 那么A的维数是nr, 其中r是与A行等价的行简化阶梯矩阵的非零行数, 见例子15.
如果VF上任意的向量空间, 那么其零子空间可由向量0张成, 但是{0}是线性相关的集合, 因此不是一个基. 出于这样的原因, 我们将约定零子空间的维数是0. 另一种做法是, 我们论证空集是零子空间的基, 那么也能够达成相同的结论. 空集可以张成{0}, 因为所有包含空集的子空间之交是{0}. 并且, 空集也是线性无关的, 因为它不包含任何向量.
引理.S是向量空间V的一个线性无关的子集, 设βV中向量但不在S张成的子空间之中, 那么将β加入S得到的集合仍然是线性无关的.
证明.α1,,αmS中互异的向量, 并且c1α1++cmαm+bβ=0那么b=0, 否则的话β=(c1b)α1++(cmb)αm那么β就在S张成的子空间之中. 因此, c1α1++cmαm=0. 既然S是线性无关的, 那么每个ci=0.
定理5. 如果W是一个有限维向量空间V的子空间, 那么W每个线性无关的子集都是有限的, 并且是W的某个(有限的)基的一部分.
证明.S0W的一个线性无关的子集. 如果S是包含S0W的一个线性无关的子集, 那么S也是V的一个线性无关的子集. 因为V是有限维的, 所以S包含的元素个数不超过dimV个.
我们按照以下方式将S0扩展为W的一个基. 如果S0可以张成W, 那么S0就是W的一个基, 我们的任务就完成了. 如果S0不能张成W, 那么根据前述引理, 我们可以在W中找到一个β1满足S1=S0{β1}是线性无关的. [译注: 显然β1不是S0的元素.] 如果S1能够张成W, 那就结束了. 否则的话, 再次应用引理以得到一个W中的β2满足S2=S1{β2}是线性无关的. 继续实行此法, 那么 (在不超过dimV步的情况下) 我们能够抵达一个集合Sm=S0{β1,,βm}其为W的一个基.
推论1. 如果W是有限维向量空间V的一个真子空间, 那么W也是有限维的, 并且dimW<dimV.
证明. 我们不妨设W包含一个向量α0. 根据定理5及其证明, 存在一个W的基, 其包含α且拥有不超过dimV个元素. 因此, W是有限维的, 并且dimWdimV. 既然W是一个真子空间, 那么存在V中的向量β, 但其不在W中. 将β加入W的任何一个基之中, 我们都能得到V的一个线性无关的子集, 于是dimW<dimV. [译注: 实际上证明不必如此曲折, 从空集开始就好, 即能扩展成为W的一个基, 并且这也覆盖了W是零子空间的平凡情况.]
推论2. 在有限维向量空间V中每个非空的线性无关集合都是某个基的一部分. [译注: 平凡的空集情况当然也是某个基的一部分.]
推论3.A是域F上的一个n×n矩阵, 设其行向量构成了Fn的一个线性无关的集合, 那么A是可逆的. [译注: 一般情况下, "构成集合"也就默认了互异, 尽管这不存在什么确切的道理可言.]
证明.α1,α2,,αnA的行向量, 设W是由α1,α2,,αn张成的Fn的子空间. 既然α1,α2,,αn是线性无关的, 那么W的维数就是n. 推论1现在告诉我们W=Fn, 因此存在F中标量Bi,j满足εi=j=1nBi,jαj,1in其中{ε1,ε2,,εn}Fn的标准基, 因此对于以Bi,j为元素的矩阵B, 我们有BA=I
定理6. 如果W1W2是向量空间V的有限维子空间, 那么W1+W2也是有限维的, 并且有dimW1+dimW2=dim(W1W2)+dim(W1+W2)
证明. 根据定理5及其推论, W1W2具有一个有限的基{α1,,αk}, 其为W1的基{α1,,αk,β1,,βm}的一部分, 也是W2的基{α1,,αk,γ1,,γn}的一部分. 子空间W1+W2可由向量α1,,αk,β1,,βm,γ1,,γn张成, 并且这些向量也构成了一个线性无关的集合, 因为若设xiαi+yjβj+zrγr=0那么zrγr=xiαi+yjβj这表明zrγr属于W1. 因为zrγr也属于W2, 所以zrγr=ciαi对于特定的c1,,ck成立. 鉴于{α1,,αk,γ1,,γn}是线性无关的, 每个标量zr=0, 因此xiαi+yjβj=0既然{α1,,αk,β1,,βm}也是线性无关的, 那么有每个xi=0且每个yj=0. 最终我们得到{α1,,αk,β1,,βm,γ1,,γn}W1+W2的一个基, 于是dimW1+dimW2=(k+m)+(k+n)=k+(m+k+n)=dim(W1W2)+dim(W1+W2)

让我们以一条关于线性无关和线性相关的注记作结. 我们对于向量的集合定义了这些概念. 对于向量的有限序列 (有序的n元组) α1,,αn定义它们也是很有用的. 我们称向量α1,,αn是线性相关的, 如果存在不全为零的标量c1,,cn满足c1α1++cnαn=0. 这是如此自然的, 以至于读者可能会发现他已经在这样使用术语了. 那么, 有限序列α1,,αn和集合{α1,,αn}之间有什么区别呢? 存在两种区别, 等同性和顺序.
如果我们讨论集合{α1,,αn}, 通常已经假定向量α1,,αn之中没有两个向量是相同的. 对于序列α1,,αn而言, 可能每个αi都是相同的向量. 若对于某ijαi=αj, 那么序列α1,,αn是线性相关的:αi+(1)αj=0因此, 如果α1,,αn是线性无关的, 那么它们就是互异的, 并且我们可以讨论集合{α1,,αn}, 知道其中有n个向量. 显然, 在讨论基和维数的时候, 这不会引起什么歧义. 有限维向量空间V的维数就是满足存在V中线性无关的n元向量组的最大的n, 诸如此类. 若是读者感到本段杂乱无章而毫无内容可言, 那么他该问问自己向量α1=(eπ/2,1),α2=(1103,1)2中是否线性无关.
一个序列的元素以特定的顺序被枚举出来. 一个集合是对象的合集, 而没有预先给定的排列或顺序. 当然, 为了描述一个集合, 我们或许会列出其成员, 而这就需要挑选一个顺序. 但是, 顺序不是集合的一部分. 集合{1,2,3,4}{4,3,2,1}是等同的, 而序列1,2,3,44,3,2,1相当不同. 序列的顺序方面并不影响线性相关或者无关, 因为线性相关性 (根据定义) 并不受顺序影响. 序列αn,,α1线性相关当且仅当序列α1,,αn线性相关. 在下一节中, 顺序将变得重要起来.

练习1. 证明如果两个向量线性相关, 那么其中一个是另一个的标量倍数.
练习2. 向量α1=(1,1,2,4),α2=(2,1,5,2),α3=(1,1,4,0),α4=(2,1,1,6)4中线性无关吗?
练习3. 找到由练习2的四个向量张成的4的子空间的一个基.
练习4. 证明向量α1=(1,0,1),α2=(1,2,1),α3=(0,3,2)构成了3的一个基. 将每个标准基向量表达为α1,α2,α3的线性组合.
练习5. 找出3中的三个向量, 它们线性相关, 但是两两线性无关.
练习6.V是域F上的2×2矩阵的向量空间. 通过给出V的一个具有四个元素的基, 证明V的维数是4.
练习7.V是练习6的向量空间, 令W1是由形式为[xxyz]的矩阵构成的集合, 令W2是由形式为[abac]的矩阵构成的集合.
  1. 证明W1W2V的子空间.
  2. 找出W1,W2,W1+W2,W1W2的维数.
练习8. 又一次令V是域F上的2×2矩阵的向量空间. 找出V的一个基{A1,A2,A3,A4}满足对于每个jAj2=Aj.
练习9.V是复数域的一个子域F上的一个向量空间. 设α,β,γV中线性无关的向量. 证明(α+β),(β+γ),(γ+α)是线性无关的.
练习10.V是域F上的一个向量空间. 设有限数目的向量α1,,αr能够张成V. 证明V是有限维的.
练习11.V是复数域上所有满足A1,1+A2,2=02×2矩阵A构成的集合.
  1. 证明在通常的运算下, V是实数域上的向量空间.
  2. 找出该向量空间的一个基.
  3. WV中满足A2,1=A1,2的矩阵A的集合, 其中横杠代表复数共轭. 证明WV的子空间并找出W的一个基.
练习12. 通过找出向量空间的一个基, 证明域F上的m×n矩阵构成的向量空间的维数是mn.
练习13. 讨论练习9, 其中V是二元域上的向量空间. 二元域见第1.2节的练习5.
练习14.V是实数集合. 若将V视为有理数域上的向量空间 (带有通常的运算), 证明该向量空间不是有限维的.

第2.4节 坐标

n维空间V的基𝔅的诸多有用性质之一在于, 它允许人们在V中引入与空间Fn中的向量α=(x1,,xn)的"自然坐标"xi类似的东西. 沿此进路, V中的向量α相对于基𝔅的坐标将会是用于将α表达为基中向量的线性组合的标量. 因此, 我们想要将Fn中的向量α的自然坐标视为由αFn的标准基定义的. 然而, 若是采取此法, 我们必须足够小心. 如果α=(x1,,xn)=i=1nxiεi𝔅Fn的标准基, 那么α的坐标是如何由𝔅α决定的呢? 一种组织回答的方式如下. 给定的α作为标准基向量的线性组合的表达是唯一的, 并且α的第i个坐标xi就是该表达下εi的系数. 以此观点来看, 我们之所以能够言称何谓第i个坐标, 是因为我们已经为标准基中的向量安排了"自然"的顺序. 也就是说, 我们拥有一个规则来确定哪一个是基中"第一"的向量, 哪一个是基中"第二"的向量, 诸如此类. 如果𝔅n维空间V的任意一个基, 那么可能𝔅中的向量并没有什么自然的顺序. 因此, 在我们能够定义"α相对于𝔅的第i个坐标"之前, 就有必要为这些向量施加一个顺序. 换言之, 坐标将相对于向量的序列而不是向量的集合进行定义.

定义. 如果V是一个有限维向量空间, 那么V的一个有序基是一个向量的有限序列, 其线性无关并可张成V.

如果序列α1,,αnV的一个有序基, 那么集合{α1,,αn}V的一个基. 有序基不过就是基的集合, 带上一个指定的顺序. 我们将稍微滥用一下符号, 言称𝔅={α1,,αn}V的一个有序基. 这不仅确定了什么是基的向量, 也刻画了顺序.

现在我们设V是域F上的一个有限维向量空间, 并且𝔅={α1,,αn}V的一个有序基. 给定V中的α, 存在唯一的一个标量的n元组满足α=i=1nxiαi之所以这个n元组是唯一的, 是因为若我们同样有α=i=1nziαi那么i=1n(xizi)αi=0并且αi的线性无关性告诉我们对于每个ixizi=0. 我们称xiα相对于有序基𝔅={α1,,αn}的第i个坐标. 如果β=i=1nyiαi那么α+β=i=1n(xi+yi)αi于是(α+β)在此有序基之下的第i个坐标是(xi+yi). 类似地, (cα)的第i个坐标是cxi. 读者也应该注意到每个F中的n元组(x1,,xn)也是V中某个向量的坐标的n元组, 即i=1nxiαi

总结一下, 每个V的有序基都确定了一个V的所有向量的集合与Fn的所有n元组的集合之间的一一对应α(x1,,xn)这个对应拥有以下性质. (α+β)的像是Fnαβ的像之和, 以及(cα)的像是Fn中的标量cα的像之积.

有的读者或许想问为什么在此时此刻我们为什么不简单地选取一个V的有序基然后将V的每个向量描述为与之对应的坐标n元组, 因为若是这样的话, 我们就可以获得只与n元组打交道之便. 这违背了我们的目的, 出于两个原因. 首先, 正如我们对于向量空间的公理化定义所暗示的那样, 我们试图研究如何将向量空间作为抽象的代数系统进行推理. 其次, 即便是在那些我们使用坐标的场合, 有的重要结果来源于我们能够改变坐标系统的能力, 即改变有序基的能力.

往往对于我们而言使用α相对于𝔅的坐标矩阵X=[x1xn]而不是坐标n元组(x1,,xn)更加方便. 为了指明坐标矩阵依赖于哪个基, 我们将使用符号[α]𝔅来表示向量α相对于有序基𝔅的坐标矩阵. 从一个有序基变到另一个有序基时, 这个记号对于描述向量α的坐标发生了什么变化是特别有用的.

接着, 我们设Vn维的, 并且𝔅={α1,,αn}𝔅={α1,,αn}V的两个有序基. 存在唯一的标量Pi,j满足αj=i=1nPi,jαi,1jnx1,,xn是给定的向量α相对于有序基𝔅的坐标, 那么α=x1α1++xnαn=j=1nxjαj=j=1nxji=1nPi,jαi=j=1ni=1n(Pi,jxj)αi=i=1n(j=1nPi,jxj)αi因此我们就得到关系α=i=1n(j=1nPi,jxj)αi既然α在有序基𝔅下的坐标x1,,xn是被唯一确定的, 那么xi=j=1nPi,jxj,1inP是一个n×n矩阵, 其第ij列的元素是标量Pi,j并令XX分别是α在基𝔅𝔅下的坐标矩阵, 那么我们可以重新表达上述结果为X=PX既然𝔅𝔅都是线性无关的, 那么X=0当且仅当X=0. 根据第1章的定理7, P是可逆的, 于是X=P1X若我们使用之前引入的向量相对于某个有序基的坐标矩阵的记号, 那么[α]𝔅=P[α]𝔅,[α]𝔅=P1[α]𝔅因而之前的讨论可以被总结如下.

定理7.V是域F上的n维向量空间, 令𝔅𝔅V的两个有序基, 那么存在一个唯一的且必然可逆的域F上的n×n矩阵P满足[α]𝔅=P[α]𝔅,[α]𝔅=P1[α]𝔅对于每个V中的向量α成立. P的列由Pj=[αj]𝔅,j=1,,n给出.

为了使上面的分析完整, 我们还需要证明以下结果.

定理8.P是域F上的一个n×n可逆矩阵. 令V是域F上的一个n维向量空间, 令𝔅V的一个有序基. 那么, 存在唯一的一个V的有序基𝔅满足[α]𝔅=P[α]𝔅,[α]𝔅=P1[α]𝔅对于每个V中的向量α成立.
证明.𝔅由向量α1,,αn构成. 如果𝔅={α1,,αn}是满足第一条的V的有序基, 那么显然有αj=i=1nPi,jαi因此我们只需要证明由这些等式定义的向量αj的确构成了一个基. 令Q=P1, 那么jQj,kαj=jQj,kiPi,jαi=jiPi,jQj,kαi=i(jPi,jQj,k)αi=αk故由集合𝔅={α1,,αn}张成的子空间包含𝔅, 因而等于V. 于是, 𝔅是一个基. 根据其定义和定理7, 显然第一条是成立的, 第二条也是.
例子18.F是一个域, 令α=(x1,x2,,xn)是一个Fn中的向量. 如果𝔅Fn的标准有序基, 即𝔅={ε1,,εn}那么向量α在基𝔅下的坐标矩阵为[α]𝔅=[x1x2xn]
例子19.是实数域, 令θ是一个固定的实数. 矩阵P=[cosθsinθsinθcosθ]是可逆的, 其逆为P1=[cosθsinθsinθcosθ]因此, 对于每个θ, 由向量(cosθ,sinθ)(sinθ,cosθ)构成的集合𝔅2的一个基. 从直觉上说, 这个基可被描述为由标准基旋转角度θ得到的. 如果α是向量(x1,x2), 那么[α]𝔅=[cosθsinθsinθcosθ][x1x2]或者x1=x1cosθ+x2sinθ,x2=x1sinθ+x2cosθ.
例子20.F是复数域的一个子域. 矩阵P=[145023008]是可逆的, 其逆为P1=[121180123160018]因此向量α1=(1,0,0),α2=(4,2,0),α3=(5,3,8)构成了F3的一个基𝔅. 向量α=(x1,x2,x3)在基𝔅下的坐标x1,x2,x3[x1x2x3]=[x1+2x2+118x312x2+316x318x3]=[121180123160018][x1x2x3]特别地,(3,2,8)=10α112α2α3
练习1. 证明向量α1=(1,1,0,0),α2=(0,0,1,1),α3=(1,0,0,4),α4=(0,0,0,2)构成了4的一个基. 找出每个标准基向量在有序基{α1,α2,α3,α4}下的坐标.
练习2. 找出向量(1,0,1)3的有序基(2i,1,0),(2,1,1),(0,1+i,1i)下的坐标矩阵.
练习3.𝔅={α1,α2,α3}是由α1=(1,0,1),α2=(1,1,1),α3=(1,0,0)构成的3的有序基. 那么, 向量(a,b,c)在有序基𝔅下的坐标是什么呢?
练习4.W是由α1=(1,0,i)α2=(1+i,1,1)张成的3的子空间.
  1. 证明α1α2构成了W的一个基.
  2. 证明β1=(1,1,0)β2=(1,i,1+i)也在W中并且构成了W的另一个基.
  3. α1α2W的有序基{β1,β2}下的坐标是什么?
练习5.α=(x1,x2)β=(y1,y2)2中满足x1y1+x2y2=0,x12+x22=y12+y22=1的向量. 证明𝔅={α,β}2的一个基. 找出向量(a,b)在有序基𝔅={α,β}下的坐标. (αβ上的条件, 从几何上说, 指的是αβ垂直, 并且每个长度均为1.)
练习6.V是一个复数域上的向量空间, 其由所有从的函数构成, 即实轴上所有复值函数的空间. 令f1(x)=1,f2(x)=eix,f3(x)=eix.
  1. 证明f1,f2,f3是线性无关的.
  2. g1(x)=1,g2(x)=cosx,g3(x)=sinx, 找出一个3×3的矩阵P满足gj=i=13Pi,jfi.
练习7.V是所有次数小于等于2的从的多项式函数构成的(实)向量空间, 即由所有形式为f(x)=c0+c1x+c2x2的函数f构成的空间. 令t是一个固定的实数, 定义g1(x)=1,g2(x)=x+t,g3(x)=(x+t)2证明𝔅={g1,g2,g3}V的一个基. 如果f(x)=c0+c1x+c2x2那么f在此有序基𝔅下的坐标是什么呢?

第2.5节 行等价的总结

本节我们将利用一些有限维向量空间基和维数的基本事实来完成我们对于矩阵的行等价性的讨论. 回忆一下, 如果A是域F上的一个m×n矩阵, 那么A的行向量是Fn中的向量α1,,αm, 由αi=(Ai,1,,Ai,n)定义. A的行空间是由这些向量张成的Fn的子空间. A的行秩是A的行空间的维数.

如果P是域F上的一个k×m矩阵, 那么积B=PA是一个k×n矩阵, 其行向量β1,,βk分别为线性组合βi=Pi,1α1++Pi,mαm因此, B的行空间是A的行空间的一个子空间. 如果P是一个m×m的可逆矩阵, 那么B行等价于A, 于是根据行等价的对称性, 或者等式A=P1B, 可知A的行空间也是B的行空间的一个子空间.

定理9. 行等价的矩阵拥有相同的子空间.

因而我们发现为了研究A的行空间, 研究与A行等价的行简化阶梯矩阵的行空间也是一样的. 接下来我们就要这么做.

定理10.R是一个非零的行简化阶梯矩阵, 那么R的非零行向量构成了R的行空间的一个基.
证明.ρ1,,ρrR的非零行向量, 那么显然这些向量可以张成R的行空间, 因此我们只需证明它们线性无关即可. 既然R是一个行简化阶梯矩阵, 那么存在正整数k1,,kr满足对于ir,
  1. R(i,j)=0j<ki;
  2. R(i,kj)=δi,j;
  3. k1<<kr.
β=(b1,,bn)R的行空间的一个向量:β=c1ρ1++crρr那么我们发现cj=bkj, 因为bkj=i=1rciR(i,kj)=i=1rciδi,j=cj特别地, 如果β=0, 即如果c1ρ1++crρr=0, 那么cj必须是零向量的第kj个分量, 于是cj=0,j=1,,r. 因此, ρ1,,ρr是线性无关的.
定理11.mn是正整数, 令F是一个域. 设WFn的一个子空间, 并且dimWm. 那么, 存在唯一的一个域F上的m×n的行简化阶梯矩阵以W作为其行空间.
证明. 至少存在一个以W为行空间的m×n的行简化阶梯矩阵, 因为既然dimWm, 我们可以挑选出W中的某m个向量α1,,αm张成W. 令A是以α1,,αm为行向量的m×n矩阵, 令R是与A行等价的行简化阶梯矩阵, 那么R的行空间就是W.
现在令R是任意的以W为行空间的行简化阶梯矩阵, 令ρ1,,ρrR的非零行向量, 设ρi的首非零元在第ki列, i=1,,r. 向量ρ1,,ρr构成了W的一个基. 在定理10的证明中, 我们观察到如果β=(b1,,bn)W之中, 那么有β=c1ρ1++crρr,并且ci=bki. 换句话说, β作为ρ1,,ρr的线性组合的唯一表示即β=i=1rbkiρi因此若读者知道了坐标分量bki,i=1,,r, 那么向量β就是确定的了. 例如, ρs可以被描述为W中唯一的第ks个坐标为1, 第ki个坐标为0的向量, 其中is.
βW之中而β0. 我们证明β的首非零元出现在某第ks列. 既然β=i=1rbkiρiβ0, 我们可以记β=i=srbkiρi,bks0[译注: 根据上下文可知, 这个s是满足bks0的最小的整数.] 根据行简化阶梯矩阵的条件, 我们知道若有i>sjks, 那么Ri,j=0, 于是β=(0,,0,bks,,bn),bks0β的首非零元即出现在第ks列. 读者也应该注意到, 对于每个ks,s=1,,r, 存在一个W中的向量, 其第ks个分量不为零, 即ρs.
现在看来RW唯一决定是很清晰的了. 基于W对于R的刻画如下. 我们考虑所有W中的向量β. 如果β0, 那么β的首非零元必然出现在某第t列之中:β=(0,,0,bt,,bn),bt0k1,,kr是那些正整数t, 满足存在W中的某个β0其首非零元出现在第t列. 将k1,,kr按照k1<k2<<kr的顺序排列. 对于每个正整数ks存在唯一的W中的向量ρs满足ρs的第ks个分量为1, 第ki个分量为0, 其中is. 那么, R就是以ρ1,,ρr,0,,0为行向量的行简化阶梯矩阵.
推论. 每个m×n矩阵A都行等价于唯一的一个行简化阶梯矩阵.
证明. 我们知道A至少行等价于一个行简化阶梯矩阵R. 如果A还行等价于另一个这样的矩阵R, 那么R行等价于R. 因此, RR拥有相同的行空间, 必然是等同的.
推论.AB是域F上的m×n矩阵, 那么AB行等价当且仅当它们拥有相同的行空间.
证明. 我们已经知道如果AB行等价, 那么它们拥有相同的行空间. 于是, 设AB拥有相同的行空间. 现在, A行等价于一个行简化阶梯矩阵R, B行等价于一个行简化阶梯矩阵R. 既然AB拥有相同的行空间, 那么RR也拥有相同的行空间. 因此R=R, A行等价于B.

总结一下, 如果AB是域F上的m×n矩阵, 那么以下陈述等价:

  1. AB行等价.
  2. AB拥有相同的行空间.
  3. B=PA, 其中P是一个m×m的可逆矩阵.
第4条等价的陈述其实是齐次线性方程组AX=0BX=0拥有相同的解. 然而, 尽管我们知道AB的行等价可以推出这两个方程组拥有相同的解, 似乎最好将反方向的证明留到后面再说.

第2.6节 关于子空间的计算

现在我们想要展示初等行变换是如何为回答与Fn的子空间有关的特定问题提供一种标准化的方法的. 我们已经推导出了所有我们将用到的事实. 为了读者的方便, 它们被总结在这里. 这里的讨论适用于任何域F上的n维向量空间, 只需要选取一个固定的有序基𝔅, 然后每个V中的向量α就可由n元组x1,,xn刻画, 其给出了α在有序基𝔅下的坐标.

假设给定了Fn中的m个向量α1,,αm, 我们考虑下列问题.

  1. 如何判定向量α1,,αm是否线性相关? 更一般地, 如何找出由这些向量张成的子空间W的维数?
  2. 给定Fn中的β, 如何判定β是否是α1,,αm的线性组合, 即β是否在子空间W中?
  3. 如何给出子空间W的一个显式描述?
第三个问题有些模糊, 因为它没有说明什么叫做一个"显式描述". 然而, 我们将给出我们心中所想的这种描述以扫清模糊. 根据这种描述, 问题一和问题二都可以立即回答.

A是一个带有行向量αim×n矩阵:αi=(Ai,1,,Ai,n).施行一系列初等行变换, 自A始, 终于行简化阶梯矩阵R. 之前我们已经说明过这是怎样做的. 此时, W (A的行空间) 的维数是显然易见的, 因为这个维数不过就是R的非零行向量的数目. 如果ρ1,,ρrR的非零行向量, 那么𝔅={ρ1,,ρr}W的一个基. 如果ρi的首非零元在第ki列, 那么对于ir我们有R(i,j)=0, 如果j<kiR(i,kj)=δi,jk1<<kr.子空间W由所有具有以下形式的向量构成:β=c1ρ1++crρr=i=1rci(Ri,1,,Ri,n)这样一个向量β的坐标b1,,bn因此是bj=i=1rciRi,j特别地, bkj=cj, 于是如果β=(b1,,bn)ρi的线性组合, 那么它就必须是以下特定的线性组合.β=i=1rbkiρi将此β上之条件转换为坐标形式即bj=i=1rbkiRi,j,j=1,,n这就是由α1,,αm张成的子空间W的显式描述, 即这个子空间由所有Fn中坐标满足显式描述的向量β构成. 显式描述是什么样的呢? 首先, 它将W描述为某个齐次线性方程组的所有解β=(b1,,bn). 这个方程组当然具有非常特别的性质, 因为它将(nr)个坐标表示为另外r个特别坐标bk1,,bkr的线性组合. 坐标bki的选择是完全自由的, 也就是说, 如果c1,,cr是任意的r的标量, 那么W中存在唯一的向量β满足以ci作为第ki个坐标.

重要的点在于此: 给定向量αi, 行规约是一种确定整数r,k1,,kr和标量Ri,j的直接方法, 其给出了由α1,,αm张成的子空间的显式描述. 读者应该注意到定理11表明每个Fn的子空间W都具有这样一个显式描述. 我们也应该指出问题2的一些东西. 我们已经在第1.4节陈述了如何找出一个m×m的可逆矩阵P满足R=PA. P的知识允许我们在可能的情况下找出满足β=x1α1++xmαm的标量x1,,xm. 这是因为R的行向量由ρi=j=1mPi,jαj给出, 于是若βαj的线性组合, 那么我们有β=i=1rbkiρi=i=1rbkij=1mPi,jαj=j=1mi=1rbkiPi,jαj因此xj=i=1rbkiPi,jxj的选择之一 (可能存在许多解).

这样一个问题, 即β=(b1,,bn)是否是αi的线性组合, 以及若是的情况下标量xi该是什么, 也可以通过问以下线性方程组i=1mAi,jxi=bj,j=1,,n是否有解, 以及解是什么来得出答案. 这个线性方程组的系数矩阵是n×m的矩阵B, 其列向量分别为α1,,αm. 第1章中我们讨论了使用初等行变换来解这样一个线性方程组BX=Y. 让我们考虑一个例子, 其中我们采取两种观点来回答有关Fn的子空间的问题.

例子21. 让我们提出以下问题. 令W是由向量α1=(1,2,2,1),α2=(0,2,0,1),α3=(2,0,4,3)张成的4的子空间.
  1. 证明α1,α2,α3W的一个基, 即这些向量是线性无关的.
  2. β=(b1,b2,b3,b4)W中的一个向量, 那么β相对于有序基{α1,α2,α3}的坐标是什么?
  3. α1=(1,0,2,0),α2=(0,2,0,1),α3=(0,0,0,3)证明α1,α2,α3构成了W的一个基.
  4. 如果βW中, 令Xβ相对于α基的坐标矩阵, X是相对于α基的坐标矩阵. 找出3×3的矩阵P满足对于每个这样的βX=PX.
为了用第一种方法回答这些问题, 我们构造以α1,α2,α3为行向量的矩阵A, 并找出行等价于A的行简化阶梯矩阵R. 同时, 我们将相同的操作施行于恒等矩阵之上以获得满足R=QA的可逆矩阵Q:[122102012043]R=[102001000001][100010001]Q=16[660251442]
  1. 显然R的秩为3, 于是α1,α2,α3是线性无关的.
  2. 什么样的向量β=(b1,b2,b3,b4)W之中? 我们有W的基ρ1,ρ2,ρ3, 即R的行向量. 读者只需一眼即可看出ρ1,ρ2,ρ3张成的空间由所有满足b3=2b1的向量β构成. 对于这样一个β我们有β=b1ρ1+b2ρ2+b3ρ3=[b1b2b4]R=[b1b2b4]QA=x1α1+x2α2+x3α3其中xi=[b1b2b4]Qi:x1=b113b2+23b4x2=b1+56b223b4x3=16b2+13b4
  3. 向量α1,α2,α3都具有(y1,y2,y3,y4)的形式, 其中y3=2y1, 因此它们都在W中. 读者一眼就能看出它们是线性无关的.
  4. 矩阵PPj=[αj]𝔅为列, 其中𝔅={α1,α2,α3}. 前面b里的结果已经告诉我们该如何找出α1,α2,α3的坐标矩阵了. 例如, 若β=α1我们有b1=1,b2=0,b3=2,b4=0, 然后x1=113(0)+23(0)=1x2=1+56(0)23(0)=1x3=16(0)+13(0)=0因此α1=α1α2. 类似地, 我们可以得到α2=α2α3=2α12α2+α3. 于是,P=[102112001]
现在让我们看看如何用我们描述的第二种方法回答这些问题. 我们构造以α1,α2,α3为列向量的4×3矩阵B:B=[102220204113]我们问对于什么样的y1,y2,y3,y4方程组BX=Y有解.[102y1220y2204y3113y4][102y1024y22y1000y32y1015y4y1][102y1006y22y4015y4y1000y32y1][100y113y2+23y400116(2y4y2)010y1+56y223y4000y32y1]因此方程组BX=Y有解的条件是y3=2y1. 于是, β=(b1,b2,b3,b4)W中当且仅当b3=2b1. 如果βW中, 那么有序基{α1,α2,α3}下的坐标(x1,x2,x3)可以从上面最后一个矩阵读出来. 其实我们就是又一次得到了第一种方法做出来的结果. 问题c和d可以像之前一样回答.
例子22. 我们考虑5×5矩阵A=[12030121100014024110100001]以及以下和A有关的问题.
  1. 找出一个可逆矩阵P满足PA是行简化阶梯矩阵R.
  2. 找出A的行空间W的一个基.
  3. 说明什么样的向量(b1,b2,b3,b4,b5)W中.
  4. 找出W中的每个向量(b1,b2,b3,b4,b5)在b选择的有序基下的坐标矩阵.
  5. W中的每个向量(b1,b2,b3,b4,b5)写成A的行的线性组合的形式.
  6. 给出所有满足AX=05×1的列矩阵X构成的向量空间V的显式描述.
  7. 找出V的一个基.
  8. 对于什么样的5×1的列矩阵Y, 方程组AX=Y有解?
为了解决这些问题, 我们构造方程组AX=Y的增广矩阵A, 并对其施行一系列合适的行变换.[12030y112110y200140y3241101y400001y5][12030y100140y1+y200140y3001412y1+y400001y5][12030y100140y1y200000y1+y2+y3000013y1+y2+y400001y5][12030y100140y1y200001y500000y1+y2+y3000003y1+y2+y4y5]
  1. 如果对于所有的YPY=[y1y1y2y5y1+y2+y33y1+y2+y4y5]那么P=[1000011000000011110031011]因此PA是行简化阶梯矩阵R=[1203000140000010000000000]必须要强调的是矩阵P不是唯一的, 实际上存在很多种可能的矩阵P (来源于规约的不同顺序) 满足PA=R.
  2. 我们可以提取R非零行ρ1=(1,2,0,3,0)ρ2=(0,0,1,4,0)ρ3=(0,0,0,0,1)作为W的一个基.
  3. 行空间W由所有具有形式β=c1ρ1+c2ρ2+c3ρ3=(c1,2c1,c2,3c1+4c2,c3)的向量构成, 其中c1,c2,c3是任意的标量. 因此, (b1,b2,b3,b4,b5)W中当且仅当(b1,b2,b3,b4,b5)=b1ρ1+b3ρ2+b5ρ3其为真当且仅当b2=2b1,b4=3b1+4b3这个线性方程组是显式描述的实例, 而通过它我们可以一眼看出一个给定向量是否在W之中. 因此, (5,10,1,11,20)A的行的线性组合, 而(1,2,3,4,5)不是.
  4. 向量(b1,2b1,b3,3b1+4b3,b5)在有序基{ρ1,ρ2,ρ3}下的坐标矩阵显然是[b1b3b5].
  5. 许多种方法都可以将W的向量写成A的行的线性组合, 或许最简单的一种是遵循例子21之前的第一个过程的步骤:β=(b1,2b1,b3,3b1+4b3,b5)=[b1b3b500]R=[b1b3b500]PA=[b1b3b500][1000011000000011110031011]A=[b1+b3b300b5]A特别地, 如果β=(5,10,1,11,20)我们有β=[410020][12030121100014024110100001]
  6. 方程组RX=0中的方程是x1+2x2+3x4=0x3+4x4=0x5=0因此, V由所有具有形式[2x23x4x24x4x40]的列向量构成, 其中x2x4是任意的.
  7. 列向量[21000],[30410]构成了V的一个基, 这是例子15所描述的基的一个例子.
  8. 方程组AX=Y有解当且仅当y1+y2+y3=03y1+y2+y4y5=0
练习1.s<nA是一个域F上的s×n矩阵, 使用定理4 (但不是其证明) 证明Fn×1中存在非零的X满足AX=0.
练习2.α1=(1,1,2,1),α2=(3,0,4,1),α3=(1,2,5,2)α=(4,5,9,7),β=(3,1,4,4),γ=(1,1,0,1)
  1. α,β,γ中哪些在αi张成的4的子空间之中?
  2. α,β,γ中哪些在αi张成的4的子空间之中?
  3. 这是否暗示了一个定理?
练习3. 考虑以下4中的向量α1=(1,0,1,2),α2=(3,4,2,5),α3=(1,4,0,9)找出一个齐次线性方程组, 其解空间恰是这些向量张成的子空间.
练习4.3中, 令α1=(1,0,i),α2=(1+i,1i,1),α3=(i,i,i)证明这些向量构成了3的一个基. 向量(a,b,c)在这个基下的坐标是什么?
练习5. 给出5中的向量β=(b1,b2,b3,b4,b5)的显式描述, 其为向量α1=(1,0,2,1,1),α2=(1,2,4,2,0),α3=(2,1,5,2,1),α4=(2,1,3,5,2)的线性组合.
练习6.V是由矩阵A=[321090171212140616421130]的行张成的实向量空间.
  1. 找出A的一个基.
  2. 什么样的向量(x1,x2,x3,x4,x5)V的元素.
  3. 如果(x1,x2,x3,x4,x5)V中, 那么它在a选择的基下的坐标是什么?
练习7.A是域F上的m×n矩阵, 考虑线性方程组AX=Y. 证明该线性方程组有解当且仅当A的行秩等于其增广矩阵的行秩.