第6章 初等标准形式
第6.1节 引论
之前我们已经提过我们的主要目的在于研究有限维向量空间上的线性变换. 到目前为止, 我们已经见过了许多线性变换的特殊例子, 并且证明了一些关于一般线性变换的定理. 在有限维的情形我们利用有序基通过矩阵来表示这样的变换, 这种表示增添了我们对于其行为的直觉. 我们探索了向量空间, 其由从一个向量空间到另一个的线性变换构成. 我们也探索了, 其由从一个向量空间到自身的线性变换构成.
在接下来的两章中, 我们将主要关心线性算子. 我们的流程是选取一个有限维向量空间上的单独的一个线性算子, 将它拆下来, 看看什么使其运转. 在这早期阶段, 将我们的目标以矩阵的语言表述是最为简单的: 给定线性算子, 找出的一个有序基使得的矩阵呈现特别简单的形式.
现在对于我们心中所想作一个基本的刻画. 或许最简单的矩阵, 除了恒等矩阵之外, 就是对角矩阵了:令是一个维向量空间上的线性算子. 如果我们能够找到的一个有序基使得由上面的对角矩阵表示, 那么我们能够获得和有关的相当信息. 例如, 和有关的简单数字, 比如说和秩或者的行列式, 看一眼矩阵就能出来. 我们可以显式描述的像和零空间. 既然当且仅当那么像就是由那些的张成的子空间, 零空间就是由剩下来的张成的. 似乎可以这样说, 如果我们知道了一个基和一个对角矩阵满足, 那么我们就能轻易回答一切与有关的问题.
是否每个线性算子都可以在某个有序基下表示为对角矩阵呢? 如果不是的话, 那么什么样的算子下这样的基存在呢? 如果存在这样的基的话, 那么我们又该怎么找到它呢? 如果这样的基不存在的话, 那么可以表示的最简单的矩阵类型是什么样的呢? 这些是我们将在本章 (和下一章) 解决的问题. 随着我们理解到其中的困难, 一些问题的形式也会变得更加复杂.
第6.2节 特征值
前一节的评注为我们提供了尝试分析一般线性算子的起点. 之前的线索暗示着我们应该研究这样的向量, 其由送至自身的标量倍数.
定义. 令
是域
上的向量空间而
是
上的线性算子.
的一个特征值是一个
中的标量
, 存在
中非零的向量
使得
. 如果
是
的特征值, 那么
- 任何满足的向量都被称为在特征值下的特征向量.
- 所有满足的向量构成的集合被称为在特征值下的特征空间.
特征值 (characteristic value) 也被称为特征根 (characteristic root), 隐式根 (latent root), 特征值 (eigenvalue), 特征值 (proper value) 或者谱值 (spectral value). 本书我们将只使用"特征值 (characteristic value)"这个名字.
如果是任意的线性算子而是任意的标量, 所有满足的向量的集合是的子空间, 实际上它就是线性变换的零空间. 我们称是的特征值, 如果该子空间异于零子空间, 即不是单射的. 在是有限维的情况下, 不是单射恰当其行列式等于零.
定理1. 令
是有限维向量空间
上的一个线性算子,
是一个标量, 那么以下是等价的.
- 是的特征值.
- 算子是奇异的 (不可逆的).
- .
行列式判则iii是非常重要的, 因为它告诉我们从哪里寻找的特征值. 既然是对于变量的次多项式, 那么我们所求的特征值就是该多项式的根. 让我们仔细解释这个想法.
如果是的基并且, 那么可逆当且仅当矩阵可逆. 据此, 我们有如下定义.
定义. 如果是域上的一个矩阵, 那么的一个在中的特征值是一个中标量满足矩阵是奇异的 (不可逆的).
既然是的特征值当且仅当或者等价地当且仅当, 我们构造以多项式为元素的矩阵并考虑多项式. 显然在中的特征值不过就是中满足的标量. 出于这样的原因被称为的特征多项式. 注意到是一个次数恰为的首项系数为一的多项式是重要的. 这很容易从基于元素的矩阵的行列式公式中看出来.
引理. 相似矩阵拥有相同的特征多项式.
证明. 如果
, 那么
这条引理允许我们将算子的特征多项式定义为任意在某个的有序基下表示的矩阵的特征多项式. 正如矩阵一样, 特征值就是的特征多项式的根. 特别地, 这表明不可能拥有多于个不同的特征值. 我们也应该指出可能没有任何特征值.
例子1. 令是上的线性算子, 其在标准有序基下由矩阵表示. (或者) 的特征多项式为既然这个多项式没有实根, 那么就没有特征值. 如果是上的线性算子, 其在标准有序基下由表示, 那么就有两个特征值, 和. 这里我们看到了微妙的一点. 在讨论一个矩阵的特征值时, 我们必须小心地规定所涉及的域. 上面的矩阵在中没有特征值, 但在中有两个特征值和.
例子2. 令是的(实)矩阵那么的特征多项式为因此的特征值是和.
设是上的线性算子, 其在标准基下由表示. 让我们找出在特征值和下的特征向量. 现在显然一眼就可以看出的秩等于 (因此的零化度为). 于是特征值下的特征向量的空间是一维的. 向量可以张成的零空间. 因此当且仅当是的标量倍数. 现在考虑显然的秩也是, 于是在特征值下的特征向量的空间维数是. 显然当且仅当是的标量倍数.
定义. 令是有限维向量空间上的一个线性算子. 我们称是可对角化的, 如果存在的一个基满足其中每个向量都是的特征向量.
为什么要叫这个名字应该是很显然的, 因为如果存在的一个有序基满足每个都是的特征向量, 那么在有序基下的矩阵是对角的. 如果, 那么我们当然并不需要标量互异. 实际上, 它们可以是相同的标量 (当是恒等算子的标量倍数时).
我们也可以将可对角化定义为存在的一集特征向量可以张成. 这与之前的定义只是表面上不同而已, 因为我们可以从任意能够张成的一集向量中挑选出一个基.
对于例子1和2我们故意挑选了在上不可对角化的线性算子. 在例子1中, 上的这个线性算子之所以是不可逆的, 是因为它没有特征值. 在例子2中, 线性算子的确有特征值. 实际上, 的特征多项式可以在实数域上被分解完全: . 然而, 并非可对角化的. 在的两个特征值下每个特征空间都只是一维的, 因此我们并不能构造出一个全由的特征向量构成的的基.
设是一个可对角化的线性算子. 令是互异的特征值. 那么存在一个有序基满足其下由一个以标量为对角元素的对角矩阵表示, 每个标量均重复特定的次数. 如果重复了次, 那么(我们可以重新排列有序基的向量顺序使得)该矩阵具有如下分块形式其中是的恒等矩阵. 从中我们看出两件事. 首先, 的特征多项式是(可能重复的)线性因子之积:如果标量域是代数闭域, 例如复数域, 那么每个上的多项式都可以被这么分解 (见第4.5节). 然而, 如果不是代数闭域, 当我们说的特征多项式有这样一种分解时, 我们是在声明的一个特别性质. 第二件能看出来的事情是 (作为的重根次数) 等于与特征值相关的特征空间的维数. 这是因为对角矩阵的零化度等于其主对角线上零的数目, 而矩阵在其主对角线上拥有个零. 这个特征空间的维数与特征值作为的根的重数之间的关系最初看上去并不令人兴奋. 然而, 它为我们提供了一种更简单的判断给定算子是否可对角化的方法.
引理. 设. 如果是任意的多项式, 那么.
证明. 作为练习.
引理. 令是有限维向量空间上的线性算子. 令是不同的特征值, 而是特征值下的特征空间. 如果, 那么实际上, 如果是的一个有序基, 那么是的一个有序基.
证明. 空间
是由
的所有特征向量张成的子空间. 当一个人构造子空间
之和
时, 通常会预料
, 因为不同空间的向量之间也可能存在线性关系. 这条引理告诉我们不同特征值下的特征空间是独立的.
设(对于每个
)我们有一个
中的向量
, 并且假定
. 我们将证明对于每个
有
. 令
是任意的多项式. 既然
, 那么之前的引理告诉我们
选择多项式
使得
那么
现在令
是
的一个有序基, 令
是序列
, 那么
能够张成子空间
. 并且,
也是线性无关的向量序列, 原因如下. 任何
中向量之间的线性关系都具有
的形式, 其中
是
中的向量的线性组合. 根据我们刚才得到的结果, 我们知道对于每个
有
. 既然每个
都是线性无关的, 那么显然
中的向量之间只存在平凡的线性关系.
定理2. 令
是有限维向量空间
上的线性算子, 令
是
不同的特征值, 令
是
的零空间, 以下条件是等价的.
- 是可对角化的.
- 的特征多项式为并且.
- .
证明. 我们已经观察到i可以推出ii. 如果特征多项式
是如ii所示的线性因子之积, 那么
, 因为
之和就是特征多项式的次数, 而这个次数就是
. 于是, ii能够推出iii. 设iii成立. 根据引理, 我们必须有
, 即
的特征向量能够张成
.
定理2的矩阵类比可以按照如下方式陈述. 令是一个元素来源于域的矩阵, 令是在中不同的特征值. 对于每个, 令是满足的列矩阵的空间, 当然的元素应该来源于, 令是的一个有序基. 我们将基连在一起以构成了一个矩阵的列的序列:矩阵在域上能够相似于一个对角矩阵当且仅当是一个方阵. 当是方阵的时候, 可逆并且是对角矩阵.
例子3. 令是上的线性算子, 其在标准基下由矩阵表示. 让我们指出读者计算特征多项式的一种可能方式, 使用行变换和列变换:在这两个特征值下的特征空间的维数是多少呢? 我们有我们知道是奇异的, 并且显然有. 因此, . 另外, 显然有.
令和分别是特征值和下的特征空间, 我们知道和. 根据定理2, 是可对角化的. 很容易找出的一个基满足其下由一个对角矩阵表示. 的零空间由向量张成, 于是是的一个基. 的零空间 (即空间) 由满足的向量构成. 因此, 的基的一个例子是如果, 那么是对角矩阵可对角化的事实意味着原本的矩阵(在上)相似于对角矩阵. 使得我们能够将基下的坐标转换为标准基下的坐标的矩阵(当然)以的转置为列向量:而且, , 于是
练习1. 以下的每种情形, 令是上的线性算子, 其在的标准有序基下由矩阵表示. 并且, 令是上的线性算子, 其在的标准有序基下也由矩阵表示. 找出和的特征多项式, 找出和的特征值, 以及找出每个特征值所对应的特征空间的一个基.
练习2. 令是域上的一个维向量空间. 上的恒等算子的特征多项式是什么? 上的零算子的特征多项式是什么?
练习3. 令是域上的一个的三角矩阵. 证明的特征值就是其对角线的元素, 即标量.
练习4. 令是上在标准有序基下由矩阵表示的线性算子. 证明是可对角化的, 通过给出的一个基, 其每个向量都是的特征向量.
练习5. 令域上是否相似于一个对角矩阵? 域上是否相似于一个对角矩阵?
练习6. 令是上在标准有序基下由矩阵表示的线性算子. 在何种条件下使得是可对角化的?
练习7. 令是维向量空间上的一个线性算子. 如果具有个不同的特征值, 证明是可对角化的.
练习8. 令和是域上的矩阵, 证明如果是可逆的, 那么也是可逆的, 并且
练习9. 使用练习8的结果证明, 如果和是域上的矩阵, 那么和在域中恰好拥有相同的特征值.
练习10. 设是一个的实对称矩阵, 证明在上相似于一个对角矩阵.
练习11. 令是一个的复矩阵满足, 证明要么, 要么在上相似于
练习12. 使用练习11的结果证明, 如果是一个的复矩阵, 那么在上相似于以下两种类型的矩阵中的一种:
练习13. 令是所有从到的连续函数构成的向量空间, 令是上由定义的线性算子, 证明没有特征值.
练习14. 令是的对角矩阵, 它的特征多项式为其中是不同的标量. 令是所有与交换的矩阵构成的向量空间, 证明的维数是.
练习15. 令是, 矩阵, 是上"左乘"的线性算子, 和具有相同的特征值吗?
第6.3节 零化多项式
在尝试分析一个线性算子的时候, 知道能够零化的多项式类是很有用的. 更确切地说, 设是域上的向量空间上的线性算子. 如果是域上的多项式, 那么也是上的线性算子. 如果是另一个域上的多项式, 那么因此, 零化的多项式 (意即) 的集合是多项式代数的理想. 它可能是零理想, 也就是说可能不由任何非零多项式零化. 但是, 如果是有限维的, 这种情况是不可能发生的.
设是一个维空间上的线性算子. 看看的前次幂:这是中个算子的序列, 即上的线性算子的空间. 空间是维的, 因此这个算子的序列必然是线性相关的, 也就是说存在不是全零的标量满足于是, 零化的多项式理想中有一个非零的多项式, 其次数小于等于.
根据第4章的定理7, 每个非零的多项式理想都可由某个首项系数为一的多项式生成. 因此, 存在一个与相关的首项系数为一的多项式满足以下性质: 如果是一个域上的多项式, 那么当且仅当, 其中是某个上的多项式.
定义. 令是一个域上的有限维向量空间上的线性算子. 的极小多项式是零化的域上的多项式理想的(唯一的)首项系数为一的生成元.
"极小多项式"这个名字来源于这个多项式理想的生成元可由理想中次数最小的首项系数为一多项式刻画. 这意味着线性算子的极小多项式由以下三条性质唯一确定:
- 是标量域上的首项系数为一的多项式.
- .
- 没有能够零化的域上的多项式次数比低.
如果是域上的一个矩阵, 我们可以按照类似的方式定义的极小多项式, 即域上零化的多项式理想的那个唯一的首项系数为一的生成元. 如果在某个有序基下由矩阵表示, 那么和有着相同的极小多项式. 这是因为在这个基下由矩阵表示, 于是当且仅当.
上面关于算子和矩阵的评注也可说明相似矩阵拥有相同的极小多项式. 从定义看这个事实也是显然的, 因为对于每个多项式有
关于矩阵的极小多项式的另一个基本评注也是应该说的. 设是一个矩阵, 其元素来源于域. 设是以为子域的一个域. (例如, 的元素可能是有理数, 而是实数域. 或者, 的元素是实数, 而是复数域.) 我们既可以将当成上的矩阵, 也可以将其当作上的矩阵. 从表面上来看, 似乎我们会得到的两个不同的极小多项式. 幸运的是, 这并不会发生, 我们必须明白为什么. 当被视为域上的矩阵时, 其极小多项式的定义是什么? 我们考虑能够零化的系数来源于的首项系数为一的多项式, 并挑选其中次数最小的那个. 如果是域上的一个首项系数为一的多项式:那么仅仅是说我们有了一个的幂之间的线性关系:极小多项式的次数是满足存在以上形式的之间的线性关系的最小的正整数. 而且, 根据极小多项式的唯一性, 对于而言有且仅有一种这样形式的关系, 即一旦最小的确定下来了, 存在唯一的中标量能够使得以上形式的关系成立. 它们是极小多项式的系数.
现在(对于每个)我们有一个"未知元"的具个方程的线性方程组. [译注: 也就是考虑的个元素得到的线性方程组.] 既然的元素都在中, 那么该线性方程组的系数也都在中. 因此, 如果该方程组有中的的解, 那么它就有中的的解. (见第1.4节末.) 现在读者显然可以看出两个极小多项式应该是相同的. [译注: 而且, 这是因为此时解是唯一的.]
到目前为止, 关于维空间上的线性算子的极小多项式, 我们知道什么呢? 我们只知道它的次数不超过. 这实际上是一个相当糟糕的估计, 因为它的次数不可能超过. 我们将简短地证明该算子由其特征多项式零化. 首先, 让我们观察到一个基本事实.
定理3. 令是维向量空间上的一个线性算子 (或者, 令是一个矩阵), 那么 (或者) 的特征多项式和极小多项式具有相同的根, 不计重数.
证明. 令
是
的极小多项式. 令
是一个标量. 我们想要证明的是
当且仅当
是
的一个特征值.
首先, 设
, 那么
其中
是一个多项式. 既然
, 那么极小多项式
的定义告诉我们
. 选择一个向量
使得
. 令
, 那么
即
是
的一个特征值.
现在设
是
的一个特征值, 即存在
使得
. 正如我们在之前的引理中所注意到的,
既然
而
, 我们有
.
令是一个可对角化线性算子而是其不同的特征值, 那么很容易看出来的极小多项式为如果是一个特征向量, 那么算子之一将送至, 因此对于每个特征向量有对于所变换的空间, 存在一个全由的特征向量构成的基, 于是总结一下. 如果是一个可对角化的线性算子, 那么的极小多项式是不同的线性因子之积. 我们很快将看到, 这个性质刻画了可对角化算子.
例子4. 让我们试着寻找一下例子1, 2, 3里的线性算子的极小多项式. 我们将以相反的顺序讨论它们. 例子3中的线性算子被我们发现是可对角化的, 并且其特征多项式为根据前一段的论述, 我们知道的极小多项式为读者可能会发现直接验证一下要更令人放心一点. 在例子2中, 算子的特征多项式也是. 但是, 这个不是可对角化的, 所以我们并不能知道其极小多项式就是. 在这种情况下, 关于极小多项式我们又知道什么呢? 从定理3中我们得知其根是和, 但是重数未知. 因此, 我们在具有形式的多项式中寻找. 先试试:于是, 极小多项式的次数至少为. 于是, 接下来我们应该尝试或者. 后者是特征多项式, 似乎是不那么随机的选择. 读者通过计算可以发现, 因此的极小多项式就是其特征多项式. [译注: 虽然例子2中的是实向量空间上的线性算子, 以至于看起来极小多项式和特征多项式拥有相同的根的事实并不能保证极小多项式就是由那两个线性因子的幂构成. 但是, 我们也可以将其当作复数域上的线性算子, 根据前面的论证, 其极小多项式也是一样的, 而复数域是代数闭域.] 在例子1中我们讨论了上的线性算子, 其在标准基下由矩阵表示. 它的特征多项式为, 其没有实根. 为了确定极小多项式, 让我们忘了而专注于. 如果将其视为复矩阵, 那么具有特征值和. 这两个根都必须出现在极小多项式的根里, 因而极小多项式被整除. 验证是平凡的, 于是极小多项式就是.
定理4. (Cayley-Hamilton). 令是有限维向量空间上的一个线性算子. 如果是的特征多项式, 那么. 换言之, 极小多项式整除特征多项式.
证明. 之后我们将会给出另外两个独立于此证明的证明. 当前这个证明, 尽管比较短, 可能难以理解. 除了简洁性, 它还有一个优点, 就是提供了第5章建立的行列式理论的一个富于启发性且远非平凡的应用.
令
是一个含幺交换环, 其由所有以
为变元的多项式构成. 当然,
实际上是一个标量域上的含幺元的交换代数. 选择
的一个有序基
, 令
是在此给定基下表示
的矩阵, 那么
这些式子也可以被写成以下等价的形式
令
的元素为
当
时, 有
并且 [译注: 在某种意义上, 这里存在一个"类型错误", 因为
是多项式而
是一个线性算子, 更正确的陈述是
, 至于多项式变元是何种符号则无关紧要. 下面仍然有许多类型错误, 还请读者自行甄别.]
其中
是特征多项式:
对于
的情形, 显然也有
这是因为
是矩阵
的行列式, 该矩阵的元素为多项式 [译注: 这里作者不小心将
写成了
, 但是不影响论证的合法性, 因为转置并不影响矩阵的行列式的值]
我们想要证明
. 为了证明
是零算子, 只需要证明其充要条件就够了, 即对于
有
. 根据
的定义, 向量
满足等式
当
时, 它或许暗示我们将其写成以下形式 [译注: 这完全是形式上的, 至于其内在的涵义, 则需要读者仔细考察, 下面的推理亦是如此]
在此情形之下, 古典伴随
是矩阵
并且
因此, 我们有
一般情况下, 令
, 那么对于每对
和
, 根据
的定义可得 [译注: 这里的
只是附带的系数, 不被求和所绑定]
在
上求和, 我们有
既然
, 于是
因此对于
, 我们得到
证明. 以上证明的叙述有些混乱, 译者在此试图将其整理成更加清晰易读的形式. 设
是
的一个有序基, 而
是
在此有序基下的矩阵表示. 令
, 这是多项式环上的矩阵. 另外, 设
是
的特征多项式, 那么我们知道
, 以及
. 根据
的定义, 我们知道
这里的
是一个多项式, 而应用一个多项式于线性算子是第4章所定义的操作, 其结果仍然是一个线性算子. 接着, 我们可以推出对于
有
在
上求和, 我们得到
分别令
, 可得
既然
是
的一个基, 而
在基的每个向量上都为零, 那么
本身肯定是一个零变换.
译者注记. 以上我们补充的证明中的和原来的证明中的恰好是互为转置的关系. 读者可以看到, 这并不影响证明, 只是原本与矩阵乘法在形式上暗合的推理变成了转置了的顺序反转的版本而已. 作者的潜在想法实际上是这样的, 虽然原文只是在的情况下提了一下. 对于多项式上的矩阵, 我们可以定义一个应用矩阵于线性算子的entrywise操作, 其结果是一个以线性算子为元素的矩阵, 即将多项式上的矩阵的逐个元素应用于线性算子得到的矩阵. 这个操作可以保持矩阵乘法, 即如果和是多项式上的矩阵, 而是一个线性算子, 那么. 这里的纯粹是形式上的矩阵乘法, 其每个元素都是线性算子相乘再相加得到的. 虽然线性算子在一般情况下并不交换, 但在这里相乘的顺序的确没有那么重要, 因为我们知道对于多项式和有. 除了应用多项式矩阵于线性算子和线性算子矩阵的乘法之外, 我们还需要定义应用线性算子的矩阵于向量的列矩阵的形式操作, 这点在形式上当然和矩阵乘法也是一样的, 只是乘法变成了函数应用而已. 关键的一点在于, 如果是这样一个向量的列矩阵, 那么这个形式上的"乘法结合律"的确也是成立的. 在定义了这些形式操作并知道这几条性质之后, 那么Cayley-Hamilton的证明的确没有什么魔法可言.
此时此刻Cayley-Hamilton定理对于我们有用主要是因为它缩小了我们寻找线性算子的极小多项式的搜索范围. 如果我们知道了在某个有序基下表示的矩阵, 那么我们可以计算特征多项式. 我们知道极小多项式整除, 并且它们拥有相同的根. 不过, 除非次数很小, 没有方法可以精确计算多项式的根. 然而, 如果可以被分解为那么这就是在一般情况下我们能够断言的全部事情了. 如果的确是这样的多项式并且其次数为, 那么对于每个具有这种形式的多项式, 我们可以找到一个的矩阵满足以为特征多项式而为极小多项式. 暂时我们还不会证明这个. 但是, 我们想强调的是, 具有这种形式的特征多项式告诉我们了极小多项式所具有的形式. 至于其他内容, 则无可奉告.
例子5. 令是的(有理数)矩阵的幂是容易计算的:因此, , 即如果, 那么. 的极小多项式必然整除. 这个极小多项式的次数显然不是, 因为次数为意味着是恒等矩阵的标量倍数. 因此, 极小多项式的候选者为: . 这三个二次的多项式也很容易排除, 因为一眼就能看出, , . 于是, 即的极小多项式. 并且, 是的特征值. 特征多项式里这三个因子之一必然要重复两次. 显然, . 因此, 与特征值相关联的特征空间是维的. 根据定理2, 特征多项式显然是, 并且在有理数域上相似于矩阵
练习1. 令是有限维向量空间. 上的恒等算子的极小多项式是什么? 上的零算子的极小多项式是什么?
练习2. 令是一个域的元素, 是以下上的矩阵:证明的特征多项式为, 并且这也是的极小多项式.
练习3. 令是的实矩阵证明的特征多项式为, 而这也是其极小多项式.
练习4. 练习3的矩阵在复数域上是可对角化矩阵吗?
练习5. 令是一个维向量空间而是上的一个线性算子. 设存在某个正整数使得, 证明.
练习6. 找出一个的矩阵, 其极小多项式是.
练习7. 令是一个正整数, 是次数不超过的实多项式的向量空间, 是上的微分算子. 的极小多项式是什么?
练习8. 令是上将每个向量平行于轴投影于轴的算子: . 表明是线性的. 的极小多项式是什么?
练习9. 令是一个的矩阵, 其特征多项式为证明
练习10. 令是域上的矩阵的向量空间. 令是一个固定的矩阵. 令是上由定义的线性算子. 证明的极小多项式是的极小多项式.
练习11. 令和是域上的矩阵. 根据6.2节的练习9, 矩阵和拥有相同的特征值. 它们有着相同的特征多项式吗? 它们有着相同的极小多项式吗?
第6.4节 不变子空间
本节我们将引入一些在试图分析一个线性算子时有用的概念. 我们将运用这些想法来获得基于极小多项式的对于可对角化 (和可三角化) 算子的刻画.
定义. 令是一个向量空间而是上的一个线性算子. 如果是的一个子空间, 那么我们称在下不变, 如果对于每个向量有向量, 即.
例子6. 如果是上任意的线性算子, 那么和零子空间在下不变. 的像和零空间也在下不变.
例子7. 令是一个域而是多项式空间上的微分算子. 令是正整数而是次数小于等于的多项式的子空间, 那么在下不变. 这只是另一种陈述是"次数降低"的算子的方式.
例子8. 这里给出例子6的一种非常有用的泛化. 令是上的一个线性算子, 是任意的与交换的线性算子, 即. 令是的像, 而是的零空间, 那么和都在下不变. 如果在的像中, 比如说, 那么, 于是也在的像中. 如果, 那么, 因而.
是一类与交换的算子, 其中是一个多项式. 例如, 我们可以有, 其中是的一个特征值. 这个的零空间对于我们而言是熟悉的. 我们看到这个例子包含了显见的事实, 即与某个特征值相关联的的特征空间在下是不变的.
例子9. 令是上的线性算子, 其在标准有序基下由矩阵表示, 那么在下不变的仅有平凡的子空间. 若有其他的不变子空间, 那它必然是维的. 但是, 若是由某个非零向量张成的子空间, 那么在下不变的事实意味着是一个特征向量, 但是没有实特征值.
当子空间在算子下不变时, 导出了空间上的一个线性算子, 其由定义. 不过, 和是相当不同的对象, 因为其定义域是而不是.
若是有限维的, 那么在下的不变性有一个简单的矩阵解释, 或许我们现在就应该提到它. 设我们选取了的一个有序基使得是的一个有序基 (). 令, 于是既然在下不变, 那么对于有, 这意味着换言之, 对于且, .
若试图将写下来, 其具有分块形式其中是一个矩阵, 是一个矩阵, 是一个矩阵. 读者应该注意到, 根据定义, 矩阵恰是导出算子在有序基下的矩阵.
往往我们并不利用矩阵的分块形式展开关于和的论证, 但是我们应该注意到这样的分块形式呈现了和之间怎样的显然关系.
引理. 令是下不变的子空间. 限制算子的特征多项式整除的特征多项式. 的极小多项式整除的极小多项式.
证明. 我们有
其中
而
. 对于这样的分块形式, 我们知道
此即证明了关于特征多项式的陈述. 注意到这里的三个
的大小是不同的.
矩阵
的
次幂具有分块形式
其中
是某个
的矩阵. 因此, 任何零化
的多项式也零化
(还有
). 于是,
的极小多项式整除
的极小多项式.
译者注记. 对于多项式, 具有形式其中是某个的矩阵. 另外, 关于分块矩阵的运算性质, 原书几乎没有任何讨论, 或许读者应该参考其他线性代数教材.
例子10. 令是有限维向量空间上任意的线性算子. 令是的所有特征向量张成的子空间. 令是不同的特征值. 对于每个, 令是与特征值相关的特征空间, 并令是的一个有序基. 定理2前的引理告诉我们是的一个有序基, 因而令, 其中最前面的一些向量构成了基, 接下来的一些构成了基, 诸如此类. 那么, 我们得到其中而重复次.
现在在下不变, 因为对于每个, 我们有选取任意其他的向量使得是的一个基, 那么在下的矩阵具有之前所呈现的那种分块形式, 并且限制算子相对于基的矩阵为 (即) 的特征多项式为其中. 而且, 整除, 是的特征多项式. 因此, 作为的根的重数至少为.
以上这些讨论应该能够使得定理2透明起来. 它仅仅是说是可对角化的当且仅当, 当且仅当. 在不可对角化的情形下, 它不是很有用, 因为我们不知道分块形式中的矩阵和是什么.
定义. 令是下不变的子空间, 而是中向量. 从到的导子 (-conductor) 是集合, 其由所有(标量域上)满足的多项式构成.
既然算子在大多数讨论中都是固定的, 我们也常扔掉下标而就记作. 许多作者通常将这个多项式的集合称为"stuffer" (das einstopfende Ideal). "conductor"是更标准的术语, 想象一下, 一个不那么激进的算子, 温和地将向量送往. 在的特别情况下, 这个导子也被称为的零化子 (-annihilator).
引理. 如果是下不变的子空间, 那么对于每个多项式, 在下不变. 因此, 对于每个, 导子是多项式代数中的一个理想.
证明. 如果
, 那么
. 因此,
. 根据归纳, 对于每个自然数
有
. 取线性组合则能看出对于每个多项式
,
.
即便
是
的任意子集,
的定义还是可以成立的. 如果
是
是子空间, 那么
是
的子空间, 因为
如果
还在
下不变, 令多项式
, 即
. 如果
是任意的多项式, 那么
. 既然
那么
. 因此, 导子吸收了乘法.
理想唯一的首项系数为一的生成元也被称为从到的导子 (在的情况下也被称为零化子). 从到的导子是满足的次数最低的首项系数为一的多项式. 多项式当且仅当整除. 注意到导子总是包含的极小多项式. 因此, 每个导子都整除的极小多项式.
作为如何使用导子的第一个例子, 我们将刻画可三角化算子. 线性算子被称为是可三角化的, 如果其在某个有序基下由三角矩阵表示.
引理. 令
是域
上的一个有限维向量空间. 令
是
上的线性算子, 其极小多项式为线性因子之积
令
是
下不变的一个真子空间 (
). 存在向量
满足
- ;
- , 其中是线性算子的某个特征值.
证明. a和b是在说从
到
的
导子是一个线性的多项式. 令
是任意的不在
之中的向量. 令
是从
到
的
导子, 那么
整除
, 其中
是
的极小多项式. 既然
, 多项式
不可能是常量多项式. 因此,
其中至少有一个
是正的. 选择使得
的
, 那么
整除
:
根据
的定义, 向量
, 但是
定理5. 令是域上的一个有限维向量空间, 是上的一个线性算子, 那么是可三角化的当且仅当的极小多项式是域上的线性多项式之积.
证明. 设极小多项式被分解为
重复应用上述引理, 我们将会抵达一个有序基
, 而其下表示
的矩阵是上三角的:
这个式子仅仅是说
即
在由
张成的子空间之中. 为了找出
, 我们从应用引理于
的情形开始, 这就得到了向量
. 接着, 应用引理于
, 此即
张成的空间, 我们就得到了
. 然后, 应用引理于
, 即由
和
张成的空间, 续行此法. 值得说明的是, 在
找到后, 上面这样的三角类型的关系对于
成立, 这保证了由
张成的子空间在
下是不变的.
如果
是可三角化的, 那么显然
的特征多项式具有形式
看看上面的三角矩阵, 我们知道对角线元素
是其特征值, 其中
重复
次. 但是, 如果特征多项式
可以被这么分解, 那么极小多项式
当然也可以, 因为
整除
.
推论. 令是代数闭域, 例如复数域, 那么每个域上的矩阵都在上相似于一个三角矩阵.
定理6. 令是域上的有限维向量空间, 是上的一个线性算子, 那么是可对角化的当且仅当的极小多项式具有形式其中是的不同元素.
证明. 之前我们已经注意到, 如果
是可对角化的, 那么极小多项式是不同的线性因子之积 (见例子4前的讨论). 为了证明其逆, 令
是
的所有特征向量张成的子空间, 并设
. 根据定理5的证明所用到的引理, 存在向量
和
的一个特征值
满足
既然
, 那么
其中
, 因而对于每个多项式
有
既然
, 其中
是某个多项式, 并且
我们有
但是
, 并且因为
向量
, 于是
. 既然
, 我们有
, 但这与
的根互异矛盾 [译注: 显然, 此时需要计入重数].
在第6.7节末, 我们将给出定理6的另一个证明. 定理6除了作为优雅的结果, 其在计算方面也是实用的. 设我们有一个线性算子, 在某个有序基下由矩阵表示, 现在我们想要知道是否是可对角化的. 我们计算其特征多项式, 如果我们可以将分解为那么我们有两种判断的方法. 第一种方法是看我们能否对于每个找到与特征值相关的个线性无关的特征向量. 另一种方法是检验是否是零算子.
定理5提供了对于Cayley-Hamilton定理的一个不同的证明. 这个定理对于三角矩阵而言是容易证明, 而通过定理5, 对于任意代数闭域上的矩阵我们都可以得到此结果. 实际上, 任何域都是某个代数闭域的子域. 如果读者知道这个结果, 那么就得到了任意域上的矩阵的Cayley-Hamilton定理. 如果我们至少承认我们对于代数基本定理 (即复数域是代数闭域) 的讨论, 那么定理5提供了对于复矩阵的Cayley-Hamilton的一个证明, 此证明独立于我们之前所给出的.
练习1. 令
是
上的线性算子, 其在标准有序基下的矩阵为
- 证明的不变子空间仅可能是平凡的.
- 如果是上的线性算子, 其在标准有序基下的矩阵和一样, 表明拥有一维的不变子空间.
练习2. 令是的一个不变子空间. 证明限制算子的极小多项式整除的极小多项式, 但是不涉及矩阵的概念.
练习3. 令是的一个特征值, 是与特征值相关的特征空间. 限制算子是什么?
练习4. 令在实数域上相似于三角矩阵吗? 如果可以, 找出这样的一个三角矩阵.
练习5. 每个满足的矩阵都是可对角化的.
练习6. 令是维向量空间上的一个可对角化算子, 是在下不变的一个子空间. 证明限制算子也是可对角化的.
练习7. 令是域上的一个有限维向量空间上的一个线性算子. 证明是可对角化的当且仅当可由某个域上根互异的多项式零化.
练习8. 令是上的一个线性算子. 如果的每个子空间都在下不变, 那么是恒等算子的标量倍数.
练习9. 令是区间上的连续函数空间上的不定积分算子多项式函数空间在下不变吗? 可微函数空间呢? 时为零的函数空间呢?
练习10. 令是一个的实矩阵. 证明如果在上不相似于一个三角矩阵, 那么在上相似于一个对角矩阵.
练习11. 对还是错? 若三角矩阵相似于一个对角矩阵, 那么已经是一个对角矩阵了.
练习12. 令是某个代数闭域上的一个有限维向量空间上的一个线性算子, 是域上的一个多项式. 证明是的特征值当且仅当, 其中是的一个特征值.
练习13. 令
,
,
上的线性算子
和
分别由
定义.
- 对还是错? 如果(在上)可对角化, 那么是可对角化的.
- 对还是错? 如果是可对角化的, 那么是可对角化的.
第6.5节 同时三角化; 同时对角化
令是一个有限维向量空间, 是上的一族线性算子. 我们可以问何时能够同时三角化或者对角化这些中的线性算子, 即找到一个基使得矩阵都是三角矩阵 (或者对角矩阵). 在可对角化的情形, 必然是可交换算子族, 即对于所有, . 当然, 每个中的算子也必然是可对角化的. 为了同时三角化, 每个中的算子必然是可三角化的, 但是不必是一个可交换算子族. 然而, 可交换是同时三角化的充分条件 (如果每个都可以被单独三角化). 这些结果只需对于定理5和定理6的证明作小的修改即可得到.
子空间在算子族下不变, 如果其在中的每个算子下不变.
引理. 令
是
上一个可三角化算子的交换族. 令
是一个
的真子空间, 其在
下不变. 存在
中向量
满足
- ;
- 对于每个, 向量在和张成的子空间之中.
证明. 不失一般性, 假定
仅包含有限数目的算子, 这是出于以下观察. 令
是
的一个极大线性无关子集, 即
张成的子空间的一个基. 如果
是使得b对于每个
成立的向量, 那么b将对于
的每个线性组合成立.
根据定理5之前的引理 (这个引理是对于单一的算子而言的), 我们可以找到向量
和标量
满足
. 令
, 那么
是
的一个子空间且以
为真子空间. 更进一步,
在
下不变, 以下是原因. 如果
与
交换, 那么
如果
, 那么
. 既然
在
下不变, 那么对于每个
和每个
, 我们有
, 即
.
现在
是
的一个真子空间. 令
是由
限制于子空间
得到的线性算子.
的极小多项式整除
的极小多项式. 因此, 我们可以应用定理5之前的引理于
和不变子空间
. 我们得到了一个向量
但是
和一个标量
满足
. [译注: 实际上先是
, 然后变为
.] 注意到
- ;
- ;
- .
令
, 那么
在
下不变. 应用定理5之前的引理于
, 即限制
于
得到的算子. 不断重复施行这样的过程, 我们将抵达一个向量
满足
.
定理7. 令是域上的一个有限维向量空间. 令是上的一个可三角化算子的交换族. 存在的一个有序基使得每个中的算子在这个基下都由三角矩阵表示.
证明. 考虑到刚才我们证明的引理, 这个定理的证明和定理5是一样的, 如果读者将
替换为
.
推论. 令是某个代数闭域上的一个矩阵的交换族, 存在域上的一个非奇异矩阵使得对于每个矩阵, 是上三角矩阵.
定理8. 令是有限维向量空间上的一个可对角化算子的交换族, 存在的一个有序基使得每个中的算子在这个基下都由对角矩阵表示.
证明. 我们可以修饰定理7之前的引理, 使其适应于可对角化的情形, 以此来证明定理8. 之前在证明定理6的时候, 我们就已经这么做了, 通过修饰定理5之前的引理以使其适应于可对角化的情形. 然而, 此时通过
的维数上的归纳进行证明是更加容易的.
如果
, 没有需要证明的东西. 假定定理对于维数小于
的向量空间成立, 令
是一个
维空间. 选择任意不是恒等算子标量倍数的算子
. [译注: 若不然, 则
中的算子在任意的基下均可同时对角化.] 令
是
不同的特征值, 并令
是
所对应的特征空间. [译注:
.] 固定一个下标
, 那么
在任意与
交换的算子下都是不变的. 令
是限制
中算子于(不变)子空间
的线性算子族. 因为限制算子的极小多项式整除本来的算子的极小多项式, 所以每个
中的算子也都是可对角化的. 既然
, 根据归纳假设,
中的算子可以被同时对角化. [译注: 这个限制算子族当然也是交换的族.] 换言之,
拥有一个基
, 其包含的向量同时为每个
中的算子的特征向量.
既然
是可对角化的, 定理2之前的引理告诉我们
是
的一个基. 这就是我们要找的基.
练习1. 找到一个可逆的实矩阵
使得
和
都是对角矩阵, 其中
和
是实矩阵
练习2. 令是一个复矩阵的交换族. 至多可以包含多少线性无关的矩阵? 的情形呢?
练习3. 令是维空间上的一个线性算子, 设具有个不同的特征值. 证明对于任意与交换的线性算子, 存在多项式使得.
练习4. 令是交换的复矩阵. 令是矩阵证明.
练习5. 令, , 上的线性算子. 考虑线性算子族, 证明其可以被同时对角化.
第6.6节 直和分解
当我们继续分析单一的线性算子, 我们将以稍微复杂一点的方式刻画我们的想法——基于子空间而不是矩阵. 本章之初, 我们这样描述我们的目的: 找到一个基使得线性算子的矩阵呈现特别简单的形式. 现在, 我们将我们的目的描述为: 将线性算子所在的空间分解为不变子空间的直和使得这些子空间上的限制算子是简单的.
定义. 令是向量空间的子空间. 我们称是线性无关的, 如果可以推出每个.
对于, 和线性无关当且仅当. 如果, 线性无关不仅是说, 实际上每个与其他子空间之交都仅是零子空间.
令, 那么每个向量均可被表示为和线性无关的重要性在于, 如果是线性无关的, 那么的这种表示是唯一的, 因为如果那么, 于是. 因此, 当线性无关时, 我们可以将中的向量当作元组操作, 就像我们操作的向量一样.
引理. 令
是有限维向量空间,
是
的子空间,
, 那么以下条件等价.
- 线性无关.
- 对于每个, 我们有
- 如果是的一个有序基, 其中, 那么是的一个有序基.
证明. 假定a成立, 令向量
, 那么存在向量
满足
. 鉴于
以及
是线性无关的, 必然有
.
现在我们证明b可以推出a. 假定b成立, 若a不成立, 存在不全为零的向量
使得
令
,
是良定义的, 那么
于是
是
中的一个非零向量, 这与条件b相矛盾.
现在我们已经知道a和b是等价的, 让我们看看为什么a等价于c. 假定a成立, 令
是
的一个基, 其中
, 并设
.
中向量之间任意的线性关系都具有形式
其中
是
的某个线性组合. 既然
是线性无关的, 每个
都是
. 又因为每个
都是线性无关的,
中的向量之间的线性关系只可能是平凡的. [译注: 这段论证实际上是从定理2之前的引理以及该引理的证明那里照搬过来的.]
我们将由c推出a的证明留作练习 (练习2).
若以上引理中任意的条件成立 (自然其他条件也成立), 那么我们称和是直的, 或者说是的直和, 记作在其他文献中, 读者会发现这种和也被称为的独立和或者内直和.
例子11. 令是域上的一个有限维向量空间, 是任意的基. 如果是由张成的一维子空间, 那么.
例子12. 令是一个正整数, 是复数域的一个子域, 是, 是所有对称矩阵构成的子空间, 是所有斜对称矩阵构成的子空间, 那么. 如果, 那么作为的向量和的向量之和的唯一表达为
例子13. 令是有限维向量空间上任意的线性算子, 是其不同的特征值, 是对应的特征空间, 那么是线性无关的, 见定理2之前的引理. 特别地, 如果是可对角化的, 那么. [译注: 特征值当然有可能并不存在.]
定义. 如果是一个向量空间, 的一个投影是上一个满足的线性算子.
设是一个投影, 令是的像, 是的零空间.
- 向量当且仅当. 若存在使得, 那么. 反过来, 如果, 那么(当然有).
- .
- 作为和的向量之和的唯一表达为.
根据1, 2, 3, 很容易看出以下事实. 如果
和
是
的子空间满足
, 那么存在唯一的投影算子
以
为像且以
为零空间. 这个算子被称为沿着
到
上的投影.
任意的投影都可以被(平凡地)对角化. 如果是的一个基, 是的一个基, 那么基可以对角化:其中是的恒等矩阵. 这有助于解释某些和投影相关的术语. 读者应该看看平面或者空间里的各种例子以使得他们信服投影具有特定的几何意义.
投影可以用来刻画空间的直和分解. 设. 对于每个我们可以定义一个上的算子. 令, 若, 定义, 那么是良定义的法则. 容易看出是线性的, 的像是, 以及. 的零空间是子空间这是因为的意思即, 或者说是除了之外的子空间的向量的和. 基于投影, 对于每个, 我们有这是在说注意到如果, 那么, 因为的像包含于的零空间之中. 我们现在将我们的发现总结如下, 并证明其逆.
定理9. 如果
, 那么存在
上的
个线性算子
满足
- 每个都是投影, 即;
- 若, 那么;
- ;
- 的像是.
反过来, 如果
是
上的
个线性算子并且满足条件i, ii, iii, 令
是
的像, 那么
. [译注: 实际上, ii和iii可以推出i.]
证明. 我们仅需证明逆命题. 设
是
上满足前三个条件的线性算子, 令
是
的像, 那么定有
这是因为根据条件iii, 对于每个
我们有
而
. 这个
的表达方式是唯一的, 因为若
而
, 即存在
满足
, 那么根据i和ii我们有
这表明
是
的直和.
练习1. 令是一个有限维向量空间, 是任意的子空间, 证明存在的子空间满足.
练习2. 令是一个有限维向量空间, 而是满足的子空间, 证明.
练习3. 寻找这样一个投影, 其将沿着由张成的子空间投影至由张成的子空间.
练习4. 如果和是投影至线性无关的子空间的算子, 那么也是一个投影, 对还是错呢?
练习5. 如果是一个投影而是一个多项式, 那么. 如何以的系数表示和?
练习6. 对还是错? 如果一个可对角化算子的特征值仅是和, 那么它是一个投影.
练习7. 证明如果是沿着到上的投影, 那么是沿着到上的投影.
练习8. 令
是空间
上满足
的线性算子.
- 证明若时有, 那么对于每个有.
- 在的情形下, 证明a的逆, 即若有且, 那么.
练习9. 令是一个实向量空间, 是上的一个幂等线性算子, 即投影, 证明是可逆的, 并找出是什么.
练习10. 令是复数域的一个子域 (或者一个特征为零的域), 是上的一个有限维向量空间, 是的投影并且满足. 证明如果, 那么. (提示: 使用迹函数并问问自己投影的迹是什么.)
练习11. 令是一个向量空间, 是的子空间, 设, 证明对偶空间拥有直和分解.
第6.7节 不变直和
我们主要对于这样的直和分解感兴趣, 其每个子空间都在某个给定的线性算子下不变. 给定这样一种对于的分解, 通过限制导出了每个上的线性算子. 的作用方式如下. 如果, 那么我们有着唯一的分解然后我们将这种情况描述为是算子的直和. 必须要记得使用此术语时不是上而是子空间上的线性算子. 的事实允许我们将每个与唯一的一个元组联系起来, 其中 (通过), 再加上每个都在下不变, 我们可以将在上的作用视为于上的各独立作用之和. 我们寻找不变直和分解的最终目的当然还是研究, 分解中的每个的性质都应该是比较简单的.
在观察例子之前, 让我们先来指出其矩阵形式的类比. 设我们为每个挑选了一个有序基, 那么是的一个有序基. 根据之前讨论单一不变子空间的矩阵类比的经验, 很容易看出来如果且, 那么具有分块形式
往往我们藉由与直和分解相关联的投影来刻画那些子空间 (定理9), 于是我们需要能够基于投影来重述不变直和.
定理10. 令是空间上的一个线性算子, 而和的情况和定理9一样, 那么每个都在下不变的充要条件是与每个交换, 即
证明. 设
与每个
交换. 令
, 那么
, 并有
这表明
, 即
在
下不变.
现在假定每个
都在
下不变, 我们将证明
. 令
, 那么
因为
, 并且
在
下不变, 于是
, 存在向量
满足
, 那么
因此
这对于每个
自然都是成立的, 所以
. [译注: 以
作为媒介实际上是不必要的, 在译者看来直接讨论更加清晰明了.]
现在我们将以不变直和分解 (与交换的投影) 的语言刻画可对角化算子. 这将有助于我们理解之后一些更加深刻的分解定理. 这种描述乍看上去可能比较复杂, 但是读者应该明白这是我们第一次得以瞥见一种非常有效的方法, 其可以将子空间, 基, 矩阵之类的相关问题规约为线性算子的代数计算. 在稍微熟悉之后, 这种推理方法的有效和优雅应该是显然的.
定理11. 令
是有限维向量空间
上的一个线性算子. 如果
是可对角化的并且
是其不同的特征值, 那么存在
上的线性算子
满足
- ;
- ;
- 若, 则;
- (即是投影);
- 的像是与相关联的特征空间.
反过来, 如果存在
个不同的标量
和
个非零的线性算子
满足条件i, ii, iii, 那么
是可对角化的,
是
的不同的特征值, 并且条件iv和v也得到满足.
证明. 设
是可对角化的, 并以
为不同的特征值. 令
是与
相关联的特征空间. 正如我们之前所见,
和定理9一样, 令
是与该分解对应的投影, 那么ii, iii, iv, v被满足是显然的. 为了验证i, 我们按照以下方式处理. 对于每个
, 我们有
于是
换言之,
.
现在设我们给定了一个以不同的标量
为特征值的线性算子
以及非零的线性算子
满足i, ii, iii. 既然当
时有
, 那么我们给
两边同乘
就立即得到了
. 对于
两边右乘
, 那么我们有
, 这表明了
的像之中的向量也在
的零空间里. 因为我们已经假定
, 所以
的零空间中至少存在一个非零向量, 即
是
的一个特征值. 而且, 这些
就是
的全部的特征值了. 这是因为如果
是任意的特征值, 那么
于是若
, 我们必有
. 如果
不是零向量, 那么存在某个
使得
, 于是对于这个
我们有
.
当然
是可对角化的, 因为我们已经表明了每个
的像中的向量都是
的特征向量, 而且
告诉我们这些特征向量可以张成
. 剩下来我们需要说明的就只是
的零空间恰为
的像. 但这是显然的, 因为如果
, 那么
因此对于每个
有
那么对于
都有
既然
并且
时有
, 我们有
, 即
在
的像之中.
定理9的一部分告诉我们, 对于一个可对角化算子而言, 标量和算子由条件i, ii, iii以及不同和非零的事实所唯一确定. 这种分解的一个令人愉快的特性在于如果是域上任意的多项式, 那么我们将证明的细节留给读者. 为了看明白其是如何得以证明的, 读者只需对于每个正整数计算, 例如读者应该将这个结果与为对角矩阵时的进行比较, 因为就是以为对角元素的对角矩阵.
我们特别想要指出当人们应用与相对应的Lagrange多项式时会发生什么. 我们有, 这表明因此投影不仅与交换, 还是多项式应用于的结果.
这样应用多项式于的计算可以用来给出定理6的另一个证明, 定理6基于极小多项式刻画了可对角化的条件. 这个证明完全独立于我们先前所给出的.
如果是可对角化的, , 那么对于每个多项式有因此当且仅当对于每个有. 特别地, 的极小多项式为
现在设是以为极小多项式的线性算子, 其中是标量域的不同元素. 我们构造Lagrange多项式回忆一下第4章, 以及对于任意次数小于等于的多项式, 我们有取为标量多项式, 然后是多项式, 我们得到(聪明的读者可能会注意到应用Lagrange插值于可能并不合法, 因为可能是. 但是如果, 是恒等算子的一个标量倍数, 因而是可对角化的.) 现在令, 根据Lagrange插值我们有观察到如果, 那么被极小多项式整除, 因为每个都是其根. 因此, 我们可以推出我们还需要注意到另一个事实, 即对于每个有. 这是因为是的极小多项式, 而的次数小于的次数, 所以不可能有. 现在应用定理11, 我们可以得出是可对角化的. [译注: 实际上, 即便没有, 也足够断言是可对角化的. 这是因为显然可以被同时对角化, 而恰恰在这个同时对角化的基下, 鉴于, 直接就可以看出的表示矩阵是对角矩阵. 之所以定理11需要额外的条件, 那是因为定理11作出了额外的断言.]
练习1. 令是一个的投影, 是上的一个线性算子. 证明的像在下不变当且仅当. 证明的像与零空间均在下不变当且仅当.
练习2. 令
是
上的线性算子, 其在标准有序基下的矩阵为
令
是由
张成的
的子空间.
- 证明在下不变.
- 证明不存在子空间满足其在下不变且与互补:
练习3. 令是有限维向量空间上的一个线性算子, 是的像, 是的零空间, 证明和线性无关当且仅当.
练习4. 令
是有限维向量空间
上的一个线性算子, 设
, 其中每个
都在
下不变, 令
是
上导出的(限制)算子.
- 证明.
- 证明的特征多项式是的特征多项式之积.
- 证明的极小多项式是的极小多项式的最小公倍式. (提示: 证明并使用与矩阵直和有关的相应事实.)
练习5. 令是第6.2节例子3中的线性算子, 使用Lagrange多项式将表示矩阵写成的形式.
练习6. 令是第6.3节例子5中的矩阵, 找出矩阵使得.
练习7. 在练习5和6中, 注意到(对于每个)与特征值相关联的特征空间由满足的各个矩阵的列向量张成, 这是巧合吗? [译注: 练习本身很有可能是错误的, 应该将其改为"由的列向量张成".]
练习8. 令是上的一个线性算子, 其与每个的投影交换, 关于你能知道什么?
练习9. 令
是区间
上的实值连续函数的向量空间,
是由偶函数构成的子空间,
是由奇函数构成的子空间.
- 证明.
- 如果是不定积分算子和在下不变吗?
第6.8节 准素分解定理
我们一直在尽力研究有限维空间上的线性算子, 通过将其分解为算子的直和, 这些算子在某种意义上是简单的. 在特定的情况下, 即的极小多项式在标量域上可以被分解为不同的首项系数为一的一次多项式之积时, 我们藉由特征值和特征向量的概念就可以完成分解. 那么对于一般情况下的, 我们该怎么做呢? 如果我们想要通过特征值来研究, 我们将面临两个问题. 第一个问题是可能压根没有特征值, 这或许应该归咎于标量域, 即它不是代数闭域. 第二个问题是即便特征多项式在上可以被完全分解为一次多项式之积, 仍然可能没有足够的特征向量以张成, 这显然应该归咎于. 我们用一个例子来刻画第二种情况. 现在给定 (为任意的域) 上的线性算子, 其在标准有序基下由表示. 的特征多项式为, 这也是 (或者) 的极小多项式. 因此, 是不可对角化的. 读者可以看出来, 这种情况会发生是因为的零空间仅是一维的. 另一方面, 的零空间和的零空间一起可以张成, 前者是由张成的子空间, 后者是由和张成的子空间.
这或多或少将会是我们处理第二个问题的一般方法. 如果 (记住这是一个假设) 的极小多项式可以被分解为其中是的不同元素, 那么我们可以证明空间是的零空间的直和. 这关于极小多项式的假设等价于是可三角化的 (定理5). 然而, 这条知识并不会帮到我们.
我们实际将要证明的定理比起刚才所描述的要更加一般, 因为它考虑的是极小多项式的素因子分解, 不论素因子本身的次数是否为一. 读者或许会发现思考素因子均为一次的特殊情形是有用的, 甚至是思考定理6的基于投影概念的证明, 定理6是这个定理更加特殊的情形.
定理12. 准素分解定理 (Primary Decomposition Theorem). 令
是域
上的有限维向量空间
上的线性算子, 设
是
的极小多项式, 其分解为
其中
是域
上互异的首项系数为一的素多项式而
是正整数. [译注: 原文用的是irreducible而不是prime, 但是如果追究第4章的定义的细节的话, 素多项式是更加适合的, 因为素多项式被定义为非标量的不可约多项式, 虽然即便在第4章原文中作者已经开始混淆这两个概念.] 令
是
的零空间, 那么
- ;
- 每个都在下不变;
- 如果是在上由限制导出的算子, 那么的极小多项式为.
证明. 证明的想法如下. 如果i的直和分解是可能的, 那么我们该如何得到与之相关的投影
呢? 投影
在
上是恒等算子, 在其他的
上则是零算子. 我们将寻找一个多项式
使得
在
上是恒等算子而在其他
上均是零算子, 于是
, 等等.
对于每个
, 令
既然
是不同的素多项式, 多项式
是互素的 (第4章的定理10). 因此, 存在多项式
满足
我们也注意到, 如果
, 那么
被多项式
整除, 因为
包含每个
作为因子. 我们将说明多项式
表现得如同证明的第一段所述的那样.
令
. 既然
且
整除
, 我们有
因此, 这些
是与某个
的直和分解相对应的投影. 我们想要证明
的像恰是子空间
. 显然
的像的每个向量都在
之中, 因为若
在
的像中, 那么
, 于是
鉴于
是极小多项式. 反过来, 设
在
的零空间之中. 如果
, 那么
被
整除, 于是
, 即
. 但是, 这立刻就可以推出
, 即
在
的像之中. 这就完成了陈述i的证明.
子空间
显然在
是不变的. [译注: 可以直接证明, 也可应用定理10.] 如果
是由
限制于
导出的算子, 那么显然有
, 因为根据定义,
在子空间
上的值均为
. 这表明
的极小多项式整除
. 反过来, 令
是
的一个零化多项式, 即
, 那么
. [译注: 这里没有那么平凡, 对于
有
, 而对于
, 我们知道
整除
, 所以
, 将这两者综合, 又因为
是
的直和, 我们才得到
是
的一个零化多项式.] 因此,
被
的极小多项式
整除, 即
整除
. 很容易看出来
整除
. [译注: 这是因为
.] 因此,
也整除
的极小多项式, 那么
的极小多项式就是
.
推论. 如果是与的准素分解相关的投影, 那么每个都是应用某个多项式于的值. 因此, 如果线性算子与交换, 那么与每个交换, 即每个子空间都在下不变.
在定理12的证明的记号下, 让我们看看的极小多项式是一次多项式之积的特殊情形, 即每个都具有形式. 现在的像是的零空间. 让我们置. 根据定理11, 是一个可对角化算子, 我们将其称为的可对角化部分. 让我们看看算子. 因为所以读者现在对于投影已经足够熟悉了, 可以看出以及在一般情况下当满足对于每个有时, 我们有, 因为算子在的像上为.
定义. 令是向量空间上的一个线性算子. 我们称是幂零算子, 如果存在某个正整数满足.
定理13. 令
是域
上的有限维向量空间
上的一个线性算子, 设
的极小多项式在
上被分解为线性多项式之积, 那么存在
上的一个可对角化算子
和一个幂零算子
满足
- ;
- .
可对角化算子
和幂零算子
由i和ii唯一确定, 并且它们都是某个多项式应用于
的结果.
证明. 我们刚才观察到我们可以将
写成
, 其中
是可对角化的而
是幂零算子. 并且,
和
不仅是可交换的, 它们还是应用多项式于
的值. 现在设
, 其中
是可对角化的,
是幂零的, 并且
. 我们将证明
和
.
既然
和
可以交换而
, 我们可以看出
和
与
也是可以交换的. 因此,
和
与任意应用多项式于
的结果交换. 现在我们有
或者说
并且这四个算子是互相交换的. 既然
和
都是可对角化的并且是可交换的, 它们可以被同时对角化, 于是
是可对角化的. 既然
和
都是幂零的并且是可交换的, 算子
也是幂零的. 这是因为, 使用
和
可以交换的事实, 可以得到
于是当
足够大时这个
的表达式中的每一项都是
. (实际上,
维空间上的幂零算子的
次幂必然为
. 如果我们以上取
, 那肯定是足够大了. 当然接着可以知道
已经足够大了, 但是这不能直接从上面的表达式看出来.) 现在我们知道可对角化算子
也是幂零算子. 这样一个算子显然是零算子, 以下是论证. 作为幂零算子, 其极小多项式显然具有
的形式. [译注: 根据定义, 存在正整数
满足
, 鉴于极小多项式整除零化多项式
, 因而对于某个
有极小多项式
.] 但是既然它也是可对角化的, 极小多项式不可能有重复的根. 因此
, 或者说极小多项式就是
, 即
. [译注: 在一般情况下, 极小多项式的次数大于等于一, 除非是零维向量空间上的算子, 但是本书除了第2章提及了这种可能性之外 (那里说仅包含零向量的平凡空间的维数要么不定义, 要么就定义为零), 其余地方提及有限维向量空间时都排除了零维的情况. 基本上所有结果包含零维的情况仍然成立, 只是许多证明需要打上补丁.] 于是, 我们可以看出
和
.
推论. 令是某个代数闭域 (例如复数域) 上的有限维向量空间, 那么上的每个线性算子都可以写成交换的可对角化算子和幂零算子之和. 和是唯一确定的, 并且每个都是应用多项式于的结果.
从以上这些结果来看, 读者应该明白对于代数闭域上的向量空间上的线性算子的研究基本上可以归结为对于幂零算子的研究. 对于非代数闭域上的向量空间而言, 我们仍然需要寻找特征值和特征向量的某种替代物. 有趣的是, 这两个问题可以被同时处理, 而这就是我们在下一章所要做的事情.
为了给本节作结, 我们想要举一个例子, 它刻画了准素分解定理的某些想法. 之所以我们选择把它放在本节的最后, 是因为它处理微分方程, 并不是纯粹的线性代数.
例子14. 在准素分解定理中, 向量空间是有限维的是不必要的条件. 另外, 对于i和ii而言, 是的极小多项式也是不必要的. 如果是任意向量空间上的线性算子, 如果存在一个首项系数为一的多项式满足, 那么定理12的i和ii在我们之前给出的证明下对于也是成立的. [译注: 注意到定理9并不局限于有限维的情形.]
令是一个正整数, 令是满足微分方程的所有实轴上的次连续可微函数构成的空间, 其中是一些固定的常数. 如果用表示次连续可微函数构成的空间, 那么作为这个微分方程的解空间的是的子空间. 如果代表微分算子而是多项式那么是算子的零空间, 因为这个微分方程就是在说. 因此, 在下不变. 现在让我们将视为子空间上的一个线性算子, 那么.
如果我们讨论的是复值可微函数, 那么和是复向量空间而可以是任意的复数. 现在我们将写成其中是不同的复数. 如果是的零空间, 那么定理12告诉我们换言之, 如果满足这个微分方程, 那么可以被唯一地表示为的形式, 其中满足微分方程. 因此, 对于这个大的微分方程的解的研究可以被规约为对于具有形式的小的微分方程的解空间的研究. 这种规约是藉由线性代数的一般方法实现的, 即准素分解定理.
为了刻画这个小的微分方程的解空间, 我们必须要了解一些关于微分方程的知识. 也就是说, 除了是线性算子的事实之外, 我们必须还要了解一些关于的其他性质. 然而, 实际上并不需要太多. 很容易对于进行归纳得到如果, 那么也就是说,因此, 当且仅当. 一个满足的函数, 即, 必然是一个次数小于等于的多项式函数 [译注: 严格说来, 次数是定义在多项式而非多项式函数上的, 但是这里的意思应该是明了的, 即由次数小于等于的多项式导出的函数, 并且在这种意义下次数对于这里的多项式函数是良定的]:于是, 当且仅当具有形式据此, "函数"可以张成这个小的微分方程的解空间. 鉴于是线性无关的函数并且指数函数 (exponential function) 没有零点, 这个函数构成了解空间的一个基.
回到本来的微分方程上去, 即我们可以看到构成了解空间的一个基. 特别地, 解空间是有限维的, 其维数等于多项式的次数.
译者注记. 以上的例子中的推理过程存在不甚严格的步骤, 即微分算子并非严格意义上的上的线性算子, 因为次连续可微函数的导数并不一定仍然是次连续可微的. 因此, 鉴于和交换, 所以的零空间在下不变这样的推理也不能称得上令人满意. 当然, 如果将我们所考虑的函数类限制于无穷可微的的情形, 上述的推理倒是相当严密, 结果也没有改变.
练习1. 令是上的一个线性算子, 其在标准有序基下由矩阵表示. 将的极小多项式表示为的形式, 其中和是实数域上首项系数为一的素多项式. 令是的零空间, 找出和各自的一个基. 如果是在上由限制导出的算子, 求出在基下的矩阵.
练习2. 令是上的一个线性算子, 其在标准有序基下由矩阵表示. 证明上存在可对角化算子和幂零算子满足且. 找出和在标准基下的矩阵. (只需要对于这个特殊情形重复定理12的证明就够了.)
练习3. 如果是域上所有次数小于等于的多项式构成的向量空间, 证明上的微分算子是幂零的.
练习4. 令
是有限维向量空间
上的一个线性算子, 其特征多项式为
而极小多项式为
令
是
的零空间.
- 证明是集合 (可以依赖于).
- 证明的维数是. (提示: 如果是于上通过限制导出的算子, 那么是幂零的; 因而的特征多项式必然是, 其中是的维数 (证明?); 于是的特征多项式为; 现在使用的特征多项式是的特征多项式之积的事实来说明.)
练习5. 令是复数域上的一个有限维向量空间. 令是上的一个线性算子, 是的可对角化部分. 证明如果是复数域上任意的多项式, 那么的可对角化部分是.
练习6. 令是域上的一个有限维向量空间, 是上的一个线性算子且. 证明要么是可对角化的, 要么是幂零的, 但不可兼任.
练习7. 令是域上的一个有限维向量空间, 是上的一个线性算子. 设与上的每个可对角化算子交换, 证明是恒等算子的标量倍数.
练习8. 令是域上的矩阵的空间, 是域上一个固定的矩阵. 我们定义上的线性算子. 证明如果是一个幂零矩阵, 那么是一个幂零算子. [译注: 参照幂零算子的定义, 可以定义幂零矩阵.]
练习9. 给出这样的一个例子, 两个的幂零矩阵具有相同的极小多项式 (它们的特征多项式必然也是相同的), 但是并不相似.
练习10. 令是有限维向量空间上的一个线性算子, 是的极小多项式, 是的准素分解, 即是的零空间, 是任意的在下不变的子空间, 证明
练习11. 以下对于定理13的证明有何问题? 设的极小多项式是线性因子之积. 那么, 根据定理5, 是可三角化的. 令是一个使得为上三角矩阵的有序基. 令是以为对角线元素的对角矩阵, 那么, 其中是一个严格上三角矩阵. 显然是幂零的. [译注: 严格上三角矩阵指的是对角线元素均为零的上三角矩阵.]
练习12. 如果你已经思考过了练习11, 在你观察到定理7告诉你的关于的可对角化部分和幂零部分的东西之后, 再次思考这个练习.
练习13. 令是上的一个线性算子, 它的极小多项式具有的形式, 其中在标量域上是不可约的. 证明存在使得的零化子为.
练习14. 使用准素分解定理和练习13的结果证明以下结论. 如果是有限维向量空间上任意的线性算子, 那么存在使得的零化子等于的极小多项式.
练习15. 如果是维向量空间上的一个幂零线性算子, 那么的特征多项式为.