什么是“峰图”:
峰图(Feng Graph)指的是,由「荒原之梦」(zhaokaifeng.com)原创的一种基于抽象图形的数学定理可视化定义、解释、推导与应用的方法. 「荒原之梦」认为,和自然语言一样,数学的本质原理并不局限于特定的表达形式. 所以,如果说传统上的数学是基于数字(包括各种符号)进行描述的数字数学,那么,峰图就是要建立(现在是局部建立)基于图形的,数字数学的几何形态“克隆体”,并力求使数学原理的表述和数学问题的解答变得更加简单、直观且易于理解.
一、前言
在本文中,「荒原之梦考研数学」将为同学们详细介绍一下考研数学线性代数中的“幂零矩阵”.
同时,在本文中,「荒原之梦考研数学」还会通过“峰图(峰式图)”的方式证明为什么有些矩阵是(不是)幂零矩阵,同时以形象的方式展示幂零矩阵的“塌缩”机制.
二、正文
§2.1 定义
对于一个 $n \times n$ 阶的方矩阵 $\boldsymbol{A}$,如果满足下式(其中 $k$ 是一个正整数):
$$
\boldsymbol{A}^{k} = 0
$$
则称矩阵 $\boldsymbol{A}$ 是一个幂零矩阵.
例如,对于矩阵 $\boldsymbol{A} = \begin{bmatrix} 0 & \textcolor{orange}{1} & 0 & 0 \\ 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \end{bmatrix}$, 我们有:
$$
\begin{aligned}
\boldsymbol{A}^{2} & = \begin{bmatrix} 0 & \textcolor{orange}{1} & 0 & 0 \\ 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \end{bmatrix} \times \begin{bmatrix} 0 & \textcolor{orange}{1} & 0 & 0 \\ 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \end{bmatrix} = \begin{bmatrix} 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} \\ \\
\boldsymbol{A}^{3} & = \begin{bmatrix} 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} \times \begin{bmatrix} 0 & \textcolor{orange}{1} & 0 & 0 \\ 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \end{bmatrix} = \begin{bmatrix} 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} \\ \\
\boldsymbol{A}^{4} & = \begin{bmatrix} 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} \times \begin{bmatrix} 0 & \textcolor{orange}{1} & 0 & 0 \\ 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \end{bmatrix} = \begin{bmatrix} 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix}
\end{aligned}
$$
从上面的计算过程可以看到,经过 $3$ 次自乘,矩阵中的非零元素 $1$ 不断向矩阵的右上角“移动”,直到完全消失,得到了一个只有 $0$ 元素的零矩阵,所以,矩阵 $\boldsymbol{A}$ 就是一个幂零矩阵.
当然,幂零矩阵中的元素并不只能是 $0$ 和 $1$, 也可以是其他非零元素. 例如,对于矩阵 $\boldsymbol{B} = \begin{bmatrix}
0 & \textcolor{orange}{2} & 0 \\
0 & 0 & \textcolor{orange}{3} \\
0 & 0 & 0
\end{bmatrix}$, 我们有:
$$
\begin{aligned}
\boldsymbol{B}^{2} & = \begin{bmatrix}
0 & \textcolor{orange}{2} & 0 \\
0 & 0 & \textcolor{orange}{3} \\
0 & 0 & 0
\end{bmatrix} \times \begin{bmatrix}
0 & \textcolor{orange}{2} & 0 \\
0 & 0 & \textcolor{orange}{3} \\
0 & 0 & 0
\end{bmatrix} = \begin{bmatrix}
0 & 0 & \textcolor{orange}{6} \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix} \\ \\
\boldsymbol{B}^{3} & = \begin{bmatrix}
0 & 0 & \textcolor{orange}{6} \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix} \times \begin{bmatrix}
0 & \textcolor{orange}{2} & 0 \\
0 & 0 & \textcolor{orange}{3} \\
0 & 0 & 0
\end{bmatrix} = \begin{bmatrix}
0 & 0 & 0 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}
\end{aligned}
$$
虽然前面举的例子都是严格的上三角矩阵(主对角线元素全为零的上三角矩阵),但是,事实上,严格的下三角矩阵,也是常见的幂零矩阵,例如:
$$
\begin{bmatrix}
0 & 0 & 0 \\
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0
\end{bmatrix}
$$
或者:
$$
\begin{bmatrix}
0 & 0 & 0 \\
\textcolor{orange}{1} & 0 & 0 \\
\textcolor{orange}{1} & \textcolor{orange}{1} & 0
\end{bmatrix}
$$
§2.2 峰式证明:“动线交点”理论
为了将幂零矩阵在自乘过程中的“塌缩”更加形象地展示出来,「荒原之梦」原创建立了一种“动线交点”的理论形式来展示这个过程.
首先,以单位矩阵 $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1}
\end{bmatrix}$ 为例,根据矩阵乘法的运算法则,我们首先将矩阵 $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1}
\end{bmatrix}$ 顺时针旋转 $90^{\circ}$, 即:
此时,矩阵乘法运算 $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1}
\end{bmatrix}$ $\times$ $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1}
\end{bmatrix}$ $=$ $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1}
\end{bmatrix}$ 就可以表示为:
接着,我们将上面的图 02 矩阵中的非零元素用一条直线连接起来,如图 03 所示:
之后,按照矩阵的列数 $n$, 将绿色的直线在黄绿色的直线上向右移动 $n$ 次,则两个矩阵的非零元素对应的两个线条之间所产生的交点的个数就是这两个矩阵相乘所得的非零元素的个数,如图 04、05 和 06 所示:
当然,从后面以矩阵 $\begin{bmatrix}
0 & \textcolor{orange}{1} & 0 \\
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ 为例的“动线交点”过程可知,如果两个或者以上个数的交点重叠在同一个位置,则实际上是可以做减法运算消去本质上多余的点——如果这两个点对应的数字完全相等,则消去的结果就是只保留一个点;如果这两个点对应的数字完全相反,则消去的结果就是得到了 $0$ 元素;如果这两个点对应的数字不相等或者相反,则消去的结果就是做减法运算——所以,从“动线交点”理论的这一性质可知,“动线交点”理论事实上更适合(但不限于)用在行最简形式的矩阵,或者形式上接近行最简形式的矩阵的乘法运算的形象化表述中.
以上就是矩阵乘法运算的“动线交点”理论.
于是,根据上面的“动线交点”理论,对于上三角形式的幂零矩阵 $\begin{bmatrix}
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$, 我们有:
接着,绘制出乘法运算 $\begin{bmatrix}
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ $\times$ $\begin{bmatrix}
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ $=$ $\begin{bmatrix}
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$ 对应的图示:
因此,转换为“动线交点”理论验证,可以形象地看出看来为什么幂零矩阵的非零元素由 $2$ 个减少为了 $1$ 个:
类似地,根据上面的“动线交点”理论,对于上三角形式的幂零矩阵 $\begin{bmatrix}
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$, 我们有:
接着,绘制出乘法运算 $\begin{bmatrix}
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ $\times$ $\begin{bmatrix}
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ $=$ $\begin{bmatrix}
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$ 对应的图示:
因此,转换为“动线交点”理论验证,可以形象地看出看来为什么幂零矩阵的非零元素由 $3$ 个减少为了 $1$ 个:
同样的,根据上面的“动线交点”理论,对于下三角形式的幂零矩阵 $\begin{bmatrix}
0 & 0 & 0\\
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0
\end{bmatrix}$, 我们有:
接着,绘制出乘法运算 $\begin{bmatrix}
0 & 0 & 0\\
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0
\end{bmatrix}$ $\times$ $\begin{bmatrix}
0 & 0 & 0\\
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0
\end{bmatrix}$ $=$ $\begin{bmatrix}
0 & 0 & 0\\
0 & 0 & 0 \\
\textcolor{orange}{1} & 0 & 0
\end{bmatrix}$ 对应的图示:
因此,转换为“动线交点”理论验证,可以形象地看出看来为什么幂零矩阵的非零元素由 $2$ 个减少为了 $1$ 个:
对于非幂零矩阵,我们也可以根据“动线交点”理论进行判断.
例如,根据上面的“动线交点”理论,对于非幂零矩阵 $\begin{bmatrix}
0 & \textcolor{orange}{1} & 0 \\
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$, 我们有:
接着,绘制出乘法运算 $\begin{bmatrix}
0 & \textcolor{orange}{1} & 0 \\
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ $\times$ $\begin{bmatrix}
0 & \textcolor{orange}{1} & 0 \\
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ $=$ $\begin{bmatrix}
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ 对应的图示:
因此,转换为“动线交点”理论验证,由于两个点和两个点组合交叉,会形成四个点——从图 19、20、21、22 可以形象地看出看来为什么非幂零矩阵的非零元素由 $3$ 个增加为了 $4$ 个(只有元素在矩阵自乘的过程中不断减少,直至不存在非零元素的矩阵才是幂零矩阵):
当然,观察上面的“动线交点”的形成过程可知,如果忽略交点处圆点的形状,则图 19 中的图形和图 21 中的图形其实是完全一致的,图 20 中的图形和图 22 中的图形其实也是完全一致的,因此,这两组图形事实上可以合二为一,与矩阵 $\begin{bmatrix}
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ 可以转换为矩阵 $\begin{bmatrix}
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$ 的这一性质是相符的.
此外,为了绘图方便,对于只有一个孤单非零元素(一个非零元素周围没有其他非零元素)的情况,我们也使用直线(而非一个圆点)表示该元素.
例如,对于非幂零矩阵 $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$, 我们有:
接着,绘制出乘法运算 $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$ $\times$ $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$ $=$ $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$ 对应的图示:
因此,转换为“动线交点”理论验证,可以形象地看出看来为什么非幂零矩阵的非零元素在运算前后都是 $1$ 个(只有元素在矩阵自乘的过程中不断减少,直至不存在非零元素的矩阵才是幂零矩阵):
通过上面的“动线交点”理论,我们可以很形象地看出幂零矩阵的“塌缩”的机制,本质上就是不同的几何线条可以形成的交叉点的数量存在区别.
§2.3 性质
设 $\boldsymbol{F}$ 为 $n \times n$ 阶的幂零矩阵,则:
- 满足 $\boldsymbol{F}^{k} = 0$ 的最小整数 $k$ 小于或等于 $n$;
- 每⼀个严格的上三⻆矩阵或下三⻆矩阵都是幂零矩阵;
- 每⼀个不可逆矩阵(不可逆矩阵有时候也被称为“奇异方阵”,对应的,可逆矩阵也被称为“非奇异方阵”)都可以写成若⼲个幂零矩阵的乘积(可逆矩阵不可能写成若干个幂零矩阵的乘积,只能写成若干个初等矩阵的乘积);
- $\boldsymbol{F}$ 的所有特征值为 $0$, $\boldsymbol{F}$ 的特征多项式为 $\lambda^{n}$. 因此,$\boldsymbol{F}$ 的行列式和迹都为 $0$;
- 若 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 是两个矩阵,且 $\boldsymbol{A}$ 是一个可逆矩阵,即 $\begin{vmatrix} \boldsymbol{A} \end{vmatrix} \neq 0$, 则当行列式 $\begin{vmatrix} \boldsymbol{A} + t \boldsymbol{B} \end{vmatrix}$ 的值与 $t$ 无关时,就可以证明 $\boldsymbol{A}^{-1} \boldsymbol{B}$ 是一个幂零矩阵. 证明过程如下:
$$
\begin{align}
\begin{vmatrix}
\boldsymbol{A} + t \boldsymbol{B}
\end{vmatrix} & = \begin{vmatrix}
\boldsymbol{A} \left( \boldsymbol{E} + t \boldsymbol{A}^{-1} \boldsymbol{B} \right)
\end{vmatrix} \notag \\ \notag \\
& = \begin{vmatrix}
\boldsymbol{A}
\end{vmatrix} \cdot \begin{vmatrix} \boldsymbol{E} + t \boldsymbol{A}^{-1} \boldsymbol{B} \end{vmatrix} \notag \\ \notag \\
& = \begin{vmatrix}
\boldsymbol{A}
\end{vmatrix} \cdot \prod_{n} \left( 1 + \lambda_{n} t \right)
\end{align} \tag{1}
$$
其中 $\lambda_{1}$, $\lambda_{2}$, $\dots$, $\lambda_{n}$ 是矩阵 $\boldsymbol{A}^{-1} \boldsymbol{B}$ 的特征值.
于是,根据上面的 $(1)$ 式,若要使行列式 $\begin{vmatrix} \boldsymbol{A} + t \boldsymbol{B} \end{vmatrix}$ 的值与 $t$ 无关,则必须有:
$$
\lambda_{1} = \lambda_{2} = \dots = \lambda_{n} = 0
$$
于是可知,$\boldsymbol{A}^{-1} \boldsymbol{B}$ 是一个幂零矩阵.
三、总结
在本文中,我们通过构建“动线交点”理论,基于几何线条,将抽象的矩阵乘法运算形象化,从而帮助我们从几何的视角上,对矩阵乘法运算过程,以及幂零矩阵在自乘运算中逐渐变为零矩阵的“塌缩”过程建立更加深入和全面的认知.
高等数学
涵盖高等数学基础概念、解题技巧等内容,图文并茂,计算过程清晰严谨。
线性代数
以独特的视角解析线性代数,让繁复的知识变得直观明了。
特别专题
通过专题的形式对数学知识结构做必要的补充,使所学知识更加连贯坚实。