峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制

一、前言

在本文中,「荒原之梦考研数学」将为同学们详细介绍一下考研数学线性代数中的“幂零矩阵”.

同时,在本文中,「荒原之梦考研数学」还会通过“峰图(峰式图)”的方式证明为什么有些矩阵是(不是)幂零矩阵,同时以形象的方式展示幂零矩阵的“塌缩”机制.

二、正文

对于一个 $n \times n$ 阶的方矩阵 $\boldsymbol{A}$,如果满足下式(其中 $k$ 是一个正整数):

$$
\boldsymbol{A}^{k} = 0
$$

则称矩阵 $\boldsymbol{A}$ 是一个幂零矩阵.

例如,对于矩阵 $\boldsymbol{A} = \begin{bmatrix} 0 & \textcolor{orange}{1} & 0 & 0 \\ 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \end{bmatrix}$, 我们有:

$$
\begin{aligned}
\boldsymbol{A}^{2} & = \begin{bmatrix} 0 & \textcolor{orange}{1} & 0 & 0 \\ 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \end{bmatrix} \times \begin{bmatrix} 0 & \textcolor{orange}{1} & 0 & 0 \\ 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \end{bmatrix} = \begin{bmatrix} 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} \\ \\
\boldsymbol{A}^{3} & = \begin{bmatrix} 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} \times \begin{bmatrix} 0 & \textcolor{orange}{1} & 0 & 0 \\ 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \end{bmatrix} = \begin{bmatrix} 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} \\ \\
\boldsymbol{A}^{4} & = \begin{bmatrix} 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix} \times \begin{bmatrix} 0 & \textcolor{orange}{1} & 0 & 0 \\ 0 & 0 & \textcolor{orange}{1} & 0 \\ 0 & 0 & 0 & \textcolor{orange}{1} \\ 0 & 0 & 0 & 0 \end{bmatrix} = \begin{bmatrix} 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix}
\end{aligned}
$$

从上面的计算过程可以看到,经过 $3$ 次自乘,矩阵中的非零元素 $1$ 不断向矩阵的右上角“移动”,直到完全消失,得到了一个只有 $0$ 元素的零矩阵,所以,矩阵 $\boldsymbol{A}$ 就是一个幂零矩阵.

当然,幂零矩阵中的元素并不只能是 $0$ 和 $1$, 也可以是其他非零元素. 例如,对于矩阵 $\boldsymbol{B} = \begin{bmatrix}
0 & \textcolor{orange}{2} & 0 \\
0 & 0 & \textcolor{orange}{3} \\
0 & 0 & 0
\end{bmatrix}$, 我们有:

$$
\begin{aligned}
\boldsymbol{B}^{2} & = \begin{bmatrix}
0 & \textcolor{orange}{2} & 0 \\
0 & 0 & \textcolor{orange}{3} \\
0 & 0 & 0
\end{bmatrix} \times \begin{bmatrix}
0 & \textcolor{orange}{2} & 0 \\
0 & 0 & \textcolor{orange}{3} \\
0 & 0 & 0
\end{bmatrix} = \begin{bmatrix}
0 & 0 & \textcolor{orange}{6} \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix} \\ \\
\boldsymbol{B}^{3} & = \begin{bmatrix}
0 & 0 & \textcolor{orange}{6} \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix} \times \begin{bmatrix}
0 & \textcolor{orange}{2} & 0 \\
0 & 0 & \textcolor{orange}{3} \\
0 & 0 & 0
\end{bmatrix} = \begin{bmatrix}
0 & 0 & 0 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}
\end{aligned}
$$

虽然前面举的例子都是严格的上三角矩阵(主对角线元素全为零的上三角矩阵),但是,事实上,严格的下三角矩阵,也是常见的幂零矩阵,例如:

$$
\begin{bmatrix}
0 & 0 & 0 \\
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0
\end{bmatrix}
$$

或者:

$$
\begin{bmatrix}
0 & 0 & 0 \\
\textcolor{orange}{1} & 0 & 0 \\
\textcolor{orange}{1} & \textcolor{orange}{1} & 0
\end{bmatrix}
$$

为了将幂零矩阵在自乘过程中的“塌缩”更加形象地展示出来,「荒原之梦」原创建立了一种“动线交点”的理论形式来展示这个过程.

首先,以单位矩阵 $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1}
\end{bmatrix}$ 为例,根据矩阵乘法的运算法则,我们首先将矩阵 $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1}
\end{bmatrix}$ 顺时针旋转 $90^{\circ}$, 即:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 01.
图 01.

此时,矩阵乘法运算 $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1}
\end{bmatrix}$ $\times$ $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1}
\end{bmatrix}$ $=$ $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1}
\end{bmatrix}$ 就可以表示为:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 02.
图 02.

接着,我们将上面的图 02 矩阵中的非零元素用一条直线连接起来,如图 03 所示:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 03.
图 03.

之后,按照矩阵的列数 $n$, 将绿色的直线在黄绿色的直线上向右移动 $n$ 次,则两个矩阵的非零元素对应的两个线条之间所产生的交点的个数就是这两个矩阵相乘所得的非零元素的个数,如图 04、05 和 06 所示:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 04.
图 04.
峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 05.
图 05.
峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 06.
图 06.

以上就是矩阵乘法运算的“动线交点”理论.

于是,根据上面的“动线交点”理论,对于上三角形式的幂零矩阵 $\begin{bmatrix}
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$, 我们有:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 07.
图 07.

接着,绘制出乘法运算 $\begin{bmatrix}
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ $\times$ $\begin{bmatrix}
0 & \textcolor{orange}{1} & 0 \\
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ $=$ $\begin{bmatrix}
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$ 对应的图示:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 08.
图 08.

因此,转换为“动线交点”理论验证,可以形象地看出看来为什么幂零矩阵的非零元素由 $2$ 个减少为了 $1$ 个:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 09.
图 09.
峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 10.
图 10.

类似地,根据上面的“动线交点”理论,对于上三角形式的幂零矩阵 $\begin{bmatrix}
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$, 我们有:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 11.
图 11.

接着,绘制出乘法运算 $\begin{bmatrix}
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ $\times$ $\begin{bmatrix}
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ $=$ $\begin{bmatrix}
0 & 0 & \textcolor{orange}{1} \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$ 对应的图示:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 12.
图 12.

因此,转换为“动线交点”理论验证,可以形象地看出看来为什么幂零矩阵的非零元素由 $3$ 个减少为了 $1$ 个:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 13.
图 13.

同样的,根据上面的“动线交点”理论,对于下三角形式的幂零矩阵 $\begin{bmatrix}
0 & 0 & 0\\
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0
\end{bmatrix}$, 我们有:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 14.
图 14.

接着,绘制出乘法运算 $\begin{bmatrix}
0 & 0 & 0\\
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0
\end{bmatrix}$ $\times$ $\begin{bmatrix}
0 & 0 & 0\\
\textcolor{orange}{1} & 0 & 0 \\
0 & \textcolor{orange}{1} & 0
\end{bmatrix}$ $=$ $\begin{bmatrix}
0 & 0 & 0\\
0 & 0 & 0 \\
\textcolor{orange}{1} & 0 & 0
\end{bmatrix}$ 对应的图示:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 15.
图 15.

因此,转换为“动线交点”理论验证,可以形象地看出看来为什么幂零矩阵的非零元素由 $2$ 个减少为了 $1$ 个:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 16.
图 16.

对于非幂零矩阵,我们也可以根据“动线交点”理论进行判断.

例如,根据上面的“动线交点”理论,对于非幂零矩阵 $\begin{bmatrix}
0 & \textcolor{orange}{1} & 0 \\
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$, 我们有:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 17.
图 17.

接着,绘制出乘法运算 $\begin{bmatrix}
0 & \textcolor{orange}{1} & 0 \\
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ $\times$ $\begin{bmatrix}
0 & \textcolor{orange}{1} & 0 \\
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ $=$ $\begin{bmatrix}
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ 对应的图示:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 18.
图 18.

因此,转换为“动线交点”理论验证,由于两个点和两个点组合交叉,会形成四个点——从图 19、20、21、22 可以形象地看出看来为什么非幂零矩阵的非零元素由 $3$ 个增加为了 $4$ 个(只有元素在矩阵自乘的过程中不断减少,直至不存在非零元素的矩阵才是幂零矩阵):

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 19.
图 19.
峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 20.
图 20.
峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 21.
图 21.
峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 22.
图 22.

当然,观察上面的“动线交点”的形成过程可知,如果忽略交点处圆点的形状,则图 19 中的图形和图 21 中的图形其实是完全一致的,图 20 中的图形和图 22 中的图形其实也是完全一致的,因此,这两组图形事实上可以合二为一,与矩阵 $\begin{bmatrix}
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & 0
\end{bmatrix}$ 可以转换为矩阵 $\begin{bmatrix}
0 & \textcolor{orange}{1} & \textcolor{orange}{1} \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$ 的这一性质是相符的.

此外,为了绘图方便,对于只有一个孤单非零元素(一个非零元素周围没有其他非零元素)的情况,我们也使用直线(而非一个圆点)表示该元素.

例如,对于非幂零矩阵 $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$, 我们有:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 23.
图 23.

接着,绘制出乘法运算 $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$ $\times$ $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$ $=$ $\begin{bmatrix}
\textcolor{orange}{1} & 0 & 0 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}$ 对应的图示:

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 24.
图 24.

因此,转换为“动线交点”理论验证,可以形象地看出看来为什么非幂零矩阵的非零元素在运算前后都是 $1$ 个(只有元素在矩阵自乘的过程中不断减少,直至不存在非零元素的矩阵才是幂零矩阵):

峰图 | 基于“动线交点”理论理解幂零矩阵的“塌缩”机制 - 图 25.
图 25.

通过上面的“动线交点”理论,我们可以很形象地看出幂零矩阵的“塌缩”的机制,本质上就是不同的几何线条可以形成的交叉点的数量存在区别.

设 $\boldsymbol{F}$ 为 $n \times n$ 阶的幂零矩阵,则:

  1. 满足 $\boldsymbol{F}^{k} = 0$ 的最小整数 $k$ 小于或等于 $n$;
  2. 每⼀个严格的上三⻆矩阵或下三⻆矩阵都是幂零矩阵;
  3. 每⼀个不可逆矩阵(不可逆矩阵有时候也被称为“奇异方阵”,对应的,可逆矩阵也被称为“非奇异方阵”)都可以写成若⼲个幂零矩阵的乘积(可逆矩阵不可能写成若干个幂零矩阵的乘积,只能写成若干个初等矩阵的乘积);
  4. $\boldsymbol{F}$ 的所有特征值为 $0$, $\boldsymbol{F}$ 的特征多项式为 $\lambda^{n}$. 因此,$\boldsymbol{F}$ 的行列式和迹都为 $0$;
  5. 若 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 是两个矩阵,且 $\boldsymbol{A}$ 是一个可逆矩阵,即 $\begin{vmatrix} \boldsymbol{A} \end{vmatrix} \neq 0$, 则当行列式 $\begin{vmatrix} \boldsymbol{A} + t \boldsymbol{B} \end{vmatrix}$ 的值与 $t$ 无关时,就可以证明 $\boldsymbol{A}^{-1} \boldsymbol{B}$ 是一个幂零矩阵. 证明过程如下:

三、总结

在本文中,我们通过构建“动线交点”理论,基于几何线条,将抽象的矩阵乘法运算形象化,从而帮助我们从几何的视角上,对矩阵乘法运算过程,以及幂零矩阵在自乘运算中逐渐变为零矩阵的“塌缩”过程建立更加深入和全面的认知.


荒原之梦考研数学思维导图
荒原之梦考研数学思维导图

高等数学箭头 - 荒原之梦

涵盖高等数学基础概念、解题技巧等内容,图文并茂,计算过程清晰严谨。

线性代数箭头 - 荒原之梦

以独特的视角解析线性代数,让繁复的知识变得直观明了。

特别专题箭头 - 荒原之梦

通过专题的形式对数学知识结构做必要的补充,使所学知识更加连贯坚实。

荒原之梦考研数学网 | 让考场上没有难做的数学题!

荒原之梦网全部内容均为原创,提供了涵盖考研数学基础知识、考研数学练习题、考研数学真题等方面,大量精心研发的学习资源。

豫ICP备17023611号-1 | 公网安备 - 荒原之梦 豫公网安备41142502000132号
Copyright©2017-2026 ZhaoKaifeng.com 版权所有 All Rights Reserved.

豫ICP备17023611号-1
 豫公网安备41142502000132号
Copyright©2026   ZhaoKaifeng.com   All Rights Reserved.

荒原之梦 自豪地采用WordPress