回到首页 / 上级目录

线性方程组与逆矩阵

线性变换能用来描述对空间的操纵,同时还可以解线性方程组。

线性方程组

给一个简单的线性方程组:

\[\begin{cases} 2x+2y=-4 \\ 1x+3y=-1 \end{cases}\]

可将其写成如下形式:

\[\begin{bmatrix}2&2\\1&3\end{bmatrix} \begin{bmatrix}x\\y\end{bmatrix}= \begin{bmatrix}-4\\-1\end{bmatrix}\]

即 $A\vec{v}=\vec{w}$,几何意义是通过变换矩阵 $A$ 将 $\vec{v}$ 转化为 $\vec{w}$。

该方程的解依赖于矩阵 $A$ 所代表的变换。

根据 $A$ 的行列式是否为零可分为两种情况。

1. 行列式不为零

既然 $\vec{v}$ 到 $\vec{w}$ 由变换 $A$ 完成,那么对 $\vec{w}$ 进行变换 $A^{-1}$ 可将其变换回 $\vec{v}$:

\[\vec{v} = A^{-1}A\vec{v}=A^{-1}\vec{w}\]

复合变换 $A^{-1}A$ 表示什么都不做,即单位矩阵 $I$。

$\vec{v}$ 和 $\vec{w}$ 一一对应,即该方程存在唯一解。

矩阵 $A^{-1}$ 称为 $A$ 的逆矩阵(Inverse Matrix)。

2. 行列式为零

行列式为零表示矩阵 $A$ 将平面压缩到更低的纬度上,$A\vec{v}$ 也落在低维空间中。

此时 $A$ 没有逆变换,因为作为函数,逆变换不允许一个输入有多个输出。

直观地说,我们不能将一条线通过线性变换还原成整个平面。

但即便不存在逆变换,解仍然可能存在。

通过 $A$ 将平面压缩为一条直线,有两种情况:

解方程组的过程中,线性变换存在降维现象。

用秩(Rank)来表示变换后空间的维数。

当变换的结果为直线时,称变换 $A$ 的秩为 1。

当变换的结果为平面时,称变换 $A$ 的秩为 2。

对于 $2\times 2$ 矩阵,它的秩最大为 2,意味着基向量仍旧能张成整个二维空间,并且矩阵 $A$ 的行列式不为零。

对于 $3\times 3$ 矩阵,秩为 2 意味着空间被压缩成了平面,但和秩为 1 的情况相比,压缩并不是那么严重。

如果一个三维变换的行列式不为零,变换结果仍然充满整个三维空间。

列空间

列空间(Column Space)是矩阵的列所张成的空间。

矩阵 $A$ 的列空间(Span)是 $A\vec{v}$ 的所有向量组成的集合。

矩阵 $A$ 的列表示基向量变换后的位置,变换后的基向量张成的空间就是所有可能的变换结果。

所以更精确的秩的定义是列空间的维度。

秩的最大值是列数,我们称之为满秩(Full Rank)。

零空间

零向量一定在列空间中,因为线性变换必须保持原点位置不变。

对于满秩变换来说,唯一能在变换后落在原点的是零向量。

对于一个非满秩的矩阵,空间被矩阵压缩到一个更低的维度上,会有一系列向量在变换后成为零向量。

如果一个二维线性变换将空间压缩到一条直线上,那么某条直线上的所有向量会被压缩到原点。

如果一个三维线性变换将空间压缩到一个平面上,同样某条直线上的向量在变换后落在原点。

如果一个三维线性变换将空间压缩到一条直线上,那么某个平面上的向量在变换后落在原点。

变换后落在原点的向量的集合,被称为变换矩阵的零空间(Null Space)或核(Kernel)。

对于线性方程组,当 $\vec{v}$ 恰好为零向量时,零空间给出的就是该方程所有可能的解。