线性代数几乎在所有技术领域都有所体现并被广泛引用的主要原因是:它能帮我们求解特定方程组。当我说方程组时,就是在说有一些未知量与一系列与之相关的方程,大部分情况下这些方程会显得非常复杂。
但如果你幸运地话它们有一个特定的形式,在每一个方程中所有未知量只具有常系数,这些未知量之间只进行加和,也就是说没有幂次,没有奇怪的函数,没有未知量间的乘积等等,要整理这一特定的方程组一个典型的方法是:将未知量放在左边,剩余的常数项放在右边,并且将同一个未知量竖直对其也是极好的,要做到这一点可能需要在某个未知量不出现时添加0这个系数,这就被称为线性方程组,这和矩阵向量乘法非常相似,实际上可以将所有方程合并成一个向量方程(图一),这个方程有一个包含所有常数系数的矩阵(图二)一个包含所有未知量的向量(图三)以及它们乘积所得到的常数向量(图四),我们程系数矩阵为A包含为未知量的向量为粗体的x右侧常量向量为v。
这不仅仅是将方程组写进一行的技巧,它还阐明了这个问题中的几何直观部分(图五)。
(图一)
(图二)
(图三)
(图四)
(图五)
矩阵A代表一种线性变换,所以Ax=v意味着我们去寻找一个向量x使得他在变换后与v重合。
思考这一过程,你完全可以只考虑对空间变形以及变换前后向量的重叠,就将多个未知量相互混合的复杂方程组印入脑中。
举一个简单的例子,你有两个方程和两个未知量构成的方程组,意味着A是2*2的矩阵v和x都是二维向量,现在这个方程的解依赖于矩阵A所代表的变换,是将空间挤压到一条线或者一个点等底维空间,还是保持想初始状态一样的完整的二维空间。
我们将它分为两种情况A的行列式为零和A的行列式不为零。
先看看最可能发生的情况即A的行列式不为0,此时空间并未被挤压成零的面积,在这种情况下,有且只有一个向量在变换后与v重合,并且可以通过逆向变换来找到这个向量,如同倒带一样,通过跟踪v的动向就能找到Ax=v的向量x,当你逆向进行变换时,它实际上对应了另一个线性变换通常它被称作A的逆称作A^,记为A^(-1),比如说A是逆时针旋转90°的变换,那么A的逆就是顺时针旋转90°的变换,如果A向右剪切的变换就是将j帽向右平移了一个单位,A的逆就是向左剪切的变换将j帽向左平移一个单位。
总的来说A逆是满足以下性质的唯一变换,首先应用A代表的变换,在应用A逆代表的变换,你会回到原始状态,两个变换相继作用在代数上体现为矩阵乘法,所以A逆的核心性质在于A逆乘以A等于一个什么都不做的矩阵,这个设么都不做的变换被称为恒等变换,它保持i帽和j帽不变所以它的列就是[(1,0),(0,1)],一旦你找到A的逆,你就能在两边同乘A的逆矩阵来求解向量方程。这个过程在集合上就对应逆行进行变换并跟踪v的动向。
随机选一个矩阵,有很大可能会遇到这一非零行列式的情况,也就是说:对于两个未知量和两个方程构成的方程组几乎可以确定它存在唯一解,当方程数目与未知量数目相同时这一思想在高维情况下也有意义。
同样的可以给方程组赋予几何意义。也就是你有线性变换A某个向量v,并且你在寻找向量x,在变换后与v重合,只要变换A不将空间压缩到一个更低的维度上也就是他的行列式不为零,那它存在的逆变换A逆,使得应用A变换再应用A逆变换之后结果与恒等变换无异,要想求解方程你只需要A逆与向量v相乘即可,但是当行列式为0时与这个方程组相关的变换将空间压缩到更低的维度上,此时没有逆变换,你不能将一条线解压缩为一个平面,至少这不是一个函数能做到的,这样就会要求将一个单独的向量变换为一整条的向量,但是函数只能将一个输入变换为一个输出。
类似的对于三个方程和三个未知量,如果变换将三维压缩为一个平面甚至一条直线或者一个点那么它也没有逆变换,它们都对应行列式为0的情况因为此时所有区域都被压缩到0体积。
即便不存在逆变换解仍然可能存在,比如说一个变幻将空间压缩为一条直线你得足够幸运让向量v恰好处于这条直线上。
当变幻的结果为一条直线时:也就是结果是一维的,我们成这个变换的秩为,如果变换后的结果落在某个二维平面上我们称这个变换的秩为2,所以说秩代表变换后的空间的维数,比如说对于22的矩阵它的秩最大为2意味着基向量仍旧能张成整个二维空间,并且矩阵的行列式不为零。但是对于33的矩阵,秩为2意味着空间被压缩了,但是和秩为1的情况相比压缩并不是那么严重。如果一个三维变换的结果不为0变换结果仍旧充满整个三维空间,那么它的秩为3。
不管是一条直线一个平面还是三维空间等,所有可能变换结果的集合都被称作矩阵的列空间。
矩阵的列告诉你基向量变换后的位置,这些变换后的基向量张成的空间就是所有可能的变换结果,换句话说列空间就是矩阵的列所张成的空间,所以更精确秩的定义就是列空间的维数,当秩达到最大值时,意味着秩与列数相等,我们称之为满秩,注意,零向量一定会被包含在列空间中因为线性变换必须保持原点位置不变,对于一个满秩变换来说,唯一能在变换后落在原点的就是零向量本身,但是对于一个非满秩来说,它将空间压缩至一个更低的维度上,也就是说会有一系列在变换后会成为零向量,举个例子,如果一个二维变换将空间压缩到一条直线上,那么延不同方向直线线上的所有向量就被压缩到原点,如果一个三维线性变换将空间压缩到一个平面上,同样也会有一整条线上的向量在变换后落在原点,如果一个三维线性变换将空间压缩到一条直线上,那么就有一整个平面上的向量在变换后落在原点。
变换后落在原点的向量的集合被称作矩阵的零空间或核。变换后一些向量落在零向量上,而零空间正式这些向量所构成的空间。
对线性方程组来说当向量v恰好为零时零空间就是这个向量方程所有可能的解。
以上就是从几何角度理解线性方程组的一个高水平概述。每个方程组都有一个线性变换与之联系,当逆变换存在时,你就能用这个逆变换求解方程组,否则列空间的概念让我们清楚什么时候存在解,零空间的概念有助于我们理解所有可能解的集合是什么样的,