1、参考视频:《线性代数的本质》 3Blue1Brown B站视频
2、线性代数很抽象,重点在于理解,本笔记中重要内容加粗高亮标记
向量的表示有多种,包含方括号、大括号、横向、竖向等。
为了与“点”进行区分,本教程采用竖向,方括号表示向量
很明显,一个二维向量 中的1、2指的是这个向量的横坐标与纵坐标,如图所示
这里引申出第一个重要概念:定义及其应用
我们定义了向量的内容为其对应的坐标轴的坐标值,后续向量的所有计算都在此基础上进行, 我们可以随着学习的深入知道向量如何进行计算,得出新的坐标值。但坐标值和我们的实际应用有什么关系呢?如果没有切实的关系,无法将其应用到实际计算中。
一个最常用的例子是,对物体进行受力分析,这个力就是一个向量。很巧妙的是:力的分力和向量一样,对应的都是垂直投影(“巧妙”加引号)
所以,对于向量的定义(投影长度)与实际(受力情况)吻合,才是定义及其应用的关键。在后面的矩阵中,存在着多个定义及其应用的情况,这也是线性代数抽象的原因之一(定义很多)。
向量的表现形式可分为两种: 、1i+2j 如果我们仅仅把这两个表达式看成是向量的不同表达形式,那么我们就错过了向量中最重要的内容:线性关系,而要理解线性关系,我们只需要明白向量的加法、乘法即可。
根据之前篇章的定义及其应用内容,我们显然可以知道,向量的加法也是一种定义,其定义内容对应着实际应用。
向量加法可以定义出很多种方式,但只有对应实际应用的才是可行的:对受力情况来说,两个分力的合力符合平行四边形定则,这是一种客观物理定理,而向量的加法,同样定义为符合平行四边形定则
通过平行系变形定则可知, + =
向量乘法的定义显然要和我们直观理解相同,即n=n个相加
所以:n=
有了向量的加法和乘法,我们可以得到线性代数里最重要的内容:线性关系
前面我们提到了:向量的表现形式可分为两种: 、1i+2j
第二种表达式可以写成:,之所以可以写成这种表达式,是因为我们可以找到两个向量: = =
任意一个非零向量都会在x
轴与y
轴上有投影,也就是可以通过向量加法及乘法计算写成的形式(平行四边形定则),这个向量的两种表达分别为坐标、与向量 、 的关系,而向量 、 我们把他们叫做 基向量
之所有我们单独提出来这种描写向量的形式,是因为其蕴含的本质:
任意一个向量可以表达成基向量的线性组合
所谓的线性关系指:当坐标轴产生某种指定的变化后,这种的关系保持不变,举例:的图形如下:
将整个坐标轴连同向量放大一倍:
此时的向量在新的坐标系下发生了变化()(新坐标系下的值,新坐标系下基向量仍然为 = =),但向量和原基向量的线性关系不变,仍然为(在新的坐标系下把旧基向量加old以示区别)
之所以向量保持着线性关系,其原因有二:
1、 可得知一个向量与基向量的关系只包括 缩放、相加
2、坐标系的变换需要满足一定条件:坐标轴平行且等距分布、原点不变,在此基础上,坐标轴的旋转(任意方向)、剪切、缩放都不破坏线性关系。
向量线性变化的用途在于:追踪某个向量在坐标系变换后的新坐标是一件苦难的事,想象下将坐标轴旋转缩放组合动作,向量的坐标难以追踪,但基向量因为跟随x、y
轴运动,其变换后的位置易于追踪。
无论坐标系如何线性变换,只需要找到原基向量在新坐标系下的位置,即可通过线性计算原向量新坐标系下的位置,对于计算机3d显示等应用中非常重要。
前面描述了一个坐标系变换后,变换前的向量也发生了变化,那么用什么去描述这个变化本身呢?
以1.3.2为例,变换后原基向量 、 在新的坐标系下变成了一个“普通”的向量,
变换后 = =,变换后向量,可以通过线性关系计算出,新坐标系下向量 =
本例中坐标系的变换为缩放2倍,这个变换就可以用矩阵表示:
发现了没有,这个矩阵实际上是将原基向量在新坐标系下的值,按照列的方向写进了矩阵中。
表示原坐标系下的基向量在新坐标系下的数( = =)
显然,我们可以定义一个矩阵乘向量了,矩阵表示的是坐标系变换的规则,向量表示的是变换前的向量,计算结果仍然是一个向量,表示的是变换后的新向量
可知:=
具体计算过程为= + =
上式中的中间计算步骤即体现了线性关系
前面我们定义了一个矩阵,这个矩阵实际上是将原基向量在新坐标系下的值,按照列的方向写进了矩阵中。
如果要定义两个矩阵相乘,首先我们必须沿用以前的定义,两个矩阵均表示原基向量在新坐标系下的变换,并分别按照列的方向写进了矩阵中。
如 ,它的几何意义是?
实际上,上面的矩阵相乘,表示的是初始基向量按照进行线性变换,形成了新的坐标系,得出了新的基向量,新的基向量再按照的规则再次进行线性变换,最终得到了一个组合的线性变换,可以以此为依据和向量相乘
注意:矩阵相乘是有先后顺序的,从几何意义上很容易理解,一个坐标系的线性动作组合顺序不同,会产生不同的结果
可知,矩阵相乘的结果是初始基向量在最终坐标系下对应的向量值,他们的结果仍然是一个矩阵,仍然需要满足前述定义,按照列的方向写进了矩阵中。
显然,矩阵相乘分别计算初始基向量在最终坐标系下的,再写入矩阵中即可。
中,=,=,计算出后写入矩阵即得到了矩阵的乘结果。
前面两个章节我们得出了线性代数的第一个重要结论:通过线性变换可以快速计算新向量的值,其本质在于向量缩放与加法计算、坐标系线性变换、线性关系保持不变。
线性代数除了上面的特性外,存在着另外一个特性:
以上图为例,当坐标系发生线性变化时,原坐标系中图形面积也跟随发生变化,但基向量面积缩放比例和其他所有面的面积缩放比例相同!
比如上面的坐标系发生了线性变化,变化后初始基向量的新数值为
仍然是通过线性变化的矩阵,可得知变化后所有面积的缩放倍数,记为:
det(),即我们常见的行列式:!
行列式是用于计算变换前后的缩放!!
对于1.3.2的变换,可以明显看出,变换后的缩放倍数为4,即=4
二阶行列式的计算很简单:=ad-bc
截取原视频的一张图片,用于证明参考使用:
(顺带一提:上图中斜向的蓝色线,即前述所谓的线性变化之一:剪切)
以上内容是在二位坐标系上的几何意义,当然我们可以拓展到三维/三阶中
三维坐标系中:
向量:,显然可以知道:a、b、c是向量在三个坐标轴的投影,通常我们用x、y、z
表示三个方向的坐标轴,用 、 、 表示基向量
矩阵:,显然可以知道:竖向依次是原基向量 、 、 变换后的数,矩阵的乘法和二维运算一致,可轻易推导出三维/三阶矩阵的运算公式
行列式:,显然可以知道,此时缩放的是体积而非面积(x、y、z
同时缩放,形成体积变化),行列式的计算结果是一个标量,其计算推理不同矩阵那样简洁,此处不叙
线性代数中还有张量、张成空间、点积叉积等其他内容,同时对于前面的计算,如行列式存在着维度变化等细节,此部分内容不在本篇叙述。