希沃ENOW大前端

公司官网：CVTE(广州视源股份)

团队：CVTE旗下未来教育希沃软件平台中心enow团队

本文作者：

前言

本文假设读者已经对向量、矩阵有一定的了解。对此不了解的读者不妨先看一下这篇文章：《乘风破浪的WebGL系列-仿射变换数学基础》

在上一篇文章：《WebGL 坐标系基础（一）》中，我们介绍了WebGL 中常见的几种坐标系以及他们之间的关系。本期将更加“硬核”一些，从数学的角度，推导上期讲到的各个变换矩阵。

基础概念

列向量

在下面的推导中，我们统一使用列向量来表示一个坐标，所谓列向量就是一个N*1 矩阵。例如坐标(x, y, z) 可以表示为： Screen_Shot_2021-03-06_at_23.26.41.png

为什么要用这样的 N1 矩阵来表示坐标？其实就是因为我们是通过一个个的矩阵来表示各种各样的变换，而把坐标变成 N1 矩阵，就能让其与变换矩阵运算，从而变换我们的坐标。

齐次坐标

上面用 N*1 矩阵表示的坐标，我们称之为 N 维坐标，如果我们再加一维，变成 N+1 维，就称之为齐次坐标，对应的 N+1 维矩阵就是齐次矩阵。

为什么要引入齐次坐标的概念？常见的说法是通过齐次坐标新增加的维度来区分点与向量，新增维度的值为0则代表向量，不为0则代表点。

关于为什么新增的维度能用于区分点与向量，可以看一下这篇文章：齐次坐标理解

不过个人认为，齐次坐标更加巧妙的一点是能够把平移转换变成矩阵相乘的运算。

下面我们会知道，旋转、缩放等变换都是通过矩阵乘法进行的，并且变换的组合（例如先缩放再旋转）也是通过变换矩阵相乘求出。但是唯独平移变换是通过矩阵加法进行。假设一个坐标分别往x，y，z 方向平移 Tx，Ty，Tz，那么用矩阵加法来表示就是：

Screen_Shot_2021-03-07_at_00.06.58.png

等式的右边就是我们需要获得的平移变换之后的坐标，由于常量 Tx，Ty，Tz 的存在，我们显然无法通过简单的矩阵乘法得到这样的坐标，那么我们要如何通过乘法得到一样的坐标呢？只需要加一维即可。

Screen Shot 2021-03-09 at 10.05.09.png

此外还记得上一期谈到的分量 w 吗？他其实就是齐次坐标带来的额外的一维，所以齐次坐标的引入也方便我们模拟透视效果。

总的来说，齐次坐标的引入具有三个作用：

区分向量和点
使平移变换能通过矩阵乘法运算实现
方便模拟透视效果

基本变换

在齐次坐标下，仿射变换都可以套用以下的形式：

Screen Shot 2021-03-09 at 10.07.26.png 可见每一个分量都符合仿射变换的定义。

平移变换

根据平移变换的定义，对一个点(x, y, z)平移，即对其三个分量分别加上一个常数：

Screen_Shot_2021-03-07_at_16.44.29.png 套入上面提到的矩阵模板，即a=1，b=0，c=0，显然平移矩阵可以写成：

Screen_Shot_2021-03-07_at_16.46.23.png

缩放变换

缩放变换意味着一个点的各个分量均为原来的 S 倍，以 x 轴分量缩放 Sx 倍为例：

Screen_Shot_2021-03-07_at_16.50.35.png 套入上面的矩阵模版，即a=Sx，b=0，c=0，Tx=0，显然缩放矩阵可以写成：

Screen_Shot_2021-03-07_at_16.52.52.png

旋转变换

以上两个矩阵的推导都非常直观，相比起来旋转矩阵的推导就略显复杂。首先我们定义，这里所说的旋转是指将点P 绕坐标原点逆时针旋转 θ 度。

Screen_Shot_2021-03-07_at_16.59.26.png 为了推导的方便我们先使用极坐标表示。在极坐标下，P点的坐标为（r, α），P 旋转 θ 度后的坐标为（r, α + θ)。再将极坐标转回直角坐标，有：

Screen_Shot_2021-03-07_at_17.07.54.png

把P点原来的极坐标与直角坐标的转换关系代入，有：

Screen_Shot_2021-03-07_at_17.10.03.png 上面的推导是二维的，但是我们可以很容易的将上面的旋转等同于在 xyz 坐标系中，绕坐标轴 z 旋转，因为是绕坐标轴 z 旋转，所以旋转前后点 P 的 z 分量保持不变，x，y分量的变化与上面的推导结果一致，因此绕 z 轴旋转的结果为：

Screen_Shot_2021-03-07_at_17.19.26.png

代入我们的矩阵模板，可得绕z 轴旋转的旋转矩阵：

Screen_Shot_2021-03-07_at_17.21.00.png

同理可得绕 x 轴，y 轴的旋转矩阵，这里就不列出来，读者可以自己写一下，答案可以参考：

LearnOpenGL

需要注意的是，更多时候我们需要绕任意轴旋转，尽管绕任意轴旋转可以通过以上三轴旋转的组合实现，但会出现万向节死锁的问题，一个更好的方式是一步到位，求解出一个绕任意轴旋转的矩阵，但是这个矩阵会比较复杂并且也无法彻底避免万向节死锁问题。

这样的矩阵我先贴出来，由于并非本期重点所以略去了推导过程，有兴趣的童鞋可以看一下这篇：三维空间绕任意轴旋转矩阵的推导

Screen_Shot_2021-03-07_at_17.33.09.png 其中 (Rx,Ry, Rz) 代表旋转轴的向量。

要完全解决该问题需要使用四元数，有兴趣的读者可以找另外的资料学习，（不妨看看这篇四元数与三维旋转），此处就不再展开了。

模型变换矩阵

简单回顾一下模型变换：用于将模型坐标系转换到世界坐标系的变换，也就是将我们的小车模型安放在世界坐标系的某一处。

而要实现模型变换，显然一个很好的方式就是借助于矩阵这一强大的数学工具。我们将模型的某一个顶点的坐标用上文提到的列向量来表示，那么只要将我们的模型变换矩阵左乘该列向量，就能得到变换之后的顶点坐标。

模型变换是上文提到的三个基本变换组合而成，我们也知道矩阵乘法不符合交换律，因此基本变换的组合顺序至关重要，具体来说，模型变换有以下公式： Screen Shot 2021-03-09 at 10.12.37.png 其中 T 是平移变换矩阵，R 是旋转变换矩阵，S是缩放变换矩阵。之所以有这样的顺序，我们可以从两个角度来理解。

定性理解

我们在推导旋转矩阵的时候，其实是约定了顶点是绕坐标原点旋转，如果模型的原点与世界坐标原点重合，那么顶点绕模型原点与绕坐标原点旋转是一样的。然而如果我们先平移，让两个原点不重合，那么在应用旋转矩阵的时候，顶点依旧绕坐标原点旋转，但我们一般还是希望顶点能绕模型原点旋转，这就不符合我们的期待。所以需要先进行旋转变换，再平移。缩放变换类似的，同样隐含着以坐标原点为中心的条件，所以也是要先缩放再平移。

至于缩放与旋转的次序，我们在定义缩放矩阵的时候，是针对当前的坐标定义的各个分量的缩放比例，如果此时经过旋转，坐标已经发生了改变，那么再使用之前的缩放比例就会有问题。而旋转则没有类似的问题，因为他定义的是任何一个点需要绕坐标原点旋转某个角度，这样的定义适用于所有坐标，不存在坐标已经改变导致原定义不适用的问题。

数学理解

这里我举平移与旋转，旋转与缩放作为例子。

假如先平移再旋转

勘误：此处的矩阵相乘应为点乘

Screen_Shot_2021-03-07_at_23.02.09.png 注意变换之后的坐标的后半部分，从结果来看，不再以原来的方向平移，平移的方向也旋转了。

假如先旋转再缩放

Screen_Shot_2021-03-08_at_22.12.21.png

从变换后的坐标可见，Sx 不仅作用于原来的x分量，也作用于原来的 y 分量，Sy 也有类似的情况。同时我们发现，如果 Sx，Sy，Sz 的值一致，那么旋转与缩放的顺序就不再重要，结果都一样。

视图变换矩阵

这个矩阵就是将点从世界坐标系转换到观察（相机）坐标系的矩阵。在上一期我们知道，我们会在世界坐标系中放置一个相机（观察点），并且相机有方向。这就很像我们在模型变换里面将物体放置在世界坐标系中做过的事情。我们先通过平移变换将相机放在某一处，再通过旋转变换将相机朝向某一个方向。设 P1 是顶点在观察坐标系中的坐标，P0 是在世界坐标系的坐标，那么就有： Screen_Shot_2021-03-08_at_19.59.19.png

同时，根据矩阵两条的性质：

矩阵左乘逆矩阵等于单位矩阵
单位矩阵左乘矩阵等于原矩阵

我们很容易就有以下的推导过程： Screen_Shot_2021-03-08_at_20.13.32.png

因此只需要求出相机的平移矩阵以及旋转矩阵的逆矩阵，就能组合起视图变换矩阵，将顶点在世界坐标系中的坐标 P0，转换成在相机坐标系中的坐标 P1。

已知相机的坐标是（ex, ey, ez），那么根据前文的知识，很容易就能得出平移矩阵。而平移矩阵的逆矩阵也很容易就能看出来，这里就不详细推导了。

Screen_Shot_2021-03-08_at_20.25.48.png

下面我们来推导以下旋转矩阵。

首先定义相机坐标系的三个基向量 Ux, Uy, Uz，其中Ux在世界坐标系的三个轴x, y, z的分量分别是：Uxx, Uxy, Uxz。Uy与Uz同理。这样，将一个顶点在相机坐标系中的坐标 P1 转成世界坐标系的坐标P0的变换矩阵 R 就能用Ux，Uy， Uz的分量表示出来：

Screen_Shot_2021-03-08_at_22.20.20.png