补充知识

众所周知(): Rθ=[cosθ,sinθsinθ,cosθ]R_{\theta} = \begin{bmatrix} cos\theta , -sin\theta \\ sin\theta , cos\theta \end{bmatrix}
那问题来了,那我问你,那我问你!如果我要反着转呢?顺时针旋转 θ\theta 角,怎么表示?
嗯?回答我!!
那是不是可以表示为 Rθ=[cosθ,sinθsinθ,cosθ]R_{-\theta} = \begin{bmatrix} cos\theta , sin\theta \\ -sin\theta , cos\theta \end{bmatrix}
嗯?你回答我,是不是可以把 θ-\theta 进去!
那是不是也可以看出来:Rθ=[cosθ,sinθsinθ,cosθ]=RθTR_{-\theta} = \begin{bmatrix} cos\theta , sin\theta \\ -sin\theta , cos\theta \end{bmatrix} = R_{\theta}^T
一个矩阵的逆等于这个矩阵的转置矩阵,那这是什么?
正交矩阵啦!

小小深入一下三维变换

其实都跟二维差不多

缩放变换(Scaling)和平移变换(Translation)

不多说,自己看

旋转变换(Rotation)

简单旋转

三维的旋转三个轴,先看图

观察发现,绕X轴旋转 Rx(α)R_x(\alpha) ,绕Y轴旋转 Ry(α)R_y(\alpha) ,绕Z轴旋转 Rz(α)R_z(\alpha) ,在各自的旋转矩阵中,都是不动的
比如绕X轴旋转 Rx(α)R_x(\alpha),第一行第一列是1,其余是0;
绕Y轴旋转 Ry(α)R_y(\alpha),第二行第二列是1,其余是0;
同理,绕Z轴旋转 Rz(α)R_z(\alpha),第三行第三列是1,其余是0.
但是我们又仔细看,发现Y轴旋转有些不一样,他的-sin α\alpha 跑到左下角了,这是为什么捏?
首先回忆之前的三维坐标系的定义,
x×y=z\overrightarrow{x} \times \overrightarrow{y} = \overrightarrow{z}
y×z=x\overrightarrow{y} \times \overrightarrow{z} = \overrightarrow{x}
z×x=y\overrightarrow{z} \times \overrightarrow{x} = \overrightarrow{y}
这里就是循环对称的性质(注意:是叉乘哦)
什么?还不懂?自己拿上面的定义公式和右手定则自己去玩一下就知道了

复杂旋转

更多时候,我们不只旋转了一次,不只绕一个轴旋转,那么一样,拆解变换
例如飞机,有三个轴可以旋转,如图

那么在图形学中,有专门的旋转拆解公式

罗德里格斯旋转公式

针对在三维空间中的任意旋转轴的变换,需要用到罗德里格斯旋转公式。

上图部分解释:I是单位矩阵,n表示旋转轴向量
好,看起来好复杂,看不懂思密达。那么我们就来推导一下吧
假设 a\overrightarrow{a} 是旋转轴,要把 s\overrightarrow{s} 绕a旋转 α\alphaas不一定垂直),操作如下:

  1. s\overrightarrow{s} 的分解:分解为垂直a的向量和平行与a的向量(s//\overrightarrow{s}_{//}
  2. 向量矩阵化处理:得到的 s//=a(sa)\overrightarrow{s}_{//} = \overrightarrow{a}(\overrightarrow{s}·\overrightarrow{a}) 矩阵化变成 aaTsa^T\overrightarrow{s}
  3. 垂直分解向量旋转:将分解的垂直向量就可以按照向量的点乘与叉乘在垂直于旋转轴的方向进行旋转。
  4. 垂直旋转向量与平行分解向量再次合并,完成旋转
    没关系,还有视频讲解(up不是我,点图片跳转):
    查看讲解

Viewing transformation

视图/相机变换(View/Camera Transformation)

定义相机(Define the camera)

初始定义

  • 位置Position e\overrightarrow{e}
  • 镜头朝向Look-at/gaze-direction g\overrightarrow{g}
  • 向上方向 Up direction t\overrightarrow{t}

相机变换

我们都知道相对运动吧,相机动物体不动和物体动相机不动可以展现出相同的画面。
在图形学,我们经常定义相机位置在原点,而且朝向-z轴,初始向上方向为+y轴,可以让操作简化,有很多好处,也有坏处,后面再说

那么我们如何将一个相机放到原点并旋转至我们想要的位置呢?
利用之前所学,我们知道整个操作 Mview=RviewTviewM_{view} = R_{view}T_{view} ,先平移再旋转
假设相机在e点,朝向为 g\overrightarrow{g},向上方向为 t\overrightarrow{t}
那么我们需要的操作是:

  1. 从e点平移回原点,这个很简单

Tview=[0,0,0,xe0,0,0,ye0,0,0,ze0,0,0,1]T_{view} = \begin{bmatrix} 0 , 0 , 0 , -x_e \\ 0 , 0 , 0 , -y_e \\ 0 , 0 , 0 , -z_e \\ 0 , 0 , 0 , 1 \end{bmatrix}

  1. 将朝向 g\overrightarrow{g} 变为-z(g to -z),将向上方向 t\overrightarrow{t} 变为y(t to y),(g x t)变为x
    但是问题来了,将一个向量变成标准的100,010,001这种xyz的向量的时候,是比较麻烦的。那么我们就逆向变换,将xyz这类标准的向量转到我们相机各对应的向量上。
    那就是用到逆矩阵,我们本来的旋转是 MviewM_{view},那逆矩阵就是 Mview1M_{view}^{-1},[ x to (g x t) , y to t , z to -g ]

Mview1=[xg×t,xt,xg,0yg×t,yt,xg,0zg×t,zt,xg,00,0,0,1]M_{view}^{-1} = \begin{bmatrix} x_{g \times t} , x_t , x_{-g} , 0 \\ y_{g \times t} , y_t , x_{-g} , 0 \\ z_{g \times t} , z_t , x_{-g} , 0 \\ 0 , 0 , 0 , 1 \end{bmatrix}

我们之前也学了,旋转矩阵其实是正交矩阵,那么它的逆矩阵就等于他的转置矩阵,所以我们只需要把上面的逆矩阵转置一下,就直接可以得到我们想要的旋转矩阵!

MviewT=Rview=[xg×t,yg×t,zg×t,0xt,yt,zt,0xg,yg,xg,00,0,0,1]M_{view}^T = R_{view} = \begin{bmatrix} x_{g \times t} , y_{g \times t} , z_{g \times t} , 0 \\ x_t , y_t , z_t , 0 \\ x_{-g} , y_{-g} , x_{-g} , 0 \\ 0 , 0 , 0 , 1 \end{bmatrix}

投影变换(Projection transformation)(难点)

总概

投影方式分为两种:

  • 正交投影(Orthographic projection)
  • 透视投影(Perspective projecttion)

正交与透视二者区别

视觉效果

正交并不会带来一种现象:近大远小,更多出现在工程制图。人眼更接近的是右侧的透视投影,会有这个现象。
(当然,如果你跟我一样学过素描,那就很好理解了)
图形学里的数学做法

左侧的透视投影,我们认为相机在空间的某一点,由此在空间方向上延伸出一个四棱锥,把从一个深度区域到另一个深度的这一块区域里的东西显示出来,在四棱锥近处的一个平面屏幕上得到所照的图像。
右侧的正交投影,我们可以认为把相机放在无限远的地方,近处平面与远处平面就几乎完全相同。

正交投影(Orthographic projection)

A simple way*

  • 首先,正常相机放在原点,朝向-z方向,向上方向为y方向。
  • 丢去z轴,这样所有东西都直接得到在成像平面上的样子
  • 在移动到 [1,1]2[-1,1]^2 的矩形上

图形学正式的做法

  • 定义立方体:[ l , r ] x [ b , t ] x [ f , n ]
  • 移动立方体
  • 缩放变成正则立方体 [1,1]3[-1,1]^3(就是立方体在三个轴的坐标都是[-1,1]上,也就是边长为2)
    对于上面的定义立方体,其实就是(left,right)(x),(bottom,top)(y),far,near(z)。
    但是我们发现是[ f , n ],far远处坐标比近处near要小,这是定义过程。
    我们认定是右手系,也就是x x y = z。
    也有别的,比如在OpenGl里面默认采用的左手系,那么fn就是反着的。

具体的矩阵运算操作
先平移:

Tortho=[1,0,0,r+l20,1,0,t+b20,0,1,n+f20,0,0,1]T_{ortho} = \begin{bmatrix} 1 , 0 , 0 , -\frac{r + l}{2} \\ 0 , 1 , 0 , -\frac{t + b}{2} \\ 0 , 0 , 1 , -\frac{n + f}{2} \\ 0 , 0 , 0 , 1 \end{bmatrix}

后缩放

Sortho=[2rl,0,0,00,2tb,0,00,0,2nf,00,0,0,1]S_{ortho} = \begin{bmatrix} \frac{2}{r-l} , 0 , 0 , 0 \\ 0 , \frac{2}{t-b} , 0 , 0 \\ 0 , 0 , \frac{2}{n-f} , 0 \\ 0 , 0 , 0 , 1 \end{bmatrix}

最终结果:

Mortho=SorthoTortho=[2rl,0,0,00,2tb,0,00,0,2nf,00,0,0,1][1,0,0,r+l20,1,0,t+b20,0,1,n+f20,0,0,1]M_{ortho} = S_{ortho} T_{ortho} = \begin{bmatrix} \frac{2}{r-l} , 0 , 0 , 0 \\ 0 , \frac{2}{t-b} , 0 , 0 \\ 0 , 0 , \frac{2}{n-f} , 0 \\ 0 , 0 , 0 , 1 \end{bmatrix} \begin{bmatrix} 1 , 0 , 0 , -\frac{r + l}{2} \\ 0 , 1 , 0 , -\frac{t + b}{2} \\ 0 , 0 , 1 , -\frac{n + f}{2} \\ 0 , 0 , 0 , 1 \end{bmatrix}

透视投影(Perspective projecttion)

小知识回顾

  • 在三维中,可以定义一个点是(x,y,z,1),(kx,ky,kz,k!=0),那么是不是也可表示为(zx,zy,z2z^2,z!=0)。他们都表示同一个点(x,y,z)

原理讲述

看上面的图,
透视投影的过程:

  • 将透视投影转变到正交投影,也就是 Mpersp>orthoM_{persp->ortho}
  • 再正常做一次正交投影 MorthoM_{ortho}
    图中,左侧是透视投影的样子,右侧则是正交投影的样子,那么如何从左侧变成右侧是一个重点。
    我们只需要对着far(f)面进行挤压,将f面挤压至和n面相同时,就可以在n上做f的正交投影了
    下面开始示例推导:

从侧面开始看,那么我们所需观测的就是(x’,y’,z’)到(x,y,z)这一区间,问题是将(x,y,z)挤压。
先从显而易见的下手,可以得出 y=nzyy' = \frac{n}{z}y
那么就可以类似的推导出 x=nzxx' = \frac{n}{z}x

其实通过以上推导就可以得出 Mpersp>orthoM_{persp->ortho} 这个矩阵的一个大致内容

现在的问题是得出第三行的内容。这个时候我们需要观察
注意到(注意力惊人(bushi)):

  • near面上的点没用动
  • far面上的点的z没有动
    然后是根据我们上面的知识小回顾可以知道的:
    将z用n去替换

(nxnyunknowz)>(xyn1)=(nxnyn2n)\begin{pmatrix} nx \\ ny \\ unknow \\ z \end{pmatrix} --> \begin{pmatrix} x \\ y \\ n \\ 1 \end{pmatrix} = \begin{pmatrix} nx \\ ny \\ n^2 \\ n \end{pmatrix}

那么其实可以知道矩阵第三行其实就是(0,0,A,B)的一种形式

(00AB)(xyn1)=n2(0 0 A B) \begin{pmatrix} x \\ y \\ n \\ 1 \end{pmatrix} = n^2

再根据上面注意到的内容,就可以得出:
An + B = n2n^2
Af + B = f2f^2
解方程==>
A = n + f
B = -nf
最后可以得到投影变换到正交的变换 Mpersp>orthoM_{persp->ortho}

Mpersp>ortho=[n,0,0,00,n,0,00,0,n+f,nf0,0,1,0]M_{persp->ortho} = \begin{bmatrix} n , 0 , 0 , 0 \\ 0 , n , 0 , 0 \\ 0 , 0 , n+f , -nf \\ 0 , 0 , 1 , 0 \end{bmatrix}

然后最终的投影变换 Mpersp=MorthoMpersp>orthoM_{persp} = M_{ortho} M_{persp->ortho}

Mpersp=MorthoMpersp>ortho=[2rl,0,0,r+l20,2tb,0,t+b20,0,2nf,n+f20,0,0,1][n,0,0,00,n,0,00,0,n+f,nf0,0,1,0]M_{persp} = M_{ortho} M_{persp->ortho} = \begin{bmatrix} \frac{2}{r-l} , 0 , 0 , -\frac{r + l}{2} \\ 0 , \frac{2}{t-b} , 0 , -\frac{t + b}{2} \\ 0 , 0 , \frac{2}{n-f} , -\frac{n + f}{2} \\ 0 , 0 , 0 , 1 \end{bmatrix} \begin{bmatrix} n , 0 , 0 , 0 \\ 0 , n , 0 , 0 \\ 0 , 0 , n+f , -nf \\ 0 , 0 , 1 , 0 \end{bmatrix}

结束!

变换到此暂时结束的寄语

整体难度还行,认真推导的话会发现很简单,这也只是皮毛,后面还会深入
成为计算机图形大师!

关注Arisu喵!关注Arisu谢谢喵!