一、图形API简介
1.OpenGL(Open Graphics Library)是一个跨编程语言、跨平台的编程图形程序接口。
2.OpenGL ES (OpenGL For Embedded Systems)是OpenGL三维图形API的子集,针对手机、PDA(掌上电脑)和游戏主机等嵌入式设备而设计,去除了许多不必要和性能较低的API接口。
3.Metal:Apple为了解决3D渲染而推出的框架,该技术能够使3D图像提高10倍的渲染性能。
二、图形API能用来干嘛?
可以实现图形的底层渲染。
比如音视频中,对视频解码后的渲染。
比如在地图引擎中,对地图上数据的渲染。
比如在动画中,实现动画的绘制。
比如在视频处理中,对视频添加滤镜效果。
比如在游戏开发中,对游戏场景、游戏人物的渲染。
OpenGL、OpenGLES、Metal在项目中解决问题的本质就是利用GPU芯片对图形图像进行高效的渲染。
因为图形API应用的场景非常之多,所以学习图形API是非常有必要的。接下来就从OpenGL开始学习吧。
OpenGL
由于我对OpenGL一窍不通,所以如何学习是一个关键,先简单捋一下思路。
一、熟悉图形图像API中的专有名词。
二、熟悉图形渲染流程。
三、熟悉图形图像常⽤处理⼿段。
一、熟悉图形图像API中的专有名词
1.OpenGL上下文(context)
· 在应用程序调用任何OpenGL指令之前,首先需要创建一个OpenGL上下文。这个上下文是一个巨大的状态机,保存了OpenGL中的各种状态,这个也是OpenGL指令执行的基础。
· OpenGL的函数不管在哪个语言当中,都是类似C语言一样面向过程的函数,本质上都是对OpenGL上下文这个庞大的状态机中的某个状态或对象进行操作。当然需要把这个对象设置为当前对象。因此通过对OpenGL指令的封装,是可以将OpenGL的相关调用封装成一个面向对象的图形API的。
· 由于OpenGL是一个巨大的状态机,切换上下文会产生大量的开销,但是由于绘制不同的模块,可能需要使用完全独立的管理。因此,可以在应用程序上分别创建多个不同的上下文,在不同线程中使用不同的上下文,上下文之间共享缓冲区、纹理等资源。这样的方案,会比反复切换上下文,或者大量修改渲染状态,更加合理高效。
2.OpenGL状态机
· 状态机是理论上的一种机器,描述了一个对象在生命周期内所经历的各种状态,状态的转变,发生转变的动因,条件及转变中所执行的活动。或者说,状态机是一种行为,说明对象在生命周期中响应事件所经历的状态序列以及对状态事件的响应。因此具备以下特点:
· 有记忆功能,能记住当前的状态。
· 可以接受输入,根据输入的内容和自己的原先状态,修改自己当前状态,并且可以有对应输出。
·当进行特殊状态(停机状态)的时候,变不再接收输入,停止工作。
· 类推到到OpenGL 中来,可以这么理解:
·OpenGL可以记录自己的状态(如是否开启混合功能等)。
·OpenGL可以接受输入(当调用OpenGL函数的时候,可以看成为OpenGL在接收我的输入),如调用glcolor3f,则OpenGL接收到这个输入后会修改自己的“当前颜色”这个状态。
·OpenGL可以进入停止状态,不再接受输入。在程序退出前,OpenGL总会先停止工作的。
3.渲染
· 将图形、图像数据转化为2D空间图形操作叫做渲染(Rendering)。
4.顶点数组(vertexArray)和顶点缓冲区(vertexBuffer)
· 画图一般是先画骨架,在添加颜色。这个对于OpenGL其实也是一样的,顶点数据就相当于骨架,和现实中不同的是,OpenGL中的图像是用图元组成的。在OpenGL中有3种类型的图元,点、线、三角形。那么这些顶点数据是存储在哪里的呢?开发者可以选择设定函数指针,在调用绘制方法的时候,直接由内存传入顶点数据,也就是说这部分数据之前是存在内存当中的,被称为顶点数组。而另一种性能更高的方法就是,提前分配一块显存,将顶点数据预先传入到显存当中。这部分显存,就叫做顶点缓冲区。
· 顶点指的是我们绘制一个图形时,它的顶点位置数据。而这个数据可以直接存储在数组中也可以将其缓存到GPU内存中。
5.着色器程序shader
· 就全面的将固定渲染管线架构变为了可编译渲染管线。因此,OpenGL在实际调用绘制函数之前,需要指定一个由shader编译成的着色器程序。常见的着色器主要有顶点着色器(VertexShader),片段着色器(FragmentShader)/像素着色器(PixelShader),几何着色器(GeometryShader),曲面细分着色器(TessellationShader)。片段着色器和像素着色器只是在OpenGL和DX中叫法不同而已。但是直到OpenGL3.0,依然只支持顶点和片段着色器。
· OpenGL在处理shader时,和其他编译器一样。通过编译、链接等步骤,生成了着色器程序(glProgram),着色器程序同时包含顶点、片段着色器的运算逻辑。在OpenGL进行绘制的时候,首先由顶点着色器传入顶点数据进行运算。再通过图元装配,将顶点转化为图元。然后进行光栅化,将图元这种矢量图形,转化为栅格化数据。最后将栅格化数据传入片段着色器中进行运算。片段着色器会对栅格化数据中的每一个像素进行运算,并决定像素的颜色。
6.管线
· 在OpenGL下渲染图形,就会经历一个又一个的节点,而这样的操作可以理解为管线。管线是一个抽象的概念,之所以称之为管线是因为显卡在处理数据的时候是按照一个固定的顺序进行的,而且严格按照这个顺序。
7.固定管线/存储着色器
· 在早期的OpenGL版本,它封装了很多种着色器程序块,内置了一段包含光照、坐标变换、剪裁等等诸多功能的固定shader程序,来帮助开发者完成图形的渲染。而开发者只需要传入相应的参数,就能快速的完成图形的渲染。但是由于OpenGL的使用场景非常丰富,固定管线或存储着色器无法完成每一个业务。这时将相关部分开放成可编程。
8.顶点着色器(VertexShader)
· 一般用来处理图形的变换(平移、旋转、投影等)。
· 顶点着色器是OpenGL中用于计算顶点属性的程序。顶点着色器是逐顶点运算的程序,也就是每一个顶点数据都要执行一次顶点着色器,当然这是并行的,并且顶点着色器运算的过程中无法访问其他的顶点数据。
· 一般来说典型的需要计算的顶点属性主要包括顶点坐标变化、逐顶点光照运算等等。顶点坐标由自身坐标系转化到归一坐标系的运算,就是在这里进行的。
8.片段着色器(FragmentShader)
· 一般用来处理每个像素点颜色的计算和填充。
· FragmentShader是OpenGL中用来计算片段(像素)的程序。是逐像素运算的程序,每一个像素都会执行一次片段着色器,当然也是并行。
9.GLSL(OpenGL Shading Language)
· GLSL是用来在OpenGL中着色编程的语言,也即开发者写的短小的自定义程序,他们是在图形卡的GPU(Graphic Processor Unit图形处理单元)上执行的,代替了固定的渲染管线的一部分,使渲染管线中的不同层次具有可编程性。比如:视图转化、投影转换等。GLSL的着色器代码分2个部分:顶点、片段着色器。
10.光栅化(Resterization)
· 光栅化就是把顶点数据转化为片元的过程。片元中的每一个元素对应帧缓冲区的一个像素。
· 光栅化其实是一种将几何图形转化为二维图形的过程。该过程包含了俩个部分,第一个部分:决定窗口坐标中的哪些整形栅格区域被基本图元占用。第二个部分:分配一个颜色值和一个深度值到各个区域。光栅化过程产生的就是片元。
· 把物体的数学描述以及与物体相关的颜色信息,转化为屏幕上用于对应位置的像素及用于填充像素的颜色,这个过程称为光栅化,这是一个将模拟信号转化为离散信号的一个过程。
11.纹理
· 纹理可以理解为图片。大家在渲染图形时需要在其编码填充图片,为了使得场景更加逼真。而这里使用的图片就是常说的纹理。
12.混合(Blending)
· 在测试阶段之后,如果像素依然没有剔除,那么像素的颜色将会和帧缓冲区中附着上的颜色进行混合,混合的算法可以通过OpenGL的函数进行指定。但是OpenGL提供的混合算法是有限的,如果需要更加复杂的混合算法,一般可以通过像素着色器进行实现,当然性能会比原生的混合算法差一些。
13.变化矩阵(Transformation)
· 例如图形想发生平移、缩放、旋转变化,就需要使用变化矩阵。
14.投影矩阵(Projection)
· 用于将3D坐标转换为二维屏幕坐标,实际线条也将在二维坐标下进行绘制。
15.渲染上屏/交换缓冲区(SwapBuffer)
· 渲染缓冲区一般映射的是系统的资源比如窗口。如果将图像直接渲染到窗口对应的渲染缓冲区,则可以将图像显示到屏幕上。
· 但是,值得注意的是,如果窗口只有一个渲染缓冲区,那么在绘制的过程中屏幕进行的了刷新,窗口可能显示出不完整的图像。
· 为了解决这个问题,常规的OpenGL程序至少会有2个缓冲区。显示在屏幕上的叫做屏幕缓冲区,另一个叫做离屏缓冲区。在一个缓冲区渲染完成之后,通过将屏幕缓冲区和离屏缓冲区交换,实现图像在屏幕上的显示。
· 由于显示器的刷新一般是逐行进行的,因此为了防止交换缓冲区的时候屏幕上下区域的图像分属于俩个不同的帧(屏幕撕裂),交换一般会等待显示器刷新完成的信号,在显示器俩次刷新的间隔中进行交换,这个信号就叫做垂直同步信号,这个技术被称为垂直同步。
·使用了双缓冲区和垂直同步技术之后,由于总是要等到缓冲区交换之后再进行下一帧的渲染,使得帧率无法完全达到硬件允许的最高水平。为了解决这个问题,引入了三缓冲区技术,在等待垂直同步的时候,来回交替渲染俩个离屏的缓冲区,而垂直同步发生的时候,屏幕缓冲区和最近的离屏缓冲区交换,实现充分利用硬件性能的目的。(但是也无法完全解决卡顿的问题,只是降低发生卡顿的频率)。
16.投影方式
· 正投影:2D,无论观察者离物体多远,物体的大小都是一致的。
· 透视投影:3D,观察者离物体越远,物体越小。
17.视窗坐标
· 视窗坐标也就是我们手机窗口对应的坐标系统,以左上角为原点,右下角对应手机的最大像素的集合,如一个手机像素是320*480,那么他右下角的坐标就是(320,480)。
18.规格化设备坐标
· 是以屏幕中心为原点,X轴朝右,Y轴朝上,所以左下脚的坐标为(-1,-1),右上角坐标为(1,1)。在规格化设备坐标系需要考虑Z轴,需要将一个平面的思维转化为一个立体,原点是(0,0,0),也就是立方体的中心。
19.视觉坐标系
· 视觉坐标系是从我们的眼睛中出发朝我们的手机设备看过去所能看到的,会有一个Z轴的最近距离和最远距离,也就是zNear和zFar。只有在这俩者之间并且也满足x轴和y轴坐标在屏幕当中的做才会显示出来,越远的东西会显示的越小,产生透视的效果。
20.世界坐标系
· 世界坐标就是一个用户构造出来的坐标系,方便描述这个坐标系下各种物体相对于原点的位置。
21.物体坐标系
· 每个物体都有自己独立的坐标系。当物体旋转和移动的时候,这个坐标系也会发生相应的变化。
二、熟悉图形渲染流程
图片出处:腾讯课堂逻辑教育
图片出处:腾讯课堂逻辑教育