1、图形 API 介绍
1.1 图形 API 的类型
-
OpenGL(Open Graphics Library)是一个跨编程语言、跨平台的编程图形程序接口,它将计算机的资源抽象称为一个OpenGL的对象,对这些资源的操作抽象为一个个的OpenGL指令。 -
OpenGL ES (OpenGL for Embedded Systems)是OpenGL三维图形 API 的子集,针对手机、Pad 和游戏主机等嵌入式设备而设计,去除了许多不必要和性能较低的 API 的接口。 -
DirectX是有很多 API 组成的,DirectX并不是一个单纯的图形 API,最重要的是DirectX是属于 Windows 上一个多媒体处理框架,并不支持 Windows 以外的平台,所以不是跨平台框架,按照性质分类,可以分为四大部分:显示部分、声音部分、输入部分和网络部分。 -
Metal是 Apple 为游戏开发者推出了新的平台技术,能够为 3D 图像提高 10 倍的渲染性能,是 Apple 为了解决 3D 渲染推出的框架。
1.2 图形 API 常用场景
图形 API 解决问题的本质是利用 GPU 芯片来高效渲染图形图像,常用场景如下:
-
游戏开发中,游戏场景/游戏人物的渲染;
-
音视频开发中,视频解码后的数据渲染(ijkplayer ,kxmovie);
-
地图引擎中,地图上数据渲染;
-
动画中,实时动画的绘制(旋转、移动、缩放等);
-
视频处理中,视频加上滤镜效果;
2、OpenGL 状态机
状态机是一种理论上的机器,可以理解为描述一个对象在生命周期内所经历的各种状态,状态间的转变,发生转变的动因及转变中执行的活动,具有以下特点:
-
具有记忆功能,可以记住当前的状态;
-
可以接收输入,根据输入的内容和自己的原先状态,修改自己当前状态,并且可以有对应输出;
-
当进入特殊状态,如停机状态时,不再接收输入,就会停止工作;
3、OpenGL 上下文(Context)
在应⽤程序调⽤任何 OpenGL 的指令之前,需要安排首先创建⼀个 OpenGL 的上下文。这个上下⽂是一个非常庞大的状态机,保存了 OpenGL 中的各种状态,这也是 OpenGL 指令执行的基础。
OpenGL 的函数不管在哪个语言中,都是类似C语⾔一样的面向过程的函数,本质上都是对 OpenGL 上下文这个庞大的状态机中的某个状态或者对象进行操作,当然你得⾸先把这个对象设置为当前对象。因此,通过对 OpenGL 指令的封装,是可以将OpenGL的相关调⽤封装成为一个⾯向对象的图形 API 的。
由于 OpenGL 上下文是⼀个巨⼤的状态机,切换下文往往会产生较⼤的开销,但是不同的绘制模块,可能需要使用完全独⽴的状态管理。因此可以在应⽤程序中分别创建多个不同的上下文,在不同线程中使用不同的上下文,上下文之间共享纹理、缓冲区等资源。这样的方案,会⽐反复切换 上下⽂,或者⼤量修改渲染状态,更加合理⾼效的。
4、渲染(Rendering)
将图形/图像数据转换成 2D 空间图像操作叫做渲染。
5、顶点数组和顶点缓冲区
顶点是指绘制图形时它的顶点位置数据,顶点数据就是要画的图像的骨架,这个数据可以直接存储在数组中或者将其缓存到 GPU 内存中,和现实中不同的 是,OpenGL中的图像都是由图元组成。在 OpenGL ES 中,有3种类型的图 元:点、线、三角形。
-
顶点数组(VertexArray):传入顶点数据,这部分顶点数据之前是被存储在内存中,被称为顶点数组;
-
顶点缓冲区(VerterBuffer):预先存入到显存中,这部分显存被称为顶点缓冲区,相比顶点数组性能更高;
6、管线
OpenGL 渲染图形,会经历一个个节点,这样的操作可以理解成管线,类似于流水线,每个任务类似流水线般执行。管线是一个抽象的概念,之所以称为管线是因为显卡在处理数据的时候是按照一个固定的顺序来的,并且严格按照这个顺序。
6.1 固定管线/存储着色器
在早期的OpenGL版本,它封装了很多种着⾊器程序块,内置的一段包含了光 照、坐标变换、裁剪等诸多功能的固定 shader 程序来完成帮助开发者来完成图形的渲染. 而开发者只需要传入相应的参数,就能快速完成图形的渲染. 类似于 iOS 开发会封装很多 API,而我们只需要调⽤就可以实现功能,不需要关注底层实现原理。
6.2 可编程管线
由于OpenGL的使⽤场景非常丰富,固定管线或存储着⾊器无法完成每一个业务,这时将相关部分开放成可编程,允许自定义着色器。
7、着色器(shader)
OpenGL 在实际调用绘制函数之前,还需要指定一个由 shader 编译成的着色器程序。常见的着⾊器主要有顶点着色器(VertexShader),⽚段着色器(FragmentShader)/像素着⾊器(PixelShader),⼏何着色器(GeometryShader),曲⾯细分着色器(TessellationShader)。⽚段着色器和像素着色器只是在 OpenGL 和 DX 中的不同叫法而已。可惜的是直到 OpenGLES 3.0 依然只支持了顶点着色器和片段着色器这两个最基础的着⾊器,着色器其实可以理解成一段代码,用来操作 GPU。
7.1 顶点着色器(Vertex Shader)
顶点着色器是 OpenGL 中⽤于计算顶点属性的程序。顶点着色器是逐顶点运算的程序,也就是说每个顶点数据都会执行一次顶点着色器,当然这是并⾏的,并且顶点着色器运算过程中⽆法访问其他顶点的数据。一般用来处理图形中每个顶点的变换(旋转/平移/投影等)。
7.2 片元着色器/片段着色器/像素着色器(Fragment Shader)
片段着色器是 OpenGL 中⽤于计算片段(像素)颜色的程序。片段着色器是 逐像素运算的程序,也就是说每个像素都会执⾏⼀次片段着色器,当然也是并行的,一般用来处理图形中每个像素点颜色计算和填充。
8、GLSL(OpenGL Shading Language)
OpenGL 着色语⾔(OpenGL Shading Language)是用来在 OpenGL 中着色编程的语言,也即开发⼈员写的短小的自定义程序,他们是在图形卡的 GPU(Graphic Processor Unit图形处理理单元)上执行的,代替了固定的渲染管线的一部分,使渲染管线中不同层次具有可编程性。比如:视图转换、投影转换等。GLSL(GL Shading Language)的着色器代码分成2个部分: Vertex Shader(顶点着⾊器)和 Fragment Shader(⽚元着色器)。
9、光栅化(Rasterization)
是把顶点数据转换为片元的过程,具有将图转化为一个个栅格组成的图象的作用,特点是每个元素对应帧缓冲区中的一像素。
光栅化其实是一种将几何图元变为二维图像的过程。该过程包含了两部分 的工作。第一部分工作:决定窗口坐标中的哪些整型栅格区域被基本图元 占⽤;第二部分工作:分配一个颜色值和一个深度值到各个区域。光栅化 过程产生的是片元。
把物体的数学描述以及与物体相关的颜色信息转换为屏幕上用于对应位置 的像素及用于填充像素的颜色,这个过程称为光栅化,这是⼀个将模拟信 号转化为离散信号的过程。
10、纹理(Texture)
纹理可以理解为图片。⼤家在渲染图形时需要在其编码填充图⽚,为了使得场景更加逼真。而这里使用的图片,就是常说的纹理。但是在 OpenGL 我们更加习惯叫纹理而不是图片。
11、混合(Blending)
混合是将一种颜色与另一种颜色组合以获得第三种颜色的行为。在测试阶段之后,如果像素依然没有被剔除,那么像素的颜色将会和帧缓 冲区中颜色附着上的颜色进行混合,混合的算法可以通过 OpenGL 的函数进 ⾏指定。但是 OpenGL 提供的混合算法是有限的,如果需要更加复杂的混合算法,⼀般可以通过像素着色器进行实现,当然性能会比原生的混合算法差⼀些。
12、变换矩阵(Transformation)
图形想发生平移,缩放,旋转变换,就需要使⽤变换矩阵。
13、投影矩阵(Projection)
用于将 3D 坐标转换为二维屏幕坐标,实际线条也将在二维坐标下进行绘制。
OpenGL 中投影有两种方式:
- 正投影:也称作平行投影,图片不管远近,按照1:1的比例绘制,显示 2D 效果;
- 透视投影:根据物体远近的不同,按照远大近小的规则进行绘制,显示 3D 效果;
14、渲染上屏/交换缓冲区
渲染缓冲区一般映射的是系统的资源比如窗口。如果将图像直接渲染到窗口对应的渲染缓冲区,则可以将图像显示到屏幕上。但是值得注意的是,如果每个窗口只有一个缓冲区,那么在绘制过程中屏幕进行了刷新,窗⼝可能显示出不完整的图像,为了解决这个问题,使用了双缓冲区和垂直同步技术。
-
双缓冲区:常规的
OpenGL程序⾄少都会有两个缓冲区。显示在屏幕上的称为屏幕缓冲区,没有显示的称为离屏缓冲区。在一个缓冲区渲染完成之后,通过将屏幕缓冲区和离屏缓冲区交换,实现图像在屏幕上的显示。 -
垂直同步技术:由于显示器的刷新一般是逐行进⾏的,因此为了防⽌交换缓冲区的时候屏幕上下区域的图像分属于两个不同的帧,因此交换一般会等待显示器刷新完成的信号,在显示器两次刷新的间隔中进行交换,这个信号就被称为
垂直同步信号,这个技术被称为垂直同步技术。
使⽤了双缓冲区和垂直同步技术之后,由于总是要等待缓冲区交换之后再进行下一帧的渲染,使得帧率⽆法完全达到硬件允许的最⾼⽔平。为了解决这个问题,引入了三缓冲区技术。
- 三缓冲区技术:在等待垂直同步时,来回
交替渲染两个离屏的缓冲区,⽽垂直同步发生时,屏幕缓冲区和最近渲染完成的离屏缓冲区交换,实现充分利⽤硬件性能的目的。