1. OpenGL简介
图形API简介
- OpenGL(Open Graphics Library)是跨语言、跨平台的编程图形程序接口,它采用C语言编写,所以可以支持多语言集成;同时,OpenGL仅对GPU进行编程,不支持视图窗口的编写,所以可以在多平台之间通用。它将计算机的资源抽象成一个个OpenGL对象,对这些资源的操作抽象成一个个OpenGL指令
- OpenGL ES(OpenGL for Embedded Systems)是OpenGL三维图形API的子集,针对手机、PDA游戏主机等嵌入式设备而设计,去除了许多不必要和性能低的API接口
- DirectX它并不单纯是图形API,它是Window平台上的多媒体处理API(不支持跨平台)
- MetalApple为游戏开发者推出的新的平台技术,该技术能为3D图像提高10倍的渲染性能。是Apple为解决3D渲染而推出的框架,它可以更强的发挥Apple设备本身的性能。
图形API在项目中解决问题的本质就是利用GPU芯片来高效渲染图形图像。 图形API是开发者唯一接近GPU的方式。
基础知识--OpenGL名词
- 上下文(context)
- 在应用程序调用任何OpenGL指令前,需要先安排创建一个OpenGL的上下文。这个上下文是一个庞大的状态极,保存了OpenGL中的各种状态,这是OpenGL指令执行的基础。
- OpenGL的函数不管在哪个语言中,都是类似C语言一样的面向过程的函数,本质上都是对OpenGL上下文这个状态机中的某个状态或对象进行操作。当然你要首先吧把这个对象设置为当前对象,因此,通过OpenGL指令的封装,是可以将OpenGL的相关调用封装成为一个面向对象的图形API的
- 由于OpenGL上下文是一个巨大的状态机,切换上下文往往会产生较大的开销,但是不同的绘制模块,可能需要使用完全独立的状态管理。因此可以在应用程序中分别创建多个不同的上下文,在不同线程中使用不同的上下文,上下文之间共享纹理、缓冲区等资源。这样的方案,会比反复切换上下文,或者大量修改渲染状态,更加合理高效。
- 状态机
状态机是理论上的一种机器。这个比较难以理解,大致可以描述为:状态机描述了一个对象在其生命周期内所经历的各种状态,状态间的转变,发生转变的动因,条件及转变中所执行的活动。或者说,状态机是一种行为,说明对象在其生命周期中响应事件所经历的状态序列以及对那些状态事件的响应。因此具有以下特点:
- 有记忆功能,能记住当前的状态
- 可以接收输入,根据输入的内容和自己的原先状态,修改自己当前状态,并且可以有对应输出
- 当进入特殊状态(停机状态)的时候,便不再接收输入,停止工作
- OpenGL状态机
把状态机类推到OpenGL中来,可以这么理解:
- OpenGL可以记录自己的状态(如当前所使用的颜色、是否开启了混合功能等)
- OpenGL可以接收输入(当调用OpenGL函数的时候,可以看作OpenGL在接收我们的输入),如调用glColor3f,则OpenGL接收到这个输入后会修改自己的“当前颜色”这个状态
- OpenGL可以进入停止状态,不再接收输入。在程序退出前,OpenGL总会先停止工作的
- 渲染(Rendering)将图形/图像数据转换成3D空间图像操作叫做渲染
- 顶点数组(VertexArray)和顶点缓冲区(VertexBuffer)
- 画图一般是先画好图像的骨架,然后再往骨架里面填充颜色,这对于OpenGL也是一样的。顶点数据就是要画的图像的骨架,和现实中不同的是,OpenGL中的图像都是由图元组成。在OpenGL ES中,有3中类型的图元:点、线、三角形。那这些顶点数据最终是存储在哪里的呢?开发者可以选择设定函数指针,在调用绘制方法的时候,直接由内存传入顶点数据,也就是说这部分数据之前是存储在内存中的,被称为顶点数组。而性能更高的做法是,提前分配一块显存,将顶点数据预先传入到显存当中,这部分的显存,就称为顶点缓冲区。
- 顶点指的是我们在绘制一个图形时,他的顶点位置数据。而这个数据可以直接存储在数组中或者将其缓存到GPU内存中。
- 管线在OpenGL下渲染图形,就会有经历一个个节点,而这样的操作可以理解为管线。可以按流水线理解,每个任务类似流水线般执行。任务之间有先后顺序,管线是一个抽象的概念,之所以称之为管线是因为显卡在处理数据的时候是按照一个固定的顺序来的,而且严格按照这个顺序。就像水从一根管子的一端流到另一端,这个顺序是不能打破的
- 固定管线/存储着色器在早期OpenGL版本中,它封装了很多着色器程序块内置的一段包含了光照、坐标变换、裁剪等诸多功能的固定shader程序来完成。由于OpenGL的使用场景愈来愈复杂,固定管线或存储着色器已经无法满足需求,于是OpenGL开放了一部分功能的配置权限,就产生了可编程渲染管线
- 着色器程序Shader在可编程渲染管线中,实际调用绘制函数之前,还要指定一个有shader编译成的着色器程序。常见的着色器主要有:
- 顶点着色器(VertexShader)
- 片元着色器(FragmShader),也称为片段着色器、像素着色器
- 几何着色器(GeometryShader)
- 曲面细分着色器(TessellationShader)
- 顶点着色器(VertexShader)
- 一般用来处理图形每个顶点变换(旋转/平移/投影等)
- 顶点着色器是OpenGL中用于计算顶点属性的程序。顶点着色器是逐顶点运算的程序,也就是说每个顶点数据都会执行一次顶点着色器,当然这是并行的,并且顶点着色器运算过程中无法访问其他顶点的数据
- 一般来说典型的需要计算的顶点属性主要包括顶点坐标变换、逐顶点光照运算等。顶点坐标由自身坐标系转换到归一化坐标系的运算,就是在这里发生的。
- 片元着色器程序(FragmentShader)
- 一般用来处理图形中每个像素点颜色的计算和填充
- 片元着色器是OpenGL中用于计算片元(像素)颜色的程序。片元着色器是逐像素运算的程序,也就是说每个像素都会执行一次片元着色器,当然这肯定也是并行的
- GLSL(OpenGL Shading Language) OpenGL着色器语言(GLSL)是用来在OpenGL中着色器编程的语言,也即开发者编写的短小的自定义程序,他们在图形卡的GPU(Graphic Processor Unit图形处理单元)上执行的,代替了固定的渲染管线的一部分,使渲染管线中不同层次具有可编程性。比如:视图转换、投影转换等。GLSL的着色器代码可分为2个部分:Vertex Shader(顶点着色器)和Fragment Shader(片元着色器)
- 光栅化Rasterization
- 把顶点数据转换为片元的过程,具有将图转化为一个个栅格组成的图像的作用,特点是每个元素对应帧缓冲区中的一个像素
- 光栅格化就是把顶点数据转换为片元的过程。片元中的每个元素对应帧缓冲区中的一个像素
- 光栅化其实是一种将几何图元变为二维图像的过程。该过程包含了两部分工作。第一部分工作:决定窗口坐标中的哪些整型栅格区域被基本图元占用;第二部分:分配一个颜色值和一个深度值到各个区域。光栅化产生的是片元
- 把物体的数学描述以及与物体相关的颜色信息转换为屏幕上用于对应位置的像素及用于填充像素的颜色,这个过程称为光栅化,这是一个将模拟信号转化为离散信号的过程
- 纹理纹理可以理解为图片,在渲染图形时需要在其编码填充图片,为了使得场景更加逼真,而这里使用的图片,就是常说的纹理。在OpenGL中我们更加习惯叫纹理,而不是图片。
- 混合(Blending) 在测试阶段之后,如果像素依然没有被剔除,那么像素的颜色将会和帧缓冲区中颜色附着上的颜色进行混合,混合的算法可以通过OpenGL的函数进行指定。但是OpenGL提供的混合算法是有限的,如果需要更加复杂的混合算法,一般可以通过片元着色器进行实现,当然性能会比原生的混合算法差一些。
- 变换矩阵(Transformation) 例如图形想发生平移,缩放,旋转变换,就需要使用变换矩阵
- 投影矩阵(Projection) 用于将3D坐标转换为二维屏幕坐标,实际线条也将在二维坐标下绘制
- 渲染上屏/交换缓冲区(SwapBuffer)
- 渲染缓冲区一般映射的是系统的资源比如窗口。如果将图像直接渲染到窗口对应的渲染缓冲区,则可以将图像显示到屏幕上。
- 但是,值得注意的是,如果每个窗口只有一个缓冲区,那么在绘制过程中屏幕进行了刷新,窗口可能显示出不完整的图像
- 为了解决这个问题,常规的OpenGL程序至少都有两个缓冲区。显示在屏幕上的称为屏幕缓冲区,没有显示的称为离屏缓冲区。在一个缓冲区渲染完成后,通过将屏幕缓冲区和离屏缓冲区交换,实现图像在屏幕上的显示
- 由于显示器的刷新一般是逐行进行的,因此为了防止交换缓冲区的时候屏幕上下区域的图像分属于两个不同的帧,因此交换一般会等待显示器刷新完成的信号,在显示器两次刷新的间隔中进行交换,这个信号就被称为垂直同步信号,这个技术被称为垂直同步
- 使用了双缓冲区和垂直同步技术后,由于总是要等待缓冲区交换后再进行下一帧的渲染,使得帧率无法完全达到硬件允许的最高水平。为了解决这个问题,引入了三缓存区技术,在等待垂直同步时,来回交替渲染两个离屏的缓冲区,而垂直同步发生时,屏幕缓冲区和最近渲染完成的离屏缓冲区交换,实现充分利用硬件性能的目的
- 正投影&透视投影正投影类似正视图,没有进大远小的透视效果
OpenGL 坐标系
- 世界坐标系 坐标系统主要用于计算机图形场景中的所有图形对象的空间定位和定义
- 局部坐标系 独立于世界坐标系来定义物体的几何特性
- 观察坐标系 观察坐标系通常是以视点的位置为原点,通过用户指定的一个观察向量来定义整个坐标系统。观察坐标系主要用于从观察者的角度对整个世界坐标系的对象进行重新定位和描述,从而简化几何物体在投影面成像的数学推导和计算
- 投影坐标系 物体从世界坐标描述转换到观察坐标系后,可将三维物体投影到二维表面,即投影到虚拟摄像机的胶片上,这个过程就是投影变换。以胶片中心为参考原点的空间坐标系称为投影坐标系,物体在投影坐标系中的坐标称为投影坐标
- 设备坐标系 是图形设备上采用的与具体设备相关的坐标系。设备坐标系一般采用整数坐标,其坐标范围由具体设备的分辨率决定。设备坐标系上的一个点一般对应图形设备上的一个像素,由于具体设备的限制,设备坐标系的坐标范围一般是有限的。
- 规格化设备坐标系 是为了避免设备相关性而定义的一种虚拟的设备坐标系。规格化坐标系的坐标范围一般从0到1,也有的是从-1到+1.采用规格化设备坐标系的好处是屏蔽了具体设备的分辨率,使得图形处理能够尽量避开具体设备坐标的考虑。实际图形处理时,先将世界坐标转换成为对应的规格化设备坐标,然后再将规格化设备坐标映射到具体的设备坐标上去
- 屏幕坐标系统 也称设备坐标系统,它主要用于某一特殊的计算机图形显示设备(如,光栅显示器)的表面的点的定义,在多数情况下,对于每个具体的显示设备,都有一个单独的坐标系统,在定义了成像窗口的情况下,可进一步在屏幕坐标系统中定义称为视图区(view port)的有界区域,视图区中的成像即位实际所观察到的。
OpenGL 坐标变换
物体坐标/对象坐标(Object Space)
-[模型变换(Modeling transformation)]->
世界坐标(World Space)
-[视变换(Viewing transformation)]->
观察者坐标/摄像机坐标(Eye Space)
-[投影变换(Projection transformation)]->
裁剪坐标(Clip Space)
-[透视除法(Perspective divide)]->
规范化设备坐标(NDC Space)
-[视口变换(ViewPort mapping)]->
屏幕坐标(Screen space)
物体/世界/摄像机坐标系都是右手系,规范化设备坐标系是左手系
这个过程中用户可以自定义的是:
Attribute -> Vertex -> Model Space -> Word Space -> Camera Space -> Clip Space;这个过程包括模型变换、视变换、投影变换,这些变换可以由用户根据需要自行指定,这些内容在顶点着色器中完成
OpenGL处理(不支持自定义的):Clipping -> NDS Space -> Window Space -> Render,包括透视除法、视口变换,这两个步骤是OpenGL自动执行的,在顶点着色器处理后的阶段完成
从物体坐标系转换到世界坐标系时,会使用一个中间坐标系惯性坐标系。惯性坐标系,原点与物体坐标系相同,坐标轴与世界坐标系平行。由此,物体坐标系经过旋转到惯性坐标系,然后惯性坐标系经平移到世界坐标系 OpenGL希望每次顶点着色后,我们的可见顶点都为标准化设备坐标(Normalized Device Coordinate,NDC)。也就是说每个顶点的x,y,z都应该在-1到1之间,超出这个范围的顶点将是不可见的。
着色器的渲染流程
- 顶点数据
- 顶点着色器:必要,接收顶点数据,单独处理每个顶点
- 细分着色器:可选,描述物体的形状,在管线中生成新的几何体处理(平顺)模型生成最终状态。对所有的图像进行修改几何图元类型或者放弃所有的凸缘
- 几何着色器
- 图元装配
- 剪切:剪切视口之外的绘制
- 光栅化:输入图元的数学的数学描述,转化为与屏幕对应的位置像素片元
- 片元着色器:必要,片元颜色以及深度值,然后传递到片元测试和混合模块
- 渲染效果