界面卡顿

图像显示过程

通常来说，计算机中的显示过程是如下图所示：通过上图可知，显示过程是通过CPU、GPU、显示器协调工作来将图片显示到屏幕上。具体分以下几步：

1.CPU计算好显示内容，提交至GPU
2.GPU经过渲染完成后将渲染的结果放入FrameBuffer（帧缓存区）
3.随后视频控制器会按照VSync信号逐行读取FrameBuffer的数据
4.经过数模转换传递给显示器进行显示

iOS双缓冲机制+VSync

刚开始，FrameBuffer只有一个，这种情况下FrameBuffer的读取和刷新有很大的效率问题，为了解决这个问题，引入了双缓存区。即双缓冲机制。在这种情况下，GPU会预先渲染好一帧放入FrameBuffer，让视频控制器读取，当下一帧渲染好后，GPU会直接将视频控制器的指针指向第二个FrameBuffer。
双缓存机制虽然解决了效率问题，但是随之而言的是新的问题，当视频控制器还未读取完成时，例如屏幕内容刚显示一半，GPU将新的一帧内容提交到FrameBuffer，并将两个FrameBuffer而进行交换后，视频控制器就会将新的一帧数据的下半段显示到屏幕上，造成屏幕撕裂现象，（安卓手机会出现这样的问题，后续的安卓系统推出三缓存机制）
为了解决这个问题，采用了垂直同步信号机制。当开启垂直同步后，GPU会等待显示器的VSync信号发出后，才进行新的一帧渲染和FrameBuffer更新。而目前iOS设备中采用的正是双缓存区+VSync

卡顿原因

上面说了展示过程，下面就来说下卡顿原因。

在VSync信号到来后，系统图形服务会通过CADisplayLink等机制通知App，App主线程开始在CPU中计算显示内容。随后CPU会将计算好的内容提交到GPU去，由GPU进行变换、合成、渲染。
随后GPU会把渲染结果提交到帧缓冲区去，等待下一次VSync信号到来时显示到屏幕上。
由于垂直同步的机制，如果在一个VSync时间内，CPU或者GPU没有完成内容提交，则那一帧就会被丢弃，等待下一次机会再显示，而这时显示屏会保留之前的内容不变。所以可以简单理解掉帧为过时不候 如下图所示：上图是一个显示过程，第1帧在VSync到来前，处理完成，正常显示，第2帧在VSync到来后，仍在处理中，此时屏幕不刷新，依旧显示第1帧，此时就出现了掉帧情况，渲染时就会出现明显的卡顿现象，CUP和GPU不论是哪个阻碍了显示流程，都会造成掉帧现象，所以为了给用户提供更好的体验，在开发中，我们需要进行卡顿检测以及相应的优化

卡顿监控

卡顿监控一般有两种：

1.FPS监控：为了保持流程的UI交互，App的刷新频次应该保持在60fps左右，其原因是因为iOS设备默认的刷新频率是60次/秒，而1次刷新（即VSync信号发出）的间隔是1000ms/60 = 16.67ms，所以如果在16.67ms内没有准备好下一帧数据，就会产生卡顿
2.主线程卡顿监控：通过子线程监测主线程的RunLoop，判断两个状态（kCFRunLoopBeforeSources和kCFRunLoopAfterWaiting）之间的耗时是否达到一定阈值

FPS监控

FPS的监控，参照YYKit中的YYFPSLabel，主要是通过CADisplayLink实现。借助link的时间差，来计算一次刷新刷新所需的时间，然后通过刷新次数/时间差得到刷新频次，并判断是否其范围，通过显示不同的文字颜色来表示卡顿严重程度。核心代码实现如下：如果只是简单的监测，使用FPS足够了。

主线程卡顿监控

除了FPS，还可以通过RunLoop来监控，因为卡顿的是事务，而事务是交由主线程的RunLoop处理的。

【实现思路】：检测主线程每次执行消息循环的时间，当这个时间大于规定的阈值时，就记为发生了一次卡顿。这个也是微信卡顿三方matrix的原理 以下是一个简易版RunLoop监控的实现使用时，直接调用即可卡顿检测还有一些优秀的第三方供我们选择

Swift的卡顿检测第三方ANREye，其主要思路是：创建子线程进行循环监测，每次检测时设置标记置为true，然后派发任务到主线程，标记置为false，接着子线程睡眠超过阈值时，判断标记是否为false，如果没有，说明主线程发生了卡顿
OC可以使用微信的matrix 思路：是通过监听主线程执行消息时间是否大于阀值。滴滴的DoraemonKit 思路：不断查询主线程的RunLoop状态

界面优化

CPU层面的优化

1.尽量用轻量级的对象代替重量级的对象，可以对性能有所优化，例如不需要相应触摸事件的控件，用CALayer代替UIView
2.尽量减少对UIView和CALayer的属性修改
- CALayer内部并没有属性，当调用属性方法时，其内部是通过运行时resolveInstanceMethod为对象临时添加一个方法，并将对应属性值保存在内部的一个Dictionary中，同时还会通知delegate、创建动画等，非常耗时
- UIView相关的显示属性，例如frame、bounds、transform等，实际上都是从CALayer映射来的，对其进行调整时，消耗的资源比一般属性要大
3.当有大量对象释放时，也是非常耗时的，尽量挪到后台线程去释放
4.尽量提前计算视图布局，即预排版，例如cell的行高
5.Autolayout在简单页面情况下们可以很好的提升开发效率，但是对于复杂视图而言，会产生严重的性能问题，随着视图数量的增长，Autolayout带来的CPU消耗是呈指数上升的。所以尽量使用代码布局。如果不想手动调整frame等，也可以借助三方库，例如Masonry（OC）、SnapKit（Swift）、ComponentKit、AsyncDisplayKit等
6.文本处理的优化：当一个界面有大量文本时，其行高的计算、绘制也是非常耗时的
- 【1】如果对文本没有特殊要求，可以使用UILabel内部的实现方式，且需要放到子线程中进行，避免阻塞主线程
  - 计算文本宽高：[NSAttributedString boundingRectWithSize:options:context:]
  - 文本绘制：[NSAttributedString drawWithRect:options:context:]
- 【2】自定义文本控件，利用TextKit或最底层的CoreText对文本异步绘制。并且CoreText对象创建好后，能直接获取文本的宽高等信息，避免了多次计算（调整和绘制都需要计算一次）。CoreText直接使用了CoreGraphics占用内存小，效率高
7.图片处理（解码 + 绘制）
- 【1】当使用UIImage或CGImageSource的方法创建图片时，图片的数据不会立即解码，而是在设置时解码（即图片设置到UIImageView/CALayer.contents中，然后在CALayer提交至GPU渲染前，CGImage中的数据才进行解码）。这一步是无可避免的，且是发生在主线程中的。想要绕开这个机制，常见的做法是在子线程中先将图片绘制
- 【2】当使用CG开头的方法绘制图像到画布中，然后从画布中创建图片时，可以将图像的绘制在子线程中进行
8.图片优化
- 【1】尽量使用PNG图片，不使用JPGE图片
- 【2】通过子线程预解码，主线程渲染，即通过Bitmap创建图片，在子线程赋值image
- 【3】优化图片大小，尽量避免动态缩放
- 【4】尽量将多张图合为一张进行显示
9.尽量避免使用透明view，因为使用透明view，会导致在GPU中计算像素时，会将透明view下层图层的像素也计算进来，即颜色混合处理。
10.按需加载，例如在TableView中滑动时不加载图片，使用默认占位图，而是在滑动停止时加载
11.少使用addView给cell动态添加view

GPU层面优化

相对于CPU而言，GPU主要是接收CPU提交的纹理+顶点，经过一系列运算，最终混合并渲染，输出到屏幕上。

1.尽量减少在短时间内大量图片的显示，尽可能将多张图片合为一张显示，主要是因为当有大量图片进行显示时，无论是CPU的计算还是GPU的渲染，都是非常耗时的，很可能出现掉帧的情况
2.尽量避免图片的尺寸超过4096×4096，因为当图片超过这个尺寸时，会先由CPU进行预处理，然后再提交给GPU处理，导致额外CPU资源消耗
3.尽量减少视图数量和层次，主要是因为视图过多且重叠时，GPU会将其混合，混合的过程也是非常耗时的
4.尽量避免离屏渲染
5.异步渲染，例如可以将cell中的所有控件、视图合成一张图片进行显示。可以参考Graver三方框架

OC底层知识点之 -界面优化（上）