iOS深入理解性能优化

534 阅读10分钟

一、CPU和GPU

在屏幕成像的过程中,CPU和GPU起着至关重要的作用

  • CPU中央处理器

对象的创建和销毁、对象属性的调整、布局计算、文本的计算和排版、图片的格式转换和解码、图像的绘制(Core Graphics)

  • GPU图形处理器

纹理的渲染

  • 在iOS中是双缓冲机制,有前帧缓存、后帧缓存

图片.png 我们所看到的成像,是通过CPU和GPU共同协作才能完成的,经过CPU的计算和处理好的数据,交给GPU进行渲染,然后放到帧的缓存区,再被视频控制器读取,才能显示到我们的屏幕上。

二、屏幕成像原理

在iOS中的屏幕成像由许多帧共同组成的,每一帧都会由屏幕先发出一个垂直同步信号,然后再发出很多行的水平同步信号,每一行同步信号表示处理完一行的数据,直到屏幕发完所有的水平同步信号,表示这一帧的数据全部处理完成了,再会进行下一轮的垂直同步信号的发出,表示即将处理下一帧的数据。

图片.png 图片.png 图片.png

三、卡顿产生的原因和优化

卡顿产生的原因
  • 在图像处理过程中,CPU处理计算数据会消耗一定时间,然后再交由GPU,而GPU进行渲染也会花费时间,CPU和GPU都完成消耗了一定的时间;
  • 垂直同步信号发出的时间如果正好是CPU、GPU处理完的时间,那就会完好的显示该帧的图像;如果CPU、GPU处理的时间过长并且没有完全处理完,而这时垂直同步信号已经发出了,那么就会读取上一帧的数据进行展示,这种现象做叫掉帧。
  • 而该帧没有处理完的数据就只能等下一个垂直同步信号,再进行读取显示,这中间也会花费一定时间进行等待,这也是掉帧;
  • 掉帧的现象就会造成卡顿,所以我们要想解决卡顿,就要尽量减少CPU和GPU的资源消耗。

图片.png

按照60FPS的刷帧率,每隔16ms就会有一次VSync信号。(1000 / 60 = 16.6)

卡顿的优化
1、CPU优化
  • 尽量用轻量级的对象,比如用不到事件处理的地方,可以考虑使用CALayer取代UIView
  • 不要频繁地调用UIView的相关属性,比如frame、bounds、transform等属性,尽量减少不必要的修改
  • 尽量提前计算好布局,在有需要时一次性调整对应的属性,不要多次修改属性
  • Autolayout会比直接设置frame消耗更多的CPU资源
  • 图片的size最好刚好跟UIImageView的size保持一致
  • 控制一下线程的最大并发数量
  • 尽量把耗时的操作放到子线程。 文本处理(尺寸计算、绘制)、图片处理(解码、绘制)

比如对文本的处理(尺寸计算、绘制),都可以放到异步去做处理

// 文字计算 [@"text" boundingRectWithSize:CGSizeMake(100, MAXFLOAT) options:NSStringDrawingUsesLineFragmentOrigin attributes:nil context:nil];
// 文字绘制 [@"text" drawWithRect:CGRectMake(0, 0, 100, 100) options:NSStringDrawingUsesLineFragmentOrigin attributes:nil context:nil];

对图片的处理,对图片的解码和绘制都是会消耗性能的

我们经常使用的给UIImage赋值的方法,其本质是会去进行图片的解码和绘制的,所以我们可以将解码绘制的过程放在子线程来处理

// imageNamed:底层会进行对图片的解码和绘制
UIImageView *imageView = [[UIImageView alloc] init]; 
imageView.image = [UIImage imageNamed:@"timg"];
// 换成如下方法 
UIImageView *imageView = [[UIImageView alloc] init];
self.imageView = imageView;
dispatch_async(dispatch_get_global_queue(0, 0), ^{
    // 获取CGImage 
    CGImageRef cgImage = [UIImage imageNamed:@"timg"].CGImage; 
    // alphaInfo 
    CGImageAlphaInfo alphaInfo = CGImageGetAlphaInfo(cgImage) & kCGBitmapAlphaInfoMask;
    BOOL hasAlpha = NO; 
    if (alphaInfo == kCGImageAlphaPremultipliedLast || alphaInfo == kCGImageAlphaPremultipliedFirst || alphaInfo == kCGImageAlphaLast || alphaInfo == kCGImageAlphaFirst) {
    hasAlpha = YES; 
    } 
    // bitmapInfo
    CGBitmapInfo bitmapInfo = kCGBitmapByteOrder32Host; bitmapInfo |= hasAlpha ? kCGImageAlphaPremultipliedFirst : kCGImageAlphaNoneSkipFirst; 
    // size 
    size_t width = CGImageGetWidth(cgImage);
    size_t height = CGImageGetHeight(cgImage);
    // context 
    CGContextRef context = CGBitmapContextCreate(NULL, width, height, 8, 0, CGColorSpaceCreateDeviceRGB(), bitmapInfo); 
    // draw 
    CGContextDrawImage(context, CGRectMake(0, 0, width, height), cgImage); 
    // get 
    CGImage cgImage = CGBitmapContextCreateImage(context); 
    // into UIImage
    UIImage *newImage = [UIImage imageWithCGImage:cgImage]; 
    // release
    CGContextRelease(context); 
    CGImageRelease(cgImage); 
    // back to the main thread dispatch_async(dispatch_get_main_queue(), ^{ 
    self.imageView.image = newImage; }); 
});
2、GPU优化
  • 尽量避免短时间内大量图片的显示,尽可能将多张图片合成一张进行显示
  • GPU能处理的最大纹理尺寸是4096x4096,一旦超过这个尺寸,就会占用CPU资源进行处理,所以纹理尽量不要超过这个尺寸
  • 尽量减少视图数量和层次
  • 减少透明的视图(alpha<1),不透明的就设置opaque为YES
  • 尽量避免出现离屏渲染

四、离屏渲染

在OpenGL中,GPU有2种渲染方式
  • On-Screen Rendering:当前屏幕渲染,在当前用于显示的屏幕缓冲区进行渲染操作
  • Off-Screen Rendering:离屏渲染,在当前屏幕缓冲区以外新开辟一个缓冲区进行渲染操作
离屏渲染消耗性能的原因
  • 需要创建新的缓冲区
  • 离屏渲染的整个过程,需要多次切换上下文环境,先是从当前屏幕(On-Screen)切换到离屏(Off-Screen);等到离屏渲染结束以后,将离屏缓冲区的渲染结果显示到屏幕上,又需要将上下文环境从离屏切换到当前屏幕
哪些操作会触发离屏渲染?
光栅化,layer.shouldRasterize = YES

遮罩,layer.mask

圆角,同时设置layer.masksToBounds = YES、layer.cornerRadius大于0
考虑通过CoreGraphics绘制裁剪圆角,或者叫美工提供圆角图片

阴影,layer.shadowXXX
如果设置了layer.shadowPath就不会产生离屏渲染

五、卡顿检测

平时所说的“卡顿”主要是因为在主线程执行了比较耗时的操作, 可以添加Observer到主线程RunLoop中,通过监听RunLoop状态切换的耗时,以达到监控卡顿的目的。

实现思路
  • 在整个运行循环中,需要监听的主要就是RunLoop结束休眠到处理Source0的这段时间,如果时间过长,就证明有耗时操作
  • 检测主线程每次执行消息循环的时间,当这个时间大于规定的阈值时,就记为发生了一次卡顿。这个也是微信卡顿三方matrix的原理
Swift的卡顿检测第三方ANREye

其主要思路是:创建子线程进行循环监测,每次检测时设置标记置为true,然后派发任务到主线程,标记置为false,接着子线程睡眠超过阈值时,判断标记是否为false,如果没有,说明主线程发生了卡顿

OC可以使用

微信matrix、滴滴DoraemonKit

六、耗电的主要来源及优化

造成耗电来源有以下这些
  • CPU的处理
  • 网络的连接
  • 定位
  • 图像的展示和处理
耗电的优化
  • 尽可能降低CPU、GPU功耗
  • 少用定时器
  • 优化I/O操作
  • 尽量不要频繁写入小数据,最好批量一次性写入。
  • 读写大量重要数据时,考虑用dispatch_io,其提供了基于GCD的异步操作文件I/O的API。用dispatch_io系统会优化磁盘访问。
  • 数据量比较大的,建议使用数据库(比如SQLite、CoreData)
  • 网络优化
  • 减少、压缩网络数据
  • 如果多次请求的结果是相同的,尽量使用缓存
  • 使用断点续传,否则网络不稳定时可能多次传输相同的内容
  • 网络不可用时,不要尝试执行网络请求
  • 让用户可以取消长时间运行或者速度很慢的网络操作,设置合适的超时时间
  • 批量传输,比如,下载视频流时,不要传输很小的数据包,直接下载整个文件或者一大块一大块地下载。如果下载广告,一次性多下载一些,然后再慢慢展示。如果下载电子邮件,一次下载多封,不要一封一封地下载
  • 定位优化
  • 如果只是需要快速确定用户位置,最好用CLLocationManager的requestLocation方法。定位完成后,会自动让定位硬件断电
  • 如果不是导航应用,尽量不要实时更新位置,定位完毕就关掉定位服务
  • 尽量降低定位精度,比如尽量不要使用精度最高的kCLLocationAccuracyBest
  • 需要后台定位时,尽量设置pausesLocationUpdatesAutomatically为YES,如果用户不太可能移动的时候系统会自动暂停位置更新
  • 尽量不要使用startMonitoringSignificantLocationChanges,优先考虑startMonitoringForRegion:
  • 硬件检测优化

用户移动、摇晃、倾斜设备时,会产生动作(motion)事件,这些事件由加速度计、陀螺仪、磁力计等硬件检测。在不需要检测的场合,应该及时关闭这些硬件

七、App的启动

APP的启动可以分为2种

  • 冷启动(Cold Launch):从零开始启动APP
  • 热启动(Warm Launch):APP已经在内存中,在后台存活着,再次点击图标启动APP

APP启动时间的优化,主要是针对冷启动进行优化

  • 通过添加环境变量可以打印出APP的启动时间分析(Edit scheme -> Run -> Arguments)
  • DYLD_PRINT_STATISTICS设置为1
  • 如果需要更详细的信息,那就将DYLD_PRINT_STATISTICS_DETAILS设置为1

APP的冷启动可以概括为3大阶段:dyld、runtime、main

dyld
  • dyld(dynamic link editor),Apple的动态链接器,可以用来装载Mach-O文件(可执行文件、动态库等)

  • 启动APP时,dyld所做的事情有

  • 装载APP的可执行文件,同时会递归加载所有依赖的动态库
  • 当dyld把可执行文件、动态库都装载完毕后,会通知Runtime进行下一步的处理
runtime
  • 启动APP时,runtime所做的事情有
  • 调用map_images进行可执行文件内容的解析和处理
  • 在load_images中调用call_load_methods,调用所有Class和Category的+load方法
  • 进行各种objc结构的初始化(注册Objc类 、初始化类对象等等)
  • 调用C++静态初始化器和__attribute__((constructor))修饰的函数
  • 到此为止,可执行文件和动态库中所有的符号(Class,Protocol,Selector,IMP,…)都已经按格式成功加载到内存中,被runtime 所管理
main

所有初始化工作结束后,dyld就会调用main函数 接下来就是UIApplicationMain函数,AppDelegate的application:didFinishLaunchingWithOptions:方法

APP的启动的优化

按照不同的阶段

  • dyld
  1. 减少动态库、合并一些动态库(定期清理不必要的动态库)
  2. 减少Objc类、分类的数量、减少Selector数量(定期清理不必要的类、分类)
  3. 减少C++虚函数数量
  4. Swift尽量使用struct
  • runtime
  1. 用+initialize方法和dispatch_once取代所有的__attribute__((constructor))、C++静态构造器、ObjC的+load
  • main
  1. 在不影响用户体验的前提下,尽可能将一些操作延迟,不要全部都放在finishLaunching方法中
  2. 按需加载

八、安装包瘦身

安装包(IPA)主要由可执行文件、资源组成

  • 可执行文件瘦身
  • 编译器优化 Strip Linked Product、Make Strings Read-Only、Symbols Hidden by Default设置为YES
  • 去掉异常支持,Enable C++ Exceptions、Enable Objective-C Exceptions设置为NO, Other C Flags添加-fno-exceptions
  • 利用AppCode(www.jetbrains.com/objc/)检测未使用… -> Code -> Inspect Code
  • 编写LLVM插件检测出重复代码、未被调用的代码

九、LinkMap

生成LinkMap文件,可以查看可执行文件的具体组成 图片.png Link Map文件,可以查看可执行文件的具体组成和大小分析

图片.png 可借助第三方工具解析LinkMap文件: github.com/huanxsd/Lin…