iOS 底层原理 - 性能优化

198 阅读7分钟

底层原理 - 性能优化

一、CPU 和 GPU

在屏幕成像的过程中,CPU和GPU起着至关重要的作用

1、CPU(Central Processing Unit,中央处理器):对象的创建和销毁、对象属性的调整、布局计算、文本的计算和排版、图片的格式转换和解码、图像的绘制(Core Graphics)

2、GPU(Graphics Processing Unit,图像处理器):纹理渲染

CPU -> GPU -> 缓冲区 -> 屏幕; CPU 通过计算 将要显示的数据 提交给GPU,GPU通过渲染后最终显示到屏幕上;

二、卡顿优化

1、卡顿产生原因

iOS设备的硬件时钟会发出Vsync(垂直同步信号),然后App的CPU会去计算屏幕要显示的内容,之后将计算好的内容提交互GPU去渲染。随后,GPU将渲染结果提交到帧缓冲区,等到下一个Vsync到来时将缓冲区的帧显示到屏幕上。也就是说,一帧的显示是由CPU和GPU共同决定的。

一般来说,页面滑动流畅是60fps,也就是一秒有60帧更新,即每隔16.7ms就要产生一帧画面,而如果CPU和GPU加起来的处理时间超过了16.7ms,就会造成掉帧卡顿。

2、卡顿优化 - CPU优化

2.1、尽量用轻量级的对象,比如用不到事件处理的地方,可以考虑使用CALayer取代UIView;

2.2、不要频繁地调用UIView的相关属性,比如frame、bouns、transform等属性,尽量减少不必要的修改;

2.3、尽量提前计算好布局,在有需要时一次性调整对应的属性,不要多次修改属性;

2.4、AutoLayout会比直接设置frame消耗更多的CPU资源;

2.5、图片的size最好刚好跟UIImageView的size保持一致;

2.6、控制一下线程的最大并发数量;

2.7、尽量把耗时的操作放到子线程

2.7.1、文本处理(尺寸计算、绘制)

2.7.2、图片处理(解码、绘制)

3、卡顿优化 - GPU优化

3.1、尽量避免短时间内大量图片的显示,尽可能将多张图片合成一张进行显示

3.2、GPU能处理的最大纹理尺寸是4096*4096,一旦超过这个尺寸,就会占用CPU资源进行处理,所以纹理尽量不要超过这个尺寸;

3.3、尽量减少视图数量和层次

3.4、减少透明的视图(alpha<1),不透明的就设置opaque为YES;

3.5、尽量避免出现离屏渲染;

4、离屏渲染

4.1、在OpenGL中,GPU有2种渲染方式

4.1.1、On-Screen Readering:当前屏幕渲染,在当前用于显示的屏幕缓冲区进行渲染操作;

4.1.2、Off-Screen Readering:离屏渲染,在当前屏幕缓冲区以外新开辟一个缓冲区进行渲染操作

4.2、离屏渲染消耗性能的原因

4.2.1、需要创建新的缓冲区

4.2.2、离屏渲染的整个过程,需要多次切换上下文环境,先是从当前屏幕(On-Screen)切换到离屏(Off-Screen);等到离屏渲染结束后,将离屏缓冲区的渲染结果显示到屏幕上,又需要将上下文环境从离屏切换到当前屏幕;

4.3、哪些操作会触发离屏渲染?

4.3.1、光栅化, layer.shouldRasterize = YES;

4.3.2、遮罩,layer.mask

4.3.3、圆角,同时设置layer.masksToBounds = YES; layer.cornerRadius > 0

4.3.3.1、考虑通过CoreGraphics绘制裁剪圆角,或者叫美工提供圆角图片

4.3.4、阴影,layer.shadowXXX

4.3.4.1、如果设置了layer.shadowPath就不会产生离屏渲染

5、卡顿检测

5.1、平时所说的卡顿主要是因为在主线程执行了比较耗时的操作

5.2、可以添加Observer到主线程RunLoop中,通过监听RunLoop状态切换的耗时,以过到监控卡顿的目的;

三、耗电优化

1、耗电的主要来源

1.1、CPU、GPU处理;

1.2、网络数据传输;

1.3、定位;

1.4、图像处理;

2、耗电优化 - CPU优化 2.1、尽可能的降低CPU与GPU的功耗

2.2、尽量少用定时器

2.3、优化I/O操作

2.3.1、尽量不要频繁写入小数据,量好批量一次性写入

2.3.2、读写大量重要数据时,考虑用dispatch_io,其提供了基于GCD的异步操作文件I/O的API。用dispatch_io系统会优化磁盘访问

2.3.3、数据量比较大的,建议使用数据库(比如SQLite、CoreData)

3、耗电优化 - 网络优化: 3.1、减少、压缩网络数据

3.2、如果多次请求的结果是相同的,尽量使用缓存

3.3、使用断点续传,否则网络不稳定可能多次传输相同的内容;

3.4、网络不可用时,不要尝试执行网络请求;

3.5、让用户可以取消长时间运行或者速度很慢的网络操作,设置合适的超时时间;

3.6、批量传输,比如:下载视频流时,不要传输很小的数据包,直接下载整个文件或者一大块一大块地下载。如果下载广告,一次性多下载一些,然后再慢慢展示。如果下载电子邮件,一次下载多封,不要一封一封地下载;

4、耗电优化 - 定位优化 4.1、如果只是需要快速确定用户位置,最好用CLLocationManager的requestLocation方法。定位完成后,会自动让定位硬件断电

4.2、如果不是导航应用,尽量不要实时更新位置,定位完毕就关掉定位服务;

4.3、尽量降低定位精度,比如尽量不要使用精度最高的kCLLocationAccuracyBest

4.4、需要后台定位时,尽量设置pausesLocationUpdatesAutomatiically为YES,如果用户不太可能移动的时候,系统会自动暂停位置更新

4.5、尽量不要使用startMonitoringSignificantLocationChanges,优先考虑startMonitoringForRegion;

5、耗电优化 - 硬件检测优化 用户移动、摇晃、倾斜设备时,会产生动作motion事件,这些事件由加速度计、陀螺仪、磁力计算等硬件检测。在不需要检测的场合,应该及时关闭这些硬件;

四、App启动优化

1、App的启动可以分为2种

1.1、冷启动(Cold Launch):从零开始启动App

1.2、热启动(Warm Launch):App已经在内存中,在后台存活着,再次点击图标启动App

2、App启动时间的优化,主要是针对冷启动进行优化

3、通过添加环境变量可以打印出App的启动时间分析

(Edit scheme -> Run -> Arguments DYLD_PRINT_STATISTICS 设置为1

如果需要更详细的信息,那就将DYLD_PRINT_STATISTICS_DETAILS设置为1

4、App的冷启动可以概括为3大阶段

dyld runtime main

4.1、App的启动 - dyld

4.1.1、dyld(dynamic link editor),Apple的动态链接器,可以用来装载Mach-O文件(可执行文件、动态库等)

4.1.2、启动App时,dyld所做的事情有

4.1.2.1、装载App的可执行文件,同时会递归加载所有依赖的动态库

4.1.2.2、当dyld把可执行文件、动态库都装载完毕后,会通知Runtime进行下一步处理

4.2、App的启动 - runtime

4.2.1、启动App时,runtime所做的事情有

4.2.1.1、调用map_images进行可执行文件内容的解析和处理

4.2.1.2、在load_images中调用call_load_mehthods, 调用所有Class和Category的+load方法

4.2.1.3、进行各种obj结构的初始化(注册Objc类、初始化类对象等等)

4.2.1.4、调用C++静态初始化器和_attribute__((constructor))修饰的函数;

4.2.2、到此为止,可执行文件和动态库中所有的符号(class, Protocol, Selector, IMP,... )都已经按格式成功加载到内存中,被runtime所管理

4.3、App的启动 - main

总结一下:

1、App的启动由dyld主导,将可执行文件加载到内存,顺便加载所有依赖的动态库

2、并由runtime负责加载成objc定义的结构

3、所有初始化工作结束后,dyld就会调用main函数

4、接下来就是UIApplicationMain函数,AppDelegate的application:didFinishLaunchingWithOptions:方法;

5、App的启动优化

按照不同的阶段

5.1、dyld

5.1.1、减少动态库、合并一些动态库(定期清理不必要的动态库)

5.1.2、减少Objc类、分类的数量、减少Selector数量(定期清理不必要的类、分类)

5.1.3、减少C++虚函数数量

5.1.4、Swift尽量使用stuct

5.2、runtime

用+initialize方法和dispatch_once取代所有的attribute((constructor))、C++静态构造器、Objc的+load

5.3、main

5.3.1、在不影响用户体验的前提下,尽可能将一些操作延迟,不要全部都放在finishLaunching方法中

5.3.1、按需加载

五、安装包瘦身

1、安装包(IPA)主要由可执行文件、资源组成

2、资源(图片、音频、视频等)

2.1、采取无损压缩

2.2、去除没有用到的资源:

3、可执行文件瘦身

3.1、编译器优化

3.1.1、Strip Linked Product、Make Strings Read-Only、Symbols Hidden by Default 设置为YES

3.1.2、去掉异常支持,Enable C++ Exceptions、Enable Objective-C Exceptions设置为NO, Other cFlags添加-fno-exceptions

3.1.3、利用AppCode(www.jetbrains.com/objc )检测未使用的代码:菜单栏 -> Code -> Inspect Code

3.1.4、编写LLVM插件检测出重复代码、未被调用代码

六、LinkMap

生成LinkMap文件,可以查看可执行文件的具体组成


原文作者:今天 zhuanlan.zhihu.com/p/152662208