iOS-底层原理 11 启动时dyld和objc的关联

302 阅读8分钟

App启动需要dyld与objc相互配合

在上一章 App启动流程得出结论:app由内核引导启动,之后交给dyld 主导。在dyld主要进行如下操作。

  • App运行环境的配置。
    • 环境变量配置
    • 共享缓存设置
  • 主程序的初始化
  • 对需要使用的库进行插入和绑定
    • 插入动态库
    • 链接主程序
    • 链接动态库
    • 弱符号绑定
  • 执行初始化方法 initializeMainExecutable,会通过库libsystemlibdispatch的方法最终执行libobjc中的_objc_init方法
  • 寻找程序入口(main方法),并且返回 根据App的启动流程可以得知dyld通过递归初始化libsystemlibdispatchlibobjc等库,然后会调用libobjc的_objc_init进行类的加载。

_objc_init 源码解析

_objc_init 主要进行类等信息的加载(ro->rw->rew)

void _objc_init(void)

{
    // 读取影响运行时的环境变量,如果需要,还可以打开环境变量帮助 export OBJC_HELP = 1
    environ_init();
    // 关于线程key的绑定,例如线程数据的析构函数
    tls_init();
    // 运行C++静态构造函数,在dyld调用我们的静态析构函数之前,libc会调用_objc_init(),因此我们必须自己做
    static_init();
    // runtime运行时环境初始化,里面主要是unattachedCategories、allocatedClasses -- 分类初始化
    runtime_init();
    // 初始化libobjc的异常处理系统
    exception_init();
    // 缓存条件初始化
#if __OBJC2__
    cache_t::init();
#endif
    // 启动回调机制,通常这不会做什么,因为所有的初始化都是惰性的,但是对于某些进程,我们会迫不及待地加载trampolines dylib
    _imp_implementationWithBlock_init();
    /*
     _dyld_objc_notify_register -- dyld 注册的地方
     - 仅供objc运行时使用
     - 注册处理程序,以便在映射、取消映射 和初始化objc镜像文件时使用,dyld将使用包含objc_image_info的镜像文件数组,回调 mapped 函数
     map_images:dyld将image镜像文件加载进内存时,会触发该函数
     load_images:dyld初始化image会触发该函数
     unmap_image:dyld将image移除时会触发该函数
     */
    _dyld_objc_notify_register(&map_images, load_images, unmap_image);

#if __OBJC2__
    didCallDyldNotifyRegister = **true**;
#endif
}

根据源码所知,主要分为以下几部分:

  • environ_init:初始化一系列环境变量,并读取影响运行时的环境变量
  • tls_init:关于线程key的绑定。主要是本地线程池初始化以及析构
  • static_init:运行C++静态构造函数(只会运行系统级别的构造函数),在dyld调用静态析构函数之前,libc会调用_objc_init
  • runtime_init:runtime运行时环境初始化,里面操作是unattachedCategories(分类初始化)、allocatedClasses
  • exception_init:初始化libObjc的异常处理系统。主要是初始化libobjc的异常处理系统,注册异常处理的回调,从而监控异常的处理
  • cache_init: cache缓存初始化
  • _imp_implementationWithBlock_init :启动回调机制,通常这不会做什么,因为所有的初始化都是惰性的,但是对于某些进程,我们会迫不及待地加载trampolines dylib
  • _dyld_objc_notify_register: dyld的注册

environ_init方法:环境变量初始化

全部环境变量

  • environ_init将for循环单独拿出来,去除所有条件,打印环境变量 截屏2021-07-27 下午6.41.41.png
  • 也可以通过终端命令export OBJC_hrlp = 1,打印环境变量

环境变量 - OBJC_PRINT_LOAD_METHODS

  • 配置打印load 方法的环境变量OBJC_PRINT_LOAD_METHODS,设置为YES
  • LGPerson类中重写+load函数,运行程序,load函数的打印如下

2251862-13769ca4adf12cbd.jpg

所以,OBJC_PRINT_LOAD_METHODS可以监控所有的+load方法,从而处理启动优化(后续会总结下启动优化方法)

exception_init:初始化libobjc的异常处理系统

主要是初始化libobjc的异常处理系统,注册异常处理的回调,从而监控异常的处理,源码如下

/***********************************************************************
* exception_init
* Initialize libobjc's exception handling system.
* Called by map_images().
**********************************************************************/
void exception_init(void)
{
    old_terminate = std::set_terminate(&_objc_terminate);
}

  • 当有crash(crash是指系统发生的不允许的一些指令,然后系统给的一些信号)发生时,会来到_objc_terminate方法,走到uncaught_handler扔出异常
/***********************************************************************
* _objc_terminate
* Custom std::terminate handler.
*
* The uncaught exception callback is implemented as a std::terminate handler. 
* 1. Check if there's an active exception
* 2. If so, check if it's an Objective-C exception
* 3. If so, call our registered callback with the object.
* 4. Finally, call the previous terminate handler.
**********************************************************************/

static void (*old_terminate)(void) = nil;
static void _objc_terminate(void)
{
    if (PrintExceptions) {
        _objc_inform("EXCEPTIONS: terminating");
    }
    if (! __cxa_current_exception_type()) {
        // No current exception.
        (*old_terminate)();
    }
    else {
        // There is a current exception. Check if it's an objc exception.
        @try {
            __cxa_rethrow();
        } @catch (id e) {
            // It's an objc object. Call Foundation's handler, if any.
            (*uncaught_handler)((id)e);//扔出异常
            (*old_terminate)();
        } @catch (...) {
            // It's not an objc object. Continue to C++ terminate.
            (*old_terminate)();
        }
    }
}
  • 搜索uncaught_handler,在app层会传入一个函数用于处理异常,以便于调用函数,然后回到原有的app层中,如下所示,其中fn即为传入的函数,即 uncaught_handler 等于 fn
/***********************************************************************
* objc_setUncaughtExceptionHandler
* Set a handler for uncaught Objective-C exceptions. 
* Returns the previous handler. 
**********************************************************************/
objc_uncaught_exception_handler 
objc_setUncaughtExceptionHandler(objc_uncaught_exception_handler fn)
{
    //fn为设置的异常句柄 传入的函数,为外界给的
    objc_uncaught_exception_handler result = uncaught_handler;
    uncaught_handler = fn;
    return result;
}

crash分类

crash的主要原因是收到了未处理的信号,主要来源于三个地方:

  • kernel 内核
  • 其他进行
  • App本身

所以相对应的,crash也分为了3种

  • Mach异常:是指最底层的内核级异常。用户态的开发者可以直接通过Mach API设置thread,task,host的异常端口,来捕获Mach异常。
  • Unix信号:又称BSD 信号,如果开发者没有捕获Mach异常,则会被host层的方法ux_exception()将异常转换为对应的UNIX信号,并通过方法threadsignal()将信号投递到出错线程。可以通过方法signal(x, SignalHandler)来捕获single
  • NSException 应用级异常:它是未被捕获的Objective-C异常,导致程序向自身发送了SIGABRT信号而崩溃,对于未捕获的Objective-C异常,是可以通过try catch来捕获的,或者通过NSSetUncaughtExceptionHandler()机制来捕获

针对应用级异常,可以通过注册异常捕获的函数,即NSSetUncaughtExceptionHandler机制,实现线程保活, 收集上传崩溃日志 应用级crash拦截

所以在开发中,会针对crash进行拦截处理,即app代码中给一个异常句柄NSSetUncaughtExceptionHandler,传入一个函数给系统,当异常发生后,调用函数(函数中可以线程保活、收集并上传崩溃日志),然后回到原有的app层中,其本质就是一个回调函数,如下图所示

2251862-de1ccfa9d668a189.png

上述方式只适合收集应用级异常,我们要做的就是用自定义的函数替代该ExceptionHandler即可

_dyld_objc_notify_register:dyld注册

其源码实现是在dyld源码中,以下是_dyld_objc_notify_register方法的声明

//
// Note: only for use by objc runtime
// Register handlers to be called when objc images are mapped, unmapped, and initialized.
// Dyld will call back the "mapped" function with an array of images that contain an objc-image-info section.
// Those images that are dylibs will have the ref-counts automatically bumped, so objc will no longer need to
// call dlopen() on them to keep them from being unloaded.  During the call to _dyld_objc_notify_register(),
// dyld will call the "mapped" function with already loaded objc images.  During any later dlopen() call,
// dyld will also call the "mapped" function.  Dyld will call the "init" function when dyld would be called
// initializers in that image.  This is when objc calls any +load methods in that image.
//
void _dyld_objc_notify_register(_dyld_objc_notify_mapped    mapped,
                                _dyld_objc_notify_init      init,
                                _dyld_objc_notify_unmapped  unmapped);

从注释中,可以得出:

  • 仅供objc运行时使用
  • 注册处理程序,以便在映射、取消映射和初始化objc图像时调用
  • dyld将会通过一个包含objc-image-info的镜像文件的数组回调mapped函数

方法中的三个参数分别表示的含义如下:

  • map_images:dyld将image(镜像文件)加载进内存时,会触发该函数
  • load_image:dyld初始化image会触发该函数
  • unmap_image:dyld将image移除时,会触发该函数

dyld与Objc的关联

其方法的源码实现与调用如下,即dyld与Objc的关联可以通过源码体现

===> dyld源码--具体实现
void _dyld_objc_notify_register(_dyld_objc_notify_mapped    mapped,
                                _dyld_objc_notify_init      init,
                                _dyld_objc_notify_unmapped  unmapped)
{
    dyld::registerObjCNotifiers(mapped, init, unmapped);
}

===> libobjc源码中--调用
_dyld_objc_notify_register(&map_images, load_images, unmap_image);
  • mapped 等价于 map_images
  • init 等价于 load_images
  • unmapped 等价于 unmap_image 结合dyld加载流程,dyld与Objc的关联如下图所示

2251862-85239a9033b48495.png

环境变量汇总

环境变量名说明
OBJC_PRINT_OPTIONS输出OBJC已设置的选项
OBJC_PRINT_IMAGES输出已load的image信息
OBJC_PRINT_LOAD_METHODS打印 Class 及 Category 的 + (void)load 方法的调用信息
OBJC_PRINT_INITIALIZE_METHODS打印 Class 的 + (void)initialize 的调用信息
OBJC_PRINT_RESOLVED_METHODS打印通过 +resolveClassMethod: 或 +resolveInstanceMethod: 生成的类方法
OBJC_PRINT_CLASS_SETUP打印 Class 及 Category 的设置过程
OBJC_PRINT_PROTOCOL_SETUP打印 Protocol 的设置过程
OBJC_PRINT_IVAR_SETUP打印 Ivar 的设置过程
OBJC_PRINT_VTABLE_SETUP打印 vtable 的设置过程
OBJC_PRINT_VTABLE_IMAGES打印 vtable 被覆盖的方法
OBJC_PRINT_CACHE_SETUP打印方法缓存的设置过程
OBJC_PRINT_FUTURE_CLASSES打印从 CFType 无缝转换到 NSObject 将要使用的类(如 CFArrayRef 到 NSArray * )
OBJC_PRINT_GC打印一些垃圾回收操作
OBJC_PRINT_PREOPTIMIZATION打印 dyld 共享缓存优化前的问候语
OBJC_PRINT_CXX_CTORS打印类实例中的 C++ 对象的构造与析构调用
OBJC_PRINT_EXCEPTIONS打印异常处理
OBJC_PRINT_EXCEPTION_THROW打印所有异常抛出时的 Backtrace
OBJC_PRINT_ALT_HANDLERS打印 alt 操作异常处理
OBJC_PRINT_REPLACED_METHODS打印被 Category 替换的方法
OBJC_PRINT_DEPRECATION_WARNINGS打印所有过时的方法调用
OBJC_PRINT_POOL_HIGHWATER打印 autoreleasepool 高水位警告
OBJC_PRINT_CUSTOM_RR打印含有未优化的自定义 retain/release 方法的类
OBJC_PRINT_CUSTOM_AWZ打印含有未优化的自定义 allocWithZone 方法的类
OBJC_PRINT_RAW_ISA打印需要访问原始 isa 指针的类
OBJC_DEBUG_UNLOAD卸载有不良行为的 Bundle 时打印警告
OBJC_DEBUG_FRAGILE_SUPERCLASSES当子类可能被对父类的修改破坏时打印警告
OBJC_DEBUG_FINALIZERS警告实现了 -dealloc 却没有实现 -finalize 的类
OBJC_DEBUG_NIL_SYNC警告 @synchronized(nil) 调用,这种情况不会加锁
OBJC_DEBUG_NONFRAGILE_IVARS打印突发地重新布置 non-fragile ivars 的行为
OBJC_DEBUG_ALT_HANDLERS记录更多的 alt 操作错误信息
OBJC_DEBUG_MISSING_POOLS警告没有 pool 的情况下使用 autorelease,可能内存泄漏
OBJC_DEBUG_DUPLICATE_CLASSES当出现类重名时停机
OBJC_USE_INTERNAL_ZONE在一个专用的 malloc 区分配运行时数据
OBJC_DISABLE_GC强行关闭自动垃圾回收,即使可执行文件需要垃圾回收
OBJC_DISABLE_VTABLES关闭 vtable 分发
OBJC_DISABLE_PREOPTIMIZATION关闭 dyld 共享缓存优化前的问候语
OBJC_DISABLE_TAGGED_POINTERS关闭 NSNumber 等的 tagged pointer 优化
OBJC_DISABLE_NONPOINTER_ISA关闭 non-pointer isa 字段的访问
参考:
月月的文章
LLVB