OC底层原理初探之对象的本质(一)alloc探索上

657 阅读6分钟

前言

OC在生成对象时需要用到alloc方法,那么alloc方法的底层原理是怎样的呢?今天就来探索下alloc底层流程。

首先做个小测试: 分别输出对象的内容、对象的地址以及对象指针的地址,代码和打印结果如下:

    XJPerson *p1 = [XJPerson alloc];
    XJPerson *p2 = [p1 init];
    XJPerson *p3 = [p1 init];
    
    XJPerson *p4 = [XJPerson alloc];
    
    NSLog(@"%@-%p-%p", p1, p1, &p1);
    NSLog(@"%@-%p-%p", p2, p2, &p2);
    NSLog(@"%@-%p-%p", p3, p3, &p3);
    
    NSLog(@"%@-%p-%p", p4, p4, &p4);
    **********************   运行结果   ************************
    2021-06-06 15:13:30.196346+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a5a0>-0x60000295a5a0-0x7ffee3355068
    2021-06-06 15:13:30.196493+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a5a0>-0x60000295a5a0-0x7ffee3355060
    2021-06-06 15:13:30.196607+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a5a0>-0x60000295a5a0-0x7ffee3355058
    2021-06-06 15:13:30.196699+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a620>-0x60000295a620-0x7ffee3355050
    

由打印分析可得出:

  • p1、p2、p3 对象的内容、对象的地址是一样的,但是指针的地址不一样。
  • p4p1、p2、p3 打印的对象内容、对象地址、指针地址都不一样。 为什么呢?原因如下图 image.png 由此可得出结论:
  1. alloc 方法具有开辟内存的功能,而init方法没有开辟内存的功能。
  2. 栈区分配的内存是从高到低连续,堆区分配的内存则是从低到高。

下面正式开始探索对象在初始化时,alloc方法到底做了什么?

准备工作:

  1. 下载源码objc-818.2
  2. 编译源码objc4-750源码编译,仅供参考

三种探索底层的方式:

想要探索alloc的流程,但是Xcode并不能直接看到alloc的具体实现,下面提供三种探索底层的方式。

1.符号断点

在alloc方法打好断点,当断点断住之后按住control + step into跳进汇编代码查看底层方法调用顺序(新项目会有更多的汇编代码,编译过的项目只有很少的汇编代码),然后再添加通过汇编已知的符号断点探索。流程如下图: image.png

2.汇编

当断点断住之后,通过Xcode -> Debug -> Debug Workflow -> Always Show Disassembly,打开汇编调试,通过 control + step into 跟流程或者直接通过添加汇编代码里的符号断点探索。

image.png

备注:Build Setting -> Optimization Level 可以更改编译优化级别,不同编译优化级别显示的汇编代码多少不同,编译优化级别越高,显示汇编代码越少。 image.png

3.符号断点 在需要探索的方法处添加符号断点,比如这里需要探索alloc方法就直接添加alloc的符号断点,但是需要注意,在需要的时候才激活此符号断点,不然很多地方都会调用,影响我们探索。 image.png

终极方法:源码调试

上面的三种方法为我们探索底层提供了途径,但是都比较繁琐,而且不够清晰,既然已经通过汇编知道objc_alloc 是属于 libobjc.A.dylib,那么就到苹果开源网站下载objc源码编译成项目跑起来进行探索,这样既深又爽。 image.png 通过汇编调试方式知道源码所在库之后,可以直接到苹果开源网站 opensource.apple.com/tarballs/ 下载相关源码然后运行调试。 image.png image.png

alloc源码探索

通过源码项目探索alloc方法,发现底层调用流程如下图 image.png 探索流程如下:

断点断住alloc方法之后,按住control + command + step into 进入alloc(此方法比加断点的方法更方便快捷且不用担心受其他影响)

+ (id)alloc {
    return _objc_rootAlloc(self);
}

继续上面操作进入_objc_rootAlloc

id _objc_rootAlloc(Class cls)
{
    return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}

继续上面操作进入callAlloc

static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
#if __OBJC2__ // 判断是否为Objc2.0版本
    //slowpath(x):x很可能为假,为真的概率很小 
    //fastpath(x):x很可能为真 
    //其实将fastpath和slowpath去掉是完全不影响任何功能,写上是告诉编译器对代码进行优化
    if (slowpath(checkNil && !cls)) return nil;
    //判断该类是否实现自自定义的 +allocWithZone,没有则进入if条件句
    if (fastpath(!cls->ISA()->hasCustomAWZ())) {
        return _objc_rootAllocWithZone(cls, nil);
    }
#endif

    // No shortcuts available.
    if (allocWithZone) {
        return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
    }
    return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}

按照调用顺序继续上面操作进入_objc_rootAllocWithZone

NEVER_INLINE
id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)
{
    // allocWithZone under __OBJC2__ ignores the zone parameter
    return _class_createInstanceFromZone(cls, 0, nil,
                                         OBJECT_CONSTRUCT_CALL_BADALLOC);
}

继续上面操作进入_class_createInstanceFromZone,这里就是真正的核心代码了。 image.png

通过实际调试发现对obj有较大影响的核心方法有3个:

  • cls->instanceSize(extraBytes):计算所需内存空间的大小,extraBytes此处为0
  • (id)calloc(1, size):向系统申请开辟内存,返回地址指针
  • obj->initInstanceIsa(cls, hasCxxDtor):通过isa关联到相应的类

下面重点分析这三个方法:

instanceSize:计算所需内存空间的大小

继续上面操作进入instanceSize

inline size_t instanceSize(size_t extraBytes) const {
    if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
        return cache.fastInstanceSize(extraBytes);
    }

    size_t size = alignedInstanceSize() + extraBytes;
    // CF requires all objects be at least 16 bytes.
    if (size < 16) size = 16;
    return size;
}

继续上面操作进入cache.fastInstanceSize

size_t fastInstanceSize(size_t extra) const
{
    ASSERT(hasFastInstanceSize(extra));

    if (__builtin_constant_p(extra) && extra == 0) {
        return _flags & FAST_CACHE_ALLOC_MASK16;
    } else {
        size_t size = _flags & FAST_CACHE_ALLOC_MASK;
        // remove the FAST_CACHE_ALLOC_DELTA16 that was added
        // by setFastInstanceSize
        return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
    }
}

继续上面操作进入align16(16字节对齐)

static inline size_t align16(size_t x) {
    return (x + size_t(15)) & ~size_t(15);
}

探究下align16方法的具体实现,以align16(12)为例

x = 12;
(x + size_t(15)) & ~ size_t(15) // ~ 表示取反
12 + 15 = 27  0001 1011
15            0000 1111
~15           1111 0000
27 & ~15      0001 1011 & 1111 0000
结果:         0001 0000  16

总结:align16算法实际上就是取16的整数倍。我认为是向下取整,理由我是站在纯算法的角度,(x + 15)是16的几倍,超过的部分抹去。例如 (20 + 15) = 35 = 16 * 2 + 3,结果是32。这种算法和 >> 4 << 4 是一样的,得出的结果就是16的倍数,不足16的全部抹去。

为什么需要16字节对齐?

  1. 数据以字节对齐的方式存储,cpu读取数据时以固定字节长度来读取就可以了,不用频繁变换读取字节长度,这是一种以空间换时间的做法。
  2. 更安全 由于在一个对象中isa指针是占8个字节,如果不进行节对齐 ,对象之间就会紧挨着,容易造成访问混乱。16字节对齐,会预留部分空间,访问更安全

calloc:向系统申请开辟内存,返回地址指针

首先由instanceSize方法计算出需要的内存大小,然后向系统申请size大小的内存空间返回给obj,因此obj是指向内存地址的指针,下面我们通过打印来验证下 image.png

image.png 执行calloc之后打印的地址发生了变换,说明系统分配了内存,但是和常见的对象打印<XJPerson: 0x0000000100616e60>不一样,为什么呢?

  • obj没有和cls进行关联绑定。
  • 同时验证了calloc只是开辟了内存。

initInstanceIsa:通过isa关联到相应的类

继续上面操作进入objc_object::initInstanceIsa

inline void 
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
    ASSERT(!cls->instancesRequireRawIsa());
    ASSERT(hasCxxDtor == cls->hasCxxDtor());

    initIsa(cls, true, hasCxxDtor);
}

继续上面操作进入objc_object::initIsa

inline void 
objc_object::initIsa(Class cls, bool nonpointer, UNUSED_WITHOUT_INDEXED_ISA_AND_DTOR_BIT bool hasCxxDtor)
{ 
    ASSERT(!isTaggedPointer()); 
    
    isa_t newisa(0);

    if (!nonpointer) {
        newisa.setClass(cls, this);
    } else {
        ASSERT(!DisableNonpointerIsa);
        ASSERT(!cls->instancesRequireRawIsa());


#if SUPPORT_INDEXED_ISA
        ASSERT(cls->classArrayIndex() > 0);
        newisa.bits = ISA_INDEX_MAGIC_VALUE;
        // isa.magic is part of ISA_MAGIC_VALUE
        // isa.nonpointer is part of ISA_MAGIC_VALUE
        newisa.has_cxx_dtor = hasCxxDtor;
        newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
        newisa.bits = ISA_MAGIC_VALUE;
        // isa.magic is part of ISA_MAGIC_VALUE
        // isa.nonpointer is part of ISA_MAGIC_VALUE
#   if ISA_HAS_CXX_DTOR_BIT
        newisa.has_cxx_dtor = hasCxxDtor;
#   endif
        newisa.setClass(cls, this);
#endif
        newisa.extra_rc = 1;
    }

    // This write must be performed in a single store in some cases
    // (for example when realizing a class because other threads
    // may simultaneously try to use the class).
    // fixme use atomics here to guarantee single-store and to
    // guarantee memory order w.r.t. the class index table
    // ...but not too atomic because we don't want to hurt instantiation
    isa = newisa;
}

通过step over跟流程发现newisa.setClass(cls, this)之后内存就与类关联起来了。

image.png

备注:具体的isa结构和源码探索请见OC底层原理初探之对象的本质(三)alloc探索下

obj->initInstanceIsa(cls, hasCxxDtor)之后打印obj

image.png

根据打印结果得出结论:指针和类已经关联起来了。至此alloc的探索也就告一段落了。

总结:alloc的核心作用就是分配内存,并通过isa指针与类进行关联。