OC底层原理初探之对象的本质（一）alloc探索上前言 OC在生成对象时需要用到alloc方法，那么alloc方法的底层

前言

OC在生成对象时需要用到alloc方法，那么alloc方法的底层原理是怎样的呢？今天就来探索下alloc底层流程。

首先做个小测试：分别输出对象的内容、对象的地址以及对象指针的地址，代码和打印结果如下：

    XJPerson *p1 = [XJPerson alloc];
    XJPerson *p2 = [p1 init];
    XJPerson *p3 = [p1 init];
    
    XJPerson *p4 = [XJPerson alloc];
    
    NSLog(@"%@-%p-%p", p1, p1, &p1);
    NSLog(@"%@-%p-%p", p2, p2, &p2);
    NSLog(@"%@-%p-%p", p3, p3, &p3);
    
    NSLog(@"%@-%p-%p", p4, p4, &p4);
    **********************   运行结果   ************************
    2021-06-06 15:13:30.196346+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a5a0>-0x60000295a5a0-0x7ffee3355068
    2021-06-06 15:13:30.196493+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a5a0>-0x60000295a5a0-0x7ffee3355060
    2021-06-06 15:13:30.196607+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a5a0>-0x60000295a5a0-0x7ffee3355058
    2021-06-06 15:13:30.196699+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a620>-0x60000295a620-0x7ffee3355050

由打印分析可得出：

p1、p2、p3 对象的内容、对象的地址是一样的，但是指针的地址不一样。
p4 和 p1、p2、p3 打印的对象内容、对象地址、指针地址都不一样。为什么呢？原因如下图由此可得出结论：

alloc 方法具有开辟内存的功能，而init方法没有开辟内存的功能。
栈区分配的内存是从高到低连续，堆区分配的内存则是从低到高。

下面正式开始探索对象在初始化时，alloc方法到底做了什么？

准备工作：

下载源码objc-818.2。
编译源码objc4-750源码编译，仅供参考

三种探索底层的方式：

想要探索alloc的流程，但是Xcode并不能直接看到alloc的具体实现，下面提供三种探索底层的方式。

1.符号断点

在alloc方法打好断点，当断点断住之后按住control + step into跳进汇编代码查看底层方法调用顺序（新项目会有更多的汇编代码，编译过的项目只有很少的汇编代码），然后再添加通过汇编已知的符号断点探索。流程如下图：

2.汇编

当断点断住之后，通过Xcode -> Debug -> Debug Workflow -> Always Show Disassembly，打开汇编调试，通过 control + step into 跟流程或者直接通过添加汇编代码里的符号断点探索。

备注：Build Setting -> Optimization Level 可以更改编译优化级别，不同编译优化级别显示的汇编代码多少不同，编译优化级别越高，显示汇编代码越少。

3.符号断点在需要探索的方法处添加符号断点，比如这里需要探索alloc方法就直接添加alloc的符号断点，但是需要注意，在需要的时候才激活此符号断点，不然很多地方都会调用，影响我们探索。

终极方法：源码调试

上面的三种方法为我们探索底层提供了途径，但是都比较繁琐，而且不够清晰，既然已经通过汇编知道objc_alloc 是属于 libobjc.A.dylib，那么就到苹果开源网站下载objc源码编译成项目跑起来进行探索，这样既深又爽。通过汇编调试方式知道源码所在库之后，可以直接到苹果开源网站 opensource.apple.com/tarballs/ 下载相关源码然后运行调试。

alloc源码探索

通过源码项目探索alloc方法，发现底层调用流程如下图探索流程如下：

断点断住alloc方法之后，按住control + command + step into 进入alloc（此方法比加断点的方法更方便快捷且不用担心受其他影响）

+ (id)alloc {
    return _objc_rootAlloc(self);
}

继续上面操作进入_objc_rootAlloc

id _objc_rootAlloc(Class cls)
{
    return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}

继续上面操作进入callAlloc

static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
#if __OBJC2__ // 判断是否为Objc2.0版本
    //slowpath(x):x很可能为假，为真的概率很小 
    //fastpath(x):x很可能为真 
    //其实将fastpath和slowpath去掉是完全不影响任何功能,写上是告诉编译器对代码进行优化
    if (slowpath(checkNil && !cls)) return nil;
    //判断该类是否实现自自定义的 +allocWithZone，没有则进入if条件句
    if (fastpath(!cls->ISA()->hasCustomAWZ())) {
        return _objc_rootAllocWithZone(cls, nil);
    }
#endif

    // No shortcuts available.
    if (allocWithZone) {
        return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
    }
    return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}

按照调用顺序继续上面操作进入_objc_rootAllocWithZone

NEVER_INLINE
id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)
{
    // allocWithZone under __OBJC2__ ignores the zone parameter
    return _class_createInstanceFromZone(cls, 0, nil,
                                         OBJECT_CONSTRUCT_CALL_BADALLOC);
}

继续上面操作进入_class_createInstanceFromZone，这里就是真正的核心代码了。

通过实际调试发现对obj有较大影响的核心方法有3个：

cls->instanceSize(extraBytes)：计算所需内存空间的大小，extraBytes此处为0
(id)calloc(1, size)：向系统申请开辟内存，返回地址指针
obj->initInstanceIsa(cls, hasCxxDtor)：通过isa关联到相应的类

下面重点分析这三个方法：

`instanceSize`：计算所需内存空间的大小

继续上面操作进入instanceSize

inline size_t instanceSize(size_t extraBytes) const {
    if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
        return cache.fastInstanceSize(extraBytes);
    }

    size_t size = alignedInstanceSize() + extraBytes;
    // CF requires all objects be at least 16 bytes.
    if (size < 16) size = 16;
    return size;
}

继续上面操作进入cache.fastInstanceSize

size_t fastInstanceSize(size_t extra) const
{
    ASSERT(hasFastInstanceSize(extra));

    if (__builtin_constant_p(extra) && extra == 0) {
        return _flags & FAST_CACHE_ALLOC_MASK16;
    } else {
        size_t size = _flags & FAST_CACHE_ALLOC_MASK;
        // remove the FAST_CACHE_ALLOC_DELTA16 that was added
        // by setFastInstanceSize
        return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
    }
}

继续上面操作进入align16（16字节对齐）

static inline size_t align16(size_t x) {
    return (x + size_t(15)) & ~size_t(15);
}

探究下align16方法的具体实现，以align16(12)为例

x = 12;
(x + size_t(15)) & ~ size_t(15) // ~ 表示取反
12 + 15 = 27  0001 1011
15            0000 1111
~15           1111 0000
27 & ~15      0001 1011 & 1111 0000
结果：         0001 0000  16

总结：align16算法实际上就是取16的整数倍。我认为是向下取整，理由我是站在纯算法的角度，(x + 15)是16的几倍，超过的部分抹去。例如 (20 + 15) = 35 = 16 * 2 + 3，结果是32。这种算法和 >> 4 << 4 是一样的，得出的结果就是16的倍数，不足16的全部抹去。

为什么需要16字节对齐?

数据以字节对齐的方式存储，cpu读取数据时以固定字节长度来读取就可以了，不用频繁变换读取字节长度，这是一种以空间换时间的做法。
更安全由于在一个对象中isa指针是占8个字节，如果不进行节对齐，对象之间就会紧挨着，容易造成访问混乱。16字节对齐，会预留部分空间，访问更安全

`calloc`：向系统申请开辟内存，返回地址指针

首先由instanceSize方法计算出需要的内存大小，然后向系统申请size大小的内存空间返回给obj，因此obj是指向内存地址的指针，下面我们通过打印来验证下

执行calloc之后打印的地址发生了变换，说明系统分配了内存，但是和常见的对象打印<XJPerson: 0x0000000100616e60>不一样，为什么呢？

obj没有和cls进行关联绑定。
同时验证了calloc只是开辟了内存。

`initInstanceIsa`：通过`isa`关联到相应的类

继续上面操作进入objc_object::initInstanceIsa

inline void 
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
    ASSERT(!cls->instancesRequireRawIsa());
    ASSERT(hasCxxDtor == cls->hasCxxDtor());

    initIsa(cls, true, hasCxxDtor);
}

继续上面操作进入objc_object::initIsa

inline void 
objc_object::initIsa(Class cls, bool nonpointer, UNUSED_WITHOUT_INDEXED_ISA_AND_DTOR_BIT bool hasCxxDtor)
{ 
    ASSERT(!isTaggedPointer()); 
    
    isa_t newisa(0);

    if (!nonpointer) {
        newisa.setClass(cls, this);
    } else {
        ASSERT(!DisableNonpointerIsa);
        ASSERT(!cls->instancesRequireRawIsa());


#if SUPPORT_INDEXED_ISA
        ASSERT(cls->classArrayIndex() > 0);
        newisa.bits = ISA_INDEX_MAGIC_VALUE;
        // isa.magic is part of ISA_MAGIC_VALUE
        // isa.nonpointer is part of ISA_MAGIC_VALUE
        newisa.has_cxx_dtor = hasCxxDtor;
        newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
        newisa.bits = ISA_MAGIC_VALUE;
        // isa.magic is part of ISA_MAGIC_VALUE
        // isa.nonpointer is part of ISA_MAGIC_VALUE
#   if ISA_HAS_CXX_DTOR_BIT
        newisa.has_cxx_dtor = hasCxxDtor;
#   endif
        newisa.setClass(cls, this);
#endif
        newisa.extra_rc = 1;
    }

    // This write must be performed in a single store in some cases
    // (for example when realizing a class because other threads
    // may simultaneously try to use the class).
    // fixme use atomics here to guarantee single-store and to
    // guarantee memory order w.r.t. the class index table
    // ...but not too atomic because we don't want to hurt instantiation
    isa = newisa;
}

通过step over跟流程发现newisa.setClass(cls, this)之后内存就与类关联起来了。

备注：具体的isa结构和源码探索请见OC底层原理初探之对象的本质（三）alloc探索下

在obj->initInstanceIsa(cls, hasCxxDtor)之后打印obj

根据打印结果得出结论：指针和类已经关联起来了。至此alloc的探索也就告一段落了。

总结：alloc的核心作用就是分配内存，并通过isa指针与类进行关联。

OC底层原理初探之对象的本质（一）alloc探索上

前言

准备工作：

三种探索底层的方式：

终极方法：源码调试

alloc源码探索

instanceSize：计算所需内存空间的大小

calloc：向系统申请开辟内存，返回地址指针

initInstanceIsa：通过isa关联到相应的类

`instanceSize`：计算所需内存空间的大小

`calloc`：向系统申请开辟内存，返回地址指针

`initInstanceIsa`：通过`isa`关联到相应的类