OC底层探究之alloc探索

1,376 阅读7分钟

一、对象的指针地址和内存

先看下面的代码:

    HPerson * p1 = [HPerson alloc];
    HPerson * p2 = [p1 init];
    HPerson * p3 = [p1 init];
    
    NSLog(@"%@-%p", p1, p1);
    NSLog(@"%@-%p", p2, p2);
    NSLog(@"%@-%p", p3, p3);

请问这3者的会有什么不同吗?

执行代码就会发现p1,p2,p3打印的内存地址是完全一样的:

ia_100000026.png

所以在这个过程我们可以得出一个结论:

1、alloc让对象有了内存空间,有了指针指向。

2、init后内存没有变化,证明init没有对指针做什么操作。

再来看下面的代码:

    HPerson * p1 = [HPerson alloc];
    HPerson * p2 = [p1 init];
    HPerson * p3 = [p1 init];
    
    NSLog(@"%@-%p-%p", p1, p1, &p1);
    NSLog(@"%@-%p-%p", p2, p2, &p2);
    NSLog(@"%@-%p-%p", p3, p3, &p3);

执行:

ia_200000001.png

发现3个不同的指针地址指向了同一块内存空间,而且是3个连续的指针地址。

那么alloc是怎么分配内存空间的呢?init真的什么都没有做吗?

二、探索底层的三种方法

如果我们直接进行代码跳转:

ia_200000002.png

ia_200000003.png

就会进入到NSObjectalloc方法:

ia_200000004.png

发现找不到方法的实现!

为什么没有实现呢?我们应该如何去查看alloc方法的实行呢?

方法一:断点调试

我们先在alloc处打上断点:

ia_200000005.png

然后按住ctrl点击step into

ia_200000006.png 即可看到,alloc方法调用的是objc_alloc方法:

ia_200000007.png

然后我们打上符号断点:

ia_200000008.png

ia_200000009.png

再点击继续执行程序:

ia_200000010.png

然后我们就会发现objc_alloc来源于libobjc.A.dylib,即objc动态库底层方法:

ia_200000011.png

方法二:利用汇编一步一步跟进

debug选择栏打开进入汇编:

ia_200000012.png

依旧在alloc处打上断点:

ia_200000013.png

运行程序就会进入到汇编页面:

ia_200000014.png

在该页面就会发现是调用了objc_alloc方法,然后用符号断点去查看该方法使用的哪个动态库。

方法三:通过已知方法进行符号断点

当程序停在我们的断点处时:

ia_200000015.png

添加已知方法的符号断点:

ia_200000016.png

然后进入:

ia_200000017.png

就会发现alloc是来自libobjc.A.dylib动态库:

ia_200000018.png

以上就是3中基本的探索底层的方式,还有反汇编、lldb、堆栈等等。

三、汇编结合源码调试分析

1、下载源码

我们已经定位到了alloc是在libobjc这个动态库里面,接下来就是进入源码进行调试。

先在苹果开源网站下载源码,或者在苹果的源代码目录进行下载,源代码目录更加方便。

以源代码目录为例:

进入网站后搜索objc

ia_200000019.png

找到objc4,点进去:

ia_200000020.png

最新的objc4-824.tar.gz有问题,无法下载,所以使用的是objc4-818.2.tar.gz。

2、查看源码

打开下载的objc4-818.2,搜索alloc {:

ia_200000021.png

发现alloc方法里面调用的是_objc_rootAlloc方法。

再点_objc_rootAlloc方法进去:

// Base class implementation of +alloc. cls is not nil.
// Calls [cls allocWithZone:nil].
id
_objc_rootAlloc(Class cls)
{
    return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}

发现_objc_rootAlloc方法里面是callAlloc方法。

再点callAlloc方法进去:

// Call [cls alloc] or [cls allocWithZone:nil], with appropriate
// shortcutting optimizations.
static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
#if __OBJC2__
    if (slowpath(checkNil && !cls)) return nil;
    if (fastpath(!cls->ISA()->hasCustomAWZ())) {
        return _objc_rootAllocWithZone(cls, nil);
    }
#endif

    // No shortcuts available.
    if (allocWithZone) {
        return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
    }
    return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}

这里就是alloc的核心方法。

__OBJC2__指的是2.0版本,现在用的都是2.0版本。

那么到了这里,是执行_objc_rootAllocWithZone呢?还是执行objc_msgSend呢?

3、汇编调试

我们可以通过汇编来查看,回到最开始的代码,在alloc处打上断点,于此再加上_objc_rootAlloc的符号断点:

ia_200000022.png

运行:

ia_200000023.png

运行后确实进入了_objc_rootAlloc方法,但是进入却是HPerson的父类NSObject_objc_rootAlloc方法,我们应该进入的HPerson的方法才对!

所以需要先取消_objc_rootAlloc的断点重新运行,当断到了HPersonalloc方法时,再加上_objc_rootAlloc的断点:

ia_200000024.png

断住后,发现先执行_objc_rootAllocWithZone方法,再执行objc_msgSend方法。

4、源码调试

先按照iOS_objc4-756.2 最新源码编译调试配置下载下来的objc4-818.2。

objc源码里面创建HObjectBuild这个targets,并创建HPerson这个类:

ia_200000025.png

main.m里面打上断点,并运行程序:

ia_200000026.png

进入上面查看到的_objc_rootAllocWithZone方法里:

NEVER_INLINE
id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)
{
    // allocWithZone under __OBJC2__ ignores the zone parameter
    return _class_createInstanceFromZone(cls, 0, nil,
                                         OBJECT_CONSTRUCT_CALL_BADALLOC);
}

再进入到_class_createInstanceFromZone方法里:

/***********************************************************************
* class_createInstance
* fixme
* Locking: none
*
* Note: this function has been carefully written so that the fastpath
* takes no branch.
**********************************************************************/
static ALWAYS_INLINE id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
                              int construct_flags = OBJECT_CONSTRUCT_NONE,
                              bool cxxConstruct = true,
                              size_t *outAllocatedSize = nil)
{
    ASSERT(cls->isRealized());

    // Read class's info bits all at once for performance
    bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
    bool hasCxxDtor = cls->hasCxxDtor();
    bool fast = cls->canAllocNonpointer();
    size_t size;

    size = cls->instanceSize(extraBytes);
    if (outAllocatedSize) *outAllocatedSize = size;

    id obj;
    if (zone) {
        obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
    } else {
        obj = (id)calloc(1, size);
    }
    if (slowpath(!obj)) {
        if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
            return _objc_callBadAllocHandler(cls);
        }
        return nil;
    }

    if (!zone && fast) {
        obj->initInstanceIsa(cls, hasCxxDtor);
    } else {
        // Use raw pointer isa on the assumption that they might be
        // doing something weird with the zone or RR.
        obj->initIsa(cls);
    }

    if (fastpath(!hasCxxCtor)) {
        return obj;
    }

    construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
    return object_cxxConstructFromClass(obj, cls, construct_flags);
}

_class_createInstanceFromZone方法内,发现返回的是obj这个对象,所以我们在obj这里打上断点:

ia_200000027.png

继续执行程序:

ia_200000028.png

发现obj已经有地址了,因为当前内存并未使用过,是脏内存地址!

点击step over,到calloc方法,内存地址没有发生变化:

ia_200000029.png

在点击step over,执行完calloc方法后,发现obj的内存地址不一样了:

ia_200000030.png

说明在calloc方法中对obj进行了内存地址赋值。

在打印中发现obj对象的类型是id,这是因为这个地址还没有绑定到我们的HPerson这类里面去,关联类的是isa

继续执行,过了initInstanceIsa方法后再打印发现obj已经关联了HPerson类:

ia_200000031.png

所以在initInstanceIsa方法内让isa关联了HPerson以及c++的方法和函数!

接下来就是返回obj,所有的alloc方法流程已经走完了!

四、字节对齐

重新运行,在_class_createInstanceFromZone方法的

size = cls->instanceSize(extraBytes);

打上断点:

ia_400000033.png 发现需要额外增加的字节为0

然后进入到instanceSize方法:

inline size_t instanceSize(size_t extraBytes) const {
        if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
            return cache.fastInstanceSize(extraBytes);
        }

        size_t size = alignedInstanceSize() + extraBytes;
        // CF requires all objects be at least 16 bytes.
        if (size < 16) size = 16;  
        return size;
    }

return处打上断点,继续:

ia_400000034.png

发现进入到第一个return,说明有缓存

然后进入fastInstanceSize方法:

size_t fastInstanceSize(size_t extra) const
    {
        ASSERT(hasFastInstanceSize(extra));

        if (__builtin_constant_p(extra) && extra == 0) {
            return _flags & FAST_CACHE_ALLOC_MASK16;
        } else {
            size_t size = _flags & FAST_CACHE_ALLOC_MASK;
            // remove the FAST_CACHE_ALLOC_DELTA16 that was added
            // by setFastInstanceSize
            return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
        }
    }

return处打上断点,继续:

ia_400000035.png 走的是第二个return,而且size16

那么这个数据怎么来的呢?

如果没有缓存的话,就会走alignedInstanceSize方法,然后返回字节对齐的内存大小:

ia_400000036.png

那么,一个对象的内存大小由什么来确定呢?

只有成员变量决定!

我们进入unalignedInstanceSize方法:

// May be unaligned depending on class's ivars.
    uint32_t unalignedInstanceSize() const {
        ASSERT(isRealized());
        return data()->ro()->instanceSize;
    }

发现大小是有instanceSize来决定的,即实例变量的大小!

depending on class's ivars.-->取决于类的ivars。

并且是编译完成的干净内存的大小!

所以是依赖于成员变量的大小!

当前的HPerson对象没有成员变量,所以这里返回的大小是8

ia_400000037.png

为什么是8呢?因为NSObject有一个成员变量isa

ia_400000038.png

为什么isa的大小是8呢?

因为Class是一个结构体isa是一个结构体指针,所以是8字节!

我们可以在源码里搜索objc_class

ia_400000039.png

发现Class是一个结构体指针类型!

而且objc_class继承于objc_object,即万物皆对象!即类也是一个对象!

返回大小8字节后,如果小于16字节则等于16

ia_400000040.png

所以得出16字节!

如果大于16呢?

就会进行字节对齐

进入到alignedInstanceSize方法:

// Class's ivar size rounded up to a pointer-size boundary.
    uint32_t alignedInstanceSize() const {
        return word_align(unalignedInstanceSize());
    }

里面有word_align方法:

static inline uint32_t word_align(uint32_t x) {
    return (x + WORD_MASK) & ~WORD_MASK;
}

这个就是字节对齐算法!

点进WORD_MASK

#ifdef __LP64__
#   define WORD_SHIFT 3UL
#   define WORD_MASK 7UL
#   define WORD_BITS 64
#else
#   define WORD_SHIFT 2UL
#   define WORD_MASK 3UL
#   define WORD_BITS 32
#endif

发现WORD_MASK等于7

按照(x + WORD_MASK) & ~WORD_MASK这个算法,x8

  (x + WORD_MASK) & ~WORD_MASK
= (8 + 7) & ~7
= 15 & ~7

转为二进制:
15 为:0000 1111
7  为:0000 0111
~7 为:1111 1000

所以:
  15 & ~7
= 0000 1111 & 1111 1000
= 0000 1000

转为十进制为:8

但是为9的时候则为16

所以这是一个以8字节对齐,向上取8的整数倍的方法!

为什么是8的倍数呢?

因为最大就是指针8字节!同时也是为了空间换时间,方便内存读取!

五、alloc简略流程图

alloc流程图.png

有兴趣的朋友可以观看我的下一篇文章《OC对象原理探究之内存对齐》