block 底层原理分析(二)

387 阅读8分钟

通过clang分析block

#include "stdio.h"
int main(){
    int a = 8;
    void(^block)(void) = ^{
        printf("chenxi - %d",a);
    };
     block();
    return 0;
}

类似这样一段代码,我们通过 clang 之后生成 c++ 代码如下:

int main(){
    int a = 8;
    // ((void (*)())& 代表一个类型
    // __main_block_impl_0 代表一个名字,函数调用
    // (void *) 类型强转
    void(*block)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, a));

    // void (*) 类型强转
    // (__block_impl *) 类型强转
     ((void (*)(__block_impl *))((__block_impl *)block)->FuncPtr)((__block_impl *)block);
    return 0;
}

通过简化之后我们又能得到如下代码:

int main(){
    int a = 8;
    // __main_block_impl_0 函数
    void(*block)(void) = __main_block_impl_0(__main_block_func_0, &__main_block_desc_0_DATA, a));

    block->FuncPtr(block);
    return 0;
}

这里我们可以看到,block 其实就相当于 __main_block_impl_0,那么我们来看下 __main_block_impl_0 的结构:

// 结构体
struct __main_block_impl_0 {
  struct __block_impl impl;
  struct __main_block_desc_0* Desc;
  // 捕获外部的 a,生成响应的成员变量
  int a;
  // __main_block_impl_0 代表结构体的构造函数
  // a(_a) 代表外部传入进来的 _a 对成员变量 a 赋值
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int _a, int flags=0) : a(_a) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
  int a = __cself->a; // bound by copy

        printf("chenxi - %d",a);
    }

static struct __main_block_desc_0 {
  size_t reserved;
  size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};

这里可以看到 __main_block_impl_0 其实就是一个结构体,他的值就是结构体的构造函数 __main_block_impl_0,在这里我们可以得出几点结论:

  • 这里对于外界传进来的变量 ablock 会生成相应的成员变量 a,并进行赋值。
  • 在编译阶段 block 的类型是 _NSConcreteStackBlock,但是在前面我们在 block 底层原理分析(一) 中讲过 block 因为外部变量会变为堆区 block,这里我们可以猜想,这一步骤是在运行时做的,但是运行时是如果做的呢?
  • 在构造函数中 impl.FuncPtr = fpfp 也就是 main函数 中的第一个参数 __main_block_func_0,其实是一个函数,impl.FuncPtr 的调用也就是 __main_block_func_0 函数的执行。
  • __main_block_func_0 函数中 __cself 相当于 block 自身,函数中的临时变量 a 只是与 block 成员变量 a 的值相同,只是值拷贝。
  • block 的底层拷贝
int main(){
    __block int a = 8;
    void(^block)(void) = ^{
        a++;
        printf("chenxi - %d",a);
    };
    block();
    return 0;
}
struct __Block_byref_a_0 {
  void *__isa;
// __forwarding 指向 a
__Block_byref_a_0 *__forwarding;
 int __flags;
 int __size;
 int a;
};

struct __main_block_impl_0 {
  struct __block_impl impl;
  struct __main_block_desc_0* Desc;
  __Block_byref_a_0 *a; // by ref
    // 这里吧 a 的 __forwarding 赋值给了 __forwarding
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, __Block_byref_a_0 *_a, int flags=0) : a(_a->__forwarding) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};

// 这里的 a 与 c 函数中 block 中传入的 a 相同,因为指向的都是同一个地址
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
  __Block_byref_a_0 *a = __cself->a; // bound by ref

        (a->__forwarding->a)++;
        printf("chenxi - %d",(a->__forwarding->a));
    }
static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {_Block_object_assign((void*)&dst->a, (void*)src->a, 8/*BLOCK_FIELD_IS_BYREF*/);}

static void __main_block_dispose_0(struct __main_block_impl_0*src) {_Block_object_dispose((void*)src->a, 8/*BLOCK_FIELD_IS_BYREF*/);}

static struct __main_block_desc_0 {
  size_t reserved;
  size_t Block_size;
  void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*);
  void (*dispose)(struct __main_block_impl_0*);
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0};
int main(){

    // int a = 8
    // 这一步相当于 __Block_byref_a_0 结构体的初始化,并对 a 取地址
    __Block_byref_a_0 a = {
        (void*)0,
        (__Block_byref_a_0 *)&a,
        0,
        sizeof(__Block_byref_a_0), 8
    };
    
    void(*block)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_a_0 *)&a, 570425344));

     ((void (*)(__block_impl *))((__block_impl *)block)->FuncPtr)((__block_impl *)block);
    return 0;
}
  • 当我们把 main 函数中 int a 修改为 __block int a 之后再 clang 之后可以看到,外部变量 a 会被包装成一个结构体 __Block_byref_a_0,并对 a 进行了取地址,赋值给了成员变量 __forwarding,最后 __main_block_func_0 函数中 a 的值等于 __forwarding__forwarding 指向外部成员变量 a 的空间,这也是为什么加了 __block 能修改外部变量值的原因。不加 __block 修改值的话也会报语义错误。

block 汇编分析得到签名 copy 的过程

这里我们通过汇编分析的方式来追踪一下 block 的执流程。

image.png image.png

首先我们在 block 中不使用外部变量,断点之后定位到 objc_retainBlock,然后我们一步一步的往下执行。

image.png

之后我们可以定位到 _Block_copy 函数,在这里输出 x0 可以看到是 __NSStackBlock__ 类型。现在我们修改 block 使用外部变量再来输出一下。

- (void)viewDidLoad {
    [super viewDidLoad];
    
    NSObject *object = [[NSObject alloc] init];
    void (^block)(void) = ^{
        NSLog(@"block --- %@",object);
    };
    block();
}

image.png

使用了外部变量再输出之后这里就变为了 __NSStackBlock__ 类型,这里因为还没有经过 copy 所以是栈 block。我们在 _Block_copyreturn 执行这里再打断点输出。

image.png

这里 x0 就是返回值,输出之后可以看到是 __NSMallocBlock__ 类型,是堆 block,说明经过 _Block_copy 之后,block 由栈区被拷贝到了堆区。下面我们再来看下源码中 _Block_copy 的执行逻辑:

void *_Block_copy(const void *arg) {
   struct Block_layout *aBlock;
   if (!arg) return NULL;
   aBlock = (struct Block_layout *)arg;
   // 判断 flags 标识且引用计数是释放状态就直接返回
   if (aBlock->flags & BLOCK_NEEDS_FREE) {
       latching_incr_int(&aBlock->flags);
       return aBlock;
   }
   // 如果是 BLOCK_IS_GLOBAL 就直接返回
   else if (aBlock->flags & BLOCK_IS_GLOBAL) {
       return aBlock;
   }
   // 到了这里就是栈 block 跟堆 block 两种,但是在编译器没有内存的开辟,只是标识为栈 block
   else {// 栈 - 堆 (编译期)
       // 运行时的时候判断是栈区 block 就会按相同大小在堆区开辟相同的大小空间,并标识为堆 block
       size_t size = Block_size(aBlock);
       struct Block_layout *result = (struct Block_layout *)malloc(size);
       if (!result) return NULL;
       // 对相关数据都进行拷贝一份
       memmove(result, aBlock, size); // bitcopy first
#if __has_feature(ptrauth_calls)
       // Resign the invoke pointer as it uses address authentication.
       result->invoke = aBlock->invoke;

#if __has_feature(ptrauth_signed_block_descriptors)
       if (aBlock->flags & BLOCK_SMALL_DESCRIPTOR) {
           uintptr_t oldDesc = ptrauth_blend_discriminator(
                   &aBlock->descriptor,
                   _Block_descriptor_ptrauth_discriminator);
           uintptr_t newDesc = ptrauth_blend_discriminator(
                   &result->descriptor,
                   _Block_descriptor_ptrauth_discriminator);

           result->descriptor =
                   ptrauth_auth_and_resign(aBlock->descriptor,
                                           ptrauth_key_asda, oldDesc,
                                           ptrauth_key_asda, newDesc);
       }
#endif
#endif
       result->flags &= ~(BLOCK_REFCOUNT_MASK|BLOCK_DEALLOCATING);    // XXX not needed
       result->flags |= BLOCK_NEEDS_FREE | 2;  // logical refcount 1
       _Block_call_copy_helper(result, aBlock);
       // 标识为堆 block
       result->isa = _NSConcreteMallocBlock;
       return result;
   }
}

block 签名

image.png

v8@?0 代表占 8 个字节,从 0 号位置开始,@ 代表 id 类型。输出也可以看到 block 的签名是 @?。签名在消息转发的时候需要用到。

blocklayout 的结构

struct Block_layout {
    // isa 指针
    void * __ptrauth_objc_isa_pointer isa;
    // 标识符
    volatile int32_t flags;
    int32_t reserved;
    // 函数指针
    BlockInvokeFunction invoke;
    struct Block_descriptor_1 *descriptor;
    // imported variables
};

struct Block_descriptor_1 {
    uintptr_t reserved;
    // 代表 size 大小
    uintptr_t size;
};

通过源码我们可以看到 Block_layout 数据结构,但是我们看不到 signature, copy, dispose 这些数据。但是我们搜索可以看到 copy, dispose 存在于 Block_descriptor_2 中,signature 存在于 Block_descriptor_3 中。

#define BLOCK_DESCRIPTOR_2 1
struct Block_descriptor_2 {
    // requires BLOCK_HAS_COPY_DISPOSE
    BlockCopyFunction copy;
    BlockDisposeFunction dispose;
};

#define BLOCK_DESCRIPTOR_3 1
struct Block_descriptor_3 {
    // requires BLOCK_HAS_SIGNATURE
    const char *signature;
    const char *layout;     // contents depend on BLOCK_HAS_EXTENDED_LAYOUT
};

我们再来看看 Block_descriptor_2Block_descriptor_3 的获取。

static struct Block_descriptor_2 * _Block_descriptor_2(struct Block_layout *aBlock)
{
    uint8_t *desc = (uint8_t *)_Block_get_descriptor(aBlock);
    desc += sizeof(struct Block_descriptor_1);
    return (struct Block_descriptor_2 *)desc;
}

static struct Block_descriptor_3 * _Block_descriptor_3(struct Block_layout *aBlock)
{
    uint8_t *desc = (uint8_t *)_Block_get_descriptor(aBlock);
    desc += sizeof(struct Block_descriptor_1);
    if (aBlock->flags & BLOCK_HAS_COPY_DISPOSE) {
        desc += sizeof(struct Block_descriptor_2);
    }
    return (struct Block_descriptor_3 *)desc;
}

在代码中我们可以看到,Block_descriptor_2 是通过内存平移 Block_descriptor_1 的大小得到的,Block_descriptor_3 是通过内存平移 Block_descriptor_2 的大小得到的,但是这里会判断 Block_descriptor_2 存不存在,不存在的话,原来 Block_descriptor_2 的位置就好存放 Block_descriptor_3。这里也说明 Block_layoutsignature, copy, dispose 这些数据是根据类型的不同是可选的。

block 的捕获变量生命周期

#include "stdio.h"
int main(){
    int a = 8;
    void(^block)(void) = ^{
        printf("chenxi - %d",a);
    };
     block();
    return 0;
}

在我们最开始的时候讲到,这样一段代码通过 clang 可以生成如下的 c++ 代码:

static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {_Block_object_assign((void*)&dst->a, (void*)src->a, 8/*BLOCK_FIELD_IS_BYREF*/);}

static void __main_block_dispose_0(struct __main_block_impl_0*src) {_Block_object_dispose((void*)src->a, 8/*BLOCK_FIELD_IS_BYREF*/);}

static struct __main_block_desc_0 {
  size_t reserved;
  size_t Block_size;
  void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*);
  void (*dispose)(struct __main_block_impl_0*);
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0};
int main(){

    // int a = 18;
    __Block_byref_a_0 a = {
        (void*)0,
        (__Block_byref_a_0 *)&a,
        0,
        sizeof(__Block_byref_a_0),
        18};
    
    void(*block)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_a_0 *)&a, 570425344));

     ((void (*)(__block_impl *))((__block_impl *)block)->FuncPtr)((__block_impl *)block);
    return 0;
}

这里 __main_block_desc_0 就是 block 的结构体,这里要对结构体进行初始化,__main_block_copy_0 就是代表 Block_descriptor_2 中的 copy__main_block_dispose_0 就是代表 Block_descriptor_2 中的 dispose ,而当 __main_block_copy_0 调用的时候就会执行 _Block_object_assign((void*)&dst->a, (void*)src->a, 8)

image.png

通过源码搜索 _Block_object_assign 可以看到这些类型代表对捕获变量类型的标识。我们这里 block 捕获的是 int 8,所以就是 BLOCK_FIELD_IS_BYREF 类型。下面我们来看一下 _Block_object_assign 函数。

_Block_object_assign 源码分析

void _Block_object_assign(void *destArg, const void *object, const int flags) {
    const void **dest = (const void **)destArg;
    switch (os_assumes(flags & BLOCK_ALL_COPY_DISPOSE_FLAGS)) {
      case BLOCK_FIELD_IS_OBJECT:
        _Block_retain_object(object);
        *dest = object;
        break;

      case BLOCK_FIELD_IS_BLOCK:
        *dest = _Block_copy(object);
        break;

      case BLOCK_FIELD_IS_BYREF | BLOCK_FIELD_IS_WEAK:
      case BLOCK_FIELD_IS_BYREF:
        *dest = _Block_byref_copy(object);
        break;

      case BLOCK_BYREF_CALLER | BLOCK_FIELD_IS_OBJECT:
      case BLOCK_BYREF_CALLER | BLOCK_FIELD_IS_BLOCK:
        *dest = object;
        break;

      case BLOCK_BYREF_CALLER | BLOCK_FIELD_IS_OBJECT | BLOCK_FIELD_IS_WEAK:
      case BLOCK_BYREF_CALLER | BLOCK_FIELD_IS_BLOCK  | BLOCK_FIELD_IS_WEAK:
        *dest = object;
        break;

      default:
        break;
    }
}
  • 如果持有变量是 BLOCK_FIELD_IS_OBJECT 类型,即没有__block 修饰,指针指向该对象,将对该对象进行持有,引用计数加1
*dest = object;
  • 如果是 BLOCK_FIELD_IS_BLOCK 类型,捕获一个 block,则进行 _Block_copy 操作
*dest = _Block_copy(object);
  • 如果是 BLOCK_FIELD_IS_BYREF,即有 __block 修饰,则会调用 _Block_byref_copy
*dest = _Block_byref_copy(object);

_Block_byref_copy 源码分析

static struct Block_byref *_Block_byref_copy(const void *arg) {
    struct Block_byref *src = (struct Block_byref *)arg;

    // __block 内存是一样 同一个家伙
    if ((src->forwarding->flags & BLOCK_REFCOUNT_MASK) == 0) {
        // src points to stack
        struct Block_byref *copy = (struct Block_byref *)malloc(src->size);
        copy->isa = NULL;
        // byref value 4 is logical refcount of 2: one for caller, one for stack
        copy->flags = src->flags | BLOCK_BYREF_NEEDS_FREE | 4;
        copy->forwarding = copy; // patch heap copy to point to itself
        src->forwarding = copy;  // patch stack to point to heap copy
        copy->size = src->size;

        if (src->flags & BLOCK_BYREF_HAS_COPY_DISPOSE) {
            // Trust copy helper to copy everything of interest
            // If more than one field shows up in a byref block this is wrong XXX
            struct Block_byref_2 *src2 = (struct Block_byref_2 *)(src+1);
            struct Block_byref_2 *copy2 = (struct Block_byref_2 *)(copy+1);
            copy2->byref_keep = src2->byref_keep;
            copy2->byref_destroy = src2->byref_destroy;

            if (src->flags & BLOCK_BYREF_LAYOUT_EXTENDED) {
                struct Block_byref_3 *src3 = (struct Block_byref_3 *)(src2+1);
                struct Block_byref_3 *copy3 = (struct Block_byref_3*)(copy2+1);
                copy3->layout = src3->layout;
            }
            // 捕获到了外界的变量 - 内存处理 - 生命周期的保存
            (*src2->byref_keep)(copy, src);
        }
        else {
            // Bitwise copy.
            // This copy includes Block_byref_3, if any.
            memmove(copy+1, src+1, src->size - sizeof(*src));
        }
    }
    // already copied to heap
    else if ((src->forwarding->flags & BLOCK_BYREF_NEEDS_FREE) == BLOCK_BYREF_NEEDS_FREE) {
        latching_incr_int(&src->forwarding->flags);
    }
    return src->forwarding;
}
  • 将外部对象封装成结构体 Block_byref *src

  • 如果是 BLOCK_FIELD_IS_BYREF,则会调用 malloc,生成一个 Block_byref *copy

  • 设置 forwarding,保证 block 内部和外部都指向同一个对象

    copy->forwarding = copy;
    src->forwarding = copy;
  • Block_byrefkeep 函数和 destroy 处理,并进行 byref_keep 函数的调用

image.png

Block_byref 的设计思路和 Block_layoutdescriptor 流程类似,通过 byref->flag 标识码判断对应的属性,以此来判断Block_byref_2 是否存在,Block_byref 定义见下图:

image.png

如果用 __block 修饰了外部变量,编译生成的 cpp 文件中,Block_byref 结构体中就会默认生成两个方法,即对应Block_byref_2keep 方法和 destory 方法,见下图:

image.png

cpp 文件中搜索这两个函数的实现,见下图:

image.png

此过程会再次调用 _Block_object_assign 函数,对 Block_byref结构体中的对象进行 BLOCK_FIELD_IS_OBJECT 流程处理。

至此 block 的三重拷贝已经摸清:

  • block 的拷贝,即将栈区 block 拷贝至堆区
  • __block 修饰的对象,对应的 Block_byref 结构体的拷贝
  • Block_byref 修饰的对象,调用 _Block_object_assign 函数进行修饰处理。