Objective-C block 深入了解

3,296 阅读9分钟

本文中代码所依赖的环境是

Xcode 9.0 Apple LLVM 9.0.0 ARC环境

block的类型

Objective-C中block有三种类型:

  • __NSGlobalBlock__
  • __NSStackBlock__
  • __NSMallocBlock__

以上是通过NSLog打印不同类型log的输出结果。从结果可以看出分别对应着全局block栈block堆block

NSGlobalBlock

当block中没有使用block外部的任何局部变量时,即为全局block。全局block在内存的全局数据区

int a = 111;
// block without captured variable
block_type block = ^{
    int b = 0;
    printf("a : %d, globalVar:%d", b, globalVar);//此处使用了block内部的局部变量和全局变量
};
NSLog(@"block with no captured auto variable :%@", block);// block with no captured variable :<__NSGlobalBlock__: 0x1000020b8>

通常情况全局block使用的情况比较少。

NSStackBlock 和 NSMallocBlock

栈和堆block使用情况比较多。

栈block: 使用了(捕获)局部变量的block在创建之初,就是栈block。block在内存的栈区

int a = 111;
NSLog(@"stack block : %@", ^{NSLog(@"a:%d", a);}); // stack block : <__NSStackBlock__: 0x7ffedff74a98>

其实栈block不止以上情况会出现,文章后面会看到其他一些情况也会看到stack block

堆block: 栈block在一些时机,会copy到堆区中,即为堆block。堆block可以实现,当超出block所在的代码块区域时仍能保留并执行。

NSLog(@"malloc block : %@", [^{NSLog(@"a:%d", a);} copy]);// malloc block : <__NSMallocBlock__: 0x60400024f180>

细看NSStackBlock 和 NSMallocBlock

上面只是大体了解了下几种block,现在我提出了一些在使用block时经常遇到的问题:

  1. block如何实现捕获局部变量?
  2. 为什么直接捕获的局部变量不能修改,而使用__block修饰的变量则可以被修改?
  3. 使用weakSelf来避免循环引用时,是不是一定要配合strongSelf使用?

block如何实现捕获局部变量

可以通过查看block内部的实现来一探究竟,比如使用

clang -rewrite-objc block.m

该命令是将oc代码转为c++实现代码,因为oc或block对象本质上是一些结构体。如果提示cannot create __weak reference because the current deployment target does not support weak错误可以加上一些参数试下clang -rewrite-objc -fobjc-arc -stdlib=libc++ -mmacosx-version-min=10.7 -fobjc-runtime=macosx-10.7 -Wno-deprecated-declarations block.m

通过将oc代码转为底层的结构体实现,能够分析出block捕获局部变量的过程。相关文章比较多,可以参考文末的参考。此处不再赘述,直接说结论:

block会将局部变量拷贝一份,作为自己的成员变量

其实这也可以解释,为什么在block中无法修改捕获到的局部变量,因为block中使用的变量其实已经不再是外部的局部变量了,而是block自己的成员变量。但我们期望的是修改外部变量,所以你改block的成员变量有啥用啊?索性编译器直接提示你,不能改!

关于拷贝基本数据类型很容易理解,这里特殊再说一下捕获对象类型。而block捕获OC对象a时,是新建一个和a类型一致的成员变量b,并将当前a的值赋值b即b = a,所以后面即使a的内容变化了,b也是不知道的。本质上还是值拷贝和引用拷贝的问题

__block修饰的变量为什么可以修改

__block的变量同样也会被block捕获,但注意,block会将局部变量包一层,可以认为包成了一个结构体,然后将结构体的指针作为block的成员变量。block通过该指针访问局部变量,既然是指针,那么block中也就可以修改外部的局部变量了。

文字多了太枯燥,上两张图缓和一下:

非_ _block变量

_ _block变量

图片来自唐巧的《谈Objective-C block的实现》

其实,非block变量和block变量在block的区别是 值传递 和 引用传递

block的内存管理

关于第三个问题,要涉及到block的内存管理

大家都知道,block循环引用一般是 self -> block -> self(或者self.property)这种结构导致互不释放资源。在此之前,有一个前置的问题是block为什么可以被持有?又为什么可以持有self?

因为堆block可以像oc对象一样,栈block是不行的

前面有提到,捕获了局部变量的block创建之初都是栈block,栈block就像一个函数一样,函数执行完,函数中的局部变量就都出栈,内存中就不存在了。但实际当中,我们的block可能要在函数执行完,仍要保留一段时间,比如网络请求:

NSURLSession *session;
NSURLRequest *request;
[session dataTaskWithRequest:request
           completionHandler:^(NSData * _Nullable data, NSURLResponse * _Nullable response, NSError * _Nullable error) {
           //do something    
}];

block能够保证超出作用域后仍能保留的原因其实是,栈block被copy到了堆中,堆block和oc对象类似,也是通过引用计数来进行内存管理

新的问题来了:

  • 谁来copy栈block到堆中?
  • 谁来管理堆block的引用计数?

栈block拷贝到堆中

本文只针对ARC环境,ARC环境系统API几乎为我们做了绝大多数copy工作:

  1. 当block被赋值给强引用时
  2. 当函数返回的是block时
  3. Cocoa框架中方法名含有usingBlock
  4. 一些没有usingBlock的系统方法也可以比如上面的网络请求
  5. GCD所有的方法
  6. 显示地对block执行copy方法

来一段代码瞅瞅

int a = 111;

// strong block with captured variable
void(^block2)(void) = ^{
    NSLog(@"a:%d", a);```};
NSLog(@"strong block with captured auto variable:%@", block2);// strong block with captured variable:<__NSMallocBlock__: 0x1004249f0>

// weak block with captured variable
__weak void(^block1)(void) = ^{
    NSLog(@"a:%d", a);
};
NSLog(@"weak block with captured auto variable:%@", block1);// weak block with captured variable:<__NSStackBlock__: 0x7ffeefbff550>

// get block from method
NSLog(@"get block from method : %@", [self getBlock]);// get block from method : <__NSMallocBlock__: 0x600000447a40>

// copy block explicitly
NSLog(@"stack block : %@", ^{NSLog(@"a:%d", a);}); // stack block : <__NSStackBlock__: 0x7ffedff74a98>
NSLog(@"malloc block : %@", [^{NSLog(@"a:%d", a);} copy]);// malloc block : <__NSMallocBlock__: 0x60400024f180>

// block as argument
[self printBlock:^{
	NSLog(@"%d", a);
}];

- (void)printBlock:(block_type)block {
    NSLog(@"block as argument : %@", block);// block as argument : <__NSStackBlock__: 0x7ffeeca47ac0>
    dispatch_async(dispatch_get_main_queue(), ^{
        NSLog(@"block in dispatch_asyn:%@", block);// block in dispatch_asyn:<__NSMallocBlock__: 0x604000646330>
    });
}

- (block_type)getBlock {
    int a = 123;
    return ^{NSLog(@"%d", a);};
}

代码中能够看到在将block赋值给弱引用将block当做参数传递时也是stack block

strongSelf在避免循环引用中是否必须?

先举个避免循环引用的🌰

__weak typeof(self) weakSelf = self;
self.block = ^{
	__strong typeof(weakSelf) strongSelf = weakSelf;
	// do something
};
  • self.block中使用self为什么会产生循环引用

    在block拷贝到堆中时,block捕获到self,并把self拷贝到block内部作为自己成员变量(即使block中引用的是self.property,block内部访问该property时仍然是通过self->property的方式进行访问,所以仍然是捕获的self),同时会执行能够强持有self的操作,即使得self引用计数+1。block执行结束后,由于self持有block,所以不会释放,self由于被block的成员变量强持有,所以也不会被释放。于是循环引用

  • 先简单说下使用weakSelf为什么能避免循环引用:

    block捕获了weakSelf这个局部变量,当做自己的成员变量,但由于是weak的,所以作为block的成员变量的weakSelf,并不会强持有self(即不会让self的引用计数+1)。

  • 接下来,另一个问题是:strongSelf会不会造成循环引用呢?

    不会的,因为strongSelf是block内部的局部变量,strongSelf被赋值时,由于是强引用,所以会强持有self,让self的引用计数+1,但block执行结束后strongSelf的生命周期结束,self的引用计数-1,也就不会造成循环引用了。

那么strongSelf的必要性就容易解释了,执行block中的某些逻辑时,如果self释放了可能会造成严重的问题,为了执行block时不让self释放,我们要用strongSelf这个强引用局部变量控制着self。

至于如果不声明strongSelf会造成什么严重问题,请看下面的🌰

//例子2,该例来自唐巧的博客
__weak typeof(self) weakSelf = self;
// 如果正在执行networkReachabilityStatusBlock时,在任何一行代码执行时,self都有释放,实际当中多半情况下会崩溃
// 其实从代码健壮性角度讲,假设需要通过weakSelf执行一系列完整的操作,而且每个操作可能之间有数据依赖问题,如果中途weakSelf释放了,那可能将会导致严重的数据不一致问题
AFNetworkReachabilityStatusBlock callback = ^(AFNetworkReachabilityStatus status) {
    weakSelf.networkReachabilityStatus = status;
    weakSelf.networkReachabilityStatusBlock(status);
};

__strong typeof(weakSelf) strongSelf = weakSelf; 此处__strong是必要的,如果不写,则转换成c++源码后是 MyObject *const __weak strongSelf = weakSelf; 这样也就起不到对self强引用的作用

__weak typeof(self) weakSelf1 = self;
block_type block4 = ^{
    typeof(weakSelf) strongSelf = weakSelf1; /*注意:此处并没有使用__strong */
    dispatch_after(dispatch_time(DISPATCH_TIME_NOW, (int64_t)(2 * NSEC_PER_SEC)), dispatch_get_main_queue(), ^{
        NSLog(@"strongSelf in dispatch : %@", strongSelf); /* strongSelf in dispatch : (null) */
    });
};
self.block = block4;
  • block中__strong typeof(self) strongSelf = weakSelf;的写法会导致对self的强引用吗?

不会。这要弄清楚什么是typeof()

  • 首先,typeof()不是Objective-C语法,也不是标准C语言的操作符,是扩展的特性,需要有编译器支持才可以
  • 另外,typeof()在编译期间决定类型,编译后的代码已经没有self相关内容了,所以不会对self有强引用

嵌套block如何避免循环引用

先看一段嵌套block的例子

- (void)testNestBlock {
    self.myBlock = ^{
        self.myBlock1 = ^{
            NSLog(@"ddd%@", self);
        };
        self.myBlock1();
    };
    self.myBlock();
}

myBlock中捕获了self,同时self又持有myBlock,所以肯定有循环引用

我们修改一下

- (void)testNestBlock {
    __weak typeof(self) weakSelf = self;
    self.myBlock = ^{
    	__strong typeof(self) strongSelf = weakSelf;
        strongSelf.myBlock1 = ^{
            NSLog(@"ddd%@", strongSelf);
        };
        strongSelf.myBlock1();
    };
    self.myBlock();
}

这样还有循环引用吗?

因为myBlock1捕获了strongSelf,捕获的本质是--为block创建一个成员变量,取值为strongSelf,该成员变量的内存管理ownership和strongSelf相同

所以myBlock1还是会对self有强引用

怎么修改呢--看下面

- (void)testNestBlock {
    __weak typeof(self) weakSelf = self;
    self.myBlock = ^{
    	typeof(self) strongSelf = weakSelf;
        strongSelf.myBlock1 = ^{
            __strong typeof(self) sSelf = weakSelf;
            NSLog(@"ddd%@", sSelf);
        };
        strongSelf.myBlock1();
    };
    self.myBlock();
}

所以,每多一层block就要写一遍__strong typeof(self) sSelf = weakSelf;

但每次都声明一个表示强引用的strongSelf变量似乎有点啰嗦,有没有更好的办法?

其实,我们可以这样写__strong typeof(self) self = weakSelf;

每次都定义一个名字叫做self的变量,这个变量并不会与外层的self冲突

其实我们常见的宏@weakify(self);@strongify(self);也是这么做的

项目中例子分析

拿项目代码中block例子分析一把

- (void)startTask {
	Task *task = [self startTaskWithCompletion:^{
    	NSLog(@"task : %@", task);// 此时block捕捉到的是未初始化的task,即nil。相当于值传递
    	// do something with task
	}];
}

分析过程:

  1. 代码中的赋值过程是,先执行startTaskWithCompletion:,再对task赋值
  2. 初始化block时,task还是nil
  3. 所以block中task成员变量也是nil
  4. 赋值方法执行完后,task指向了新的task对象,但block中的task由于是值拷贝,所以还是nil
  5. 之后代码执行到block中时,task还是nil

解决方案:

改用引用传递, Task *task -> _ _block Task *task

参考