多线程-基本概念及原理

1,387 阅读14分钟

#多线程原理 标签: 多线程


本章节主要介绍 进程线程多线程线程池等的基本概念及原理


1. 线程

  1. 线程时进程的基本执行单元,一个进程的所有任务都在线程中执行
  2. 进程要想执行任务,必须的有线程,进程至少要有一条线程
  3. 程序启动会默认开启一条线程,这条线程被称为 主线程 或者 UI线程

2.进程

  1. 进程是指在系统中正在运行的一个应用程序
  2. 每个进程之间是独立的,每个进程均运行在其专用的且受保护的内存空间内
  3. 通过“活动监视器”可以查看mac系统中所开启的线程

3.进程与线程的关系

进程是线程的容器,而线程用来执行任务。在iOS中是单进程开发,一个进程就是一个app 两个之间的关系就相当于工厂与流水线的关系,工厂与工厂之间是相互独立的,而工厂中的流水线是共享工厂的资源的,即 进程相当于一个工厂,线程相当于工厂中的一条流水线 进程与线程之间的关系主要涉及两个方面:

  • 地址空间

    • 同一个进程的线程共享本进程的地址空间
    • 而进程之间则是独立的地址空间
  • 资源拥有

    • 同一个进程内线程共享本进程的资源,如内存、I/O、cpu等
    • 但是进程之间资源是独立的

拓展

  • 多进程要比多线程健壮

    • 一个进程崩溃后,在保护模式下不会对其他进程产生影响
    • 而一个线程崩溃整个进 程都死掉
  • 使用场景:频繁切换、并发操作

    • 进程切换时,消耗的资源大,效率高。所以涉及到频繁的切换时,使用线程要好于进程。
    • 同样如果要求同时进行并且又要共享某些变量的并发操作,只能用线程不能用进程
  • 执行过程

    • 每个独立的进程有一个程序运行的入口、顺序执行序列和程序入口
    • 但是 线程不能独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制。
  • 线程是处理器调度的基本单位,但是进程不是。

  • 线程没有地址空间,线程包含在进程地址空间中

4 多线程

4.1 原理

  • 对于单核CPU,同一时间,CPU只能处理一条线程,即只有一条线程在工作,
  • iOS中的多线程同时执行的本质是CPU在多个任务直接进行快速的切换,由于CPU调度线程的时间足够快,就造成了多线程的“同时”执行的效果。其中切换的时间间隔就是时间片

4.2 优点

  • 能适当提高程序的执行效率
  • 能适当提高资源的利用率,如CPU、内存
  • 线程上的任务执行完成后,线程会自动销毁

4.2 缺点

  • 开启线程需要占用一定的内存空间,默认情况下,每一个线程占用512KB
  • 如果开启大量线程,会占用大量的内存空间,降低程序的性能
  • 线程越多,CPU在调用线程上的开销就越大
  • 程序设计更加复杂,比如线程间的通信,多线程的数据共享

4.3 生命周期

多线程的生命周期主要分为5部分:新建 - 就绪 - 运行 - 阻塞 - 死亡,如下图所示 此处输入图片的描述

  • 新建:主要是实例化线程对象
  • 就绪:线程对象调用start方法,将线程对象加入可调度线程池,等待CPU的调用,即调用start方法,并不会立即执行,进入就绪状态,需要等待一段时间,经CPU调度后才执行,也就是从就绪状态进入运行状态
  • 运行:CPU负责调度可调度线城市中线程的执行,在线程执行完成之前,其状态可能会在就绪和运行之间来回切换,这个变化是由CPU负责,开发人员不能干预。
  • 阻塞:当满足某个预定条件时,可以使用休眠,即sleep,或者同步锁,阻塞线程执行。当进入sleep时,会重新将线程加入就绪中。下面关于休眠的时间设置,都是NSThread的
    • sleepUntilDate: 阻塞当前线程,直到指定的时间为止,即休眠到指定时间
    • sleepForTimeInterval: 在给定的时间间隔内休眠线程,即指定休眠时长
    • 同步锁:@synchronized(self)
  • 死亡:分为两种情况
    • 正常死亡,即线程执行完毕
    • 非正常死亡,即当满足某个条件后,在线程内部(或者主线程中)终止执行(调用exit方法等退出)

简要说明,就是处于运行中的线程拥有一段可以执行的时间(称为时间片),

  1. 如果时间片用尽,线程就会进入就绪状态队列
  2. 如果时间片没有用尽,且需要开始等待某事件,就会进入阻塞状态队列
  3. 等待事件发生后,线程又会重新进入就绪状态队列
  4. 每当一个线程离开运行,即执行完毕或者强制退出后,会重新从就绪状态队列中选择一个线程继续执行

线程的exit和cancel

  • exit:一旦强行终止线程,后续的所有代码都不会执行
  • cancel:取消当前线程,但是不能取消正在执行的线程

拓展 时间片

CPU在多个任务直接进⾏快速的切换,这个时间间隔就是时间⽚

  • (单核CPU)同⼀时间,CPU 只能处理 1 个线程
    • 换⾔之,同⼀时间只有 1 个线程在执⾏
  • 多线程同时执⾏:
    • 是 CPU 快速的在多个线程之间的切换
    • CPU 调度线程的时间⾜够快,就造成了多线程的“同时”执⾏的效果
  • 如果线程数⾮常多
    • CPU 会在 N 个线程之间切换,消耗⼤量的 CPU 资源
    • 每个线程被调度的次数会降低,线程的执⾏效率降低

4.4 Q & A 线程的优先级越高,是不是意味着任务的执行越快?

并不是,线程执行的快慢,除了要看优先级,还需要查看资源的大小(即任务的复杂度)、以及 CPU 调度情况。在NSThread中,线程优先级threadPriority已经被服务质量qualityOfService取代,以下是相关的枚举值

 typedef NS_ENUM(NSInteger, NSQualityOfService) {
    NSQualityOfServiceUserInteractive = 0x21,
    NSQualityOfServiceUserInitiated = 0x19,
    NSQualityOfServiceUtility = 0x11,
    NSQualityOfServiceBackground = 0x09,
    NSQualityOfServiceDefault = -1
} API_AVAILABLE(macos(10.10), ios(8.0), watchos(2.0), tvos(9.0));

5 线程池原理

  • 【第一步】判断核心线程池是否都正在执行任务

    • 返回NO,创建新的工作线程去执行
    • 返回YES,进入【第二步】
  • 【第二步】判断线程池工作队列是否已经饱满

    • 返回NO,将任务存储到工作队列,等待CPU调度
    • 返回YES,进入【第三步】
  • 【第三步】判断线程池中的线程是否都处于执行状态

    • 返回NO,安排可调度线程池中空闲的线程去执行任务
    • 返回YES,进入【第四步】
  • 【第四步】交给饱和策略去执行,主要有以下四种(在iOS中并没有找到以下4种策略)

    • AbortPolicy:直接抛出RejectedExecutionExeception异常来阻止系统正常运行
    • CallerRunsPolicy:将任务回退到调用者
    • DisOldestPolicy:丢掉等待最久的任务
    • DisCardPolicy:直接丢弃任务

此处输入图片的描述

6 多线程技术方案

iOS中的多线程实现方式,主要有四种:pthread、NSThread、GCD、NSOperation,汇总如图所示 此处输入图片的描述 下面是以上四种方案的简单示例

// *********1: pthread*********
pthread_t threadId = NULL;
//c字符串
char *cString = "HelloCode";
/**
 pthread_create 创建线程
 参数:
 1. pthread_t:要创建线程的结构体指针,通常开发的时候,如果遇到 C 语言的结构体,类型后缀 `_t / Ref` 结尾
 同时不需要 `*`
 2. 线程的属性,nil(空对象 - OC 使用的) / NULL(空地址,0 C 使用的)
 3. 线程要执行的`函数地址`
 void *: 返回类型,表示指向任意对象的指针,和 OC 中的 id 类似
 (*): 函数名
 (void *): 参数类型,void *
 4. 传递给第三个参数(函数)的`参数`
 */
int result = pthread_create(&threadId, NULL, pthreadTest, cString);
if (result == 0) {
    NSLog(@"成功");
} else {
    NSLog(@"失败");
}
    
//*********2、NSThread*********
[NSThread detachNewThreadSelector:@selector(threadTest) toTarget:self withObject:nil];
    
//*********3、GCD*********
dispatch_async(dispatch_get_global_queue(0, 0), ^{
    [self threadTest];
});
    
//*********4、NSOperation*********
[[[NSOperationQueue alloc] init] addOperationWithBlock:^{
    [self threadTest];
}];

- (void)threadTest{
    NSLog(@"begin");
    NSInteger count = 1000 * 100;
    for (NSInteger i = 0; i < count; i++) {
        // 栈区
        NSInteger num = i;
        // 常量区
        NSString *name = @"zhang";
        // 堆区
        NSString *myName = [NSString stringWithFormat:@"%@ - %zd", name, num];
        NSLog(@"%@", myName);
    }
    NSLog(@"over");
}

void *pthreadTest(void *para){
    // 接 C 语言的字符串
    //    NSLog(@"===> %@ %s", [NSThread currentThread], para);
    // __bridge 将 C 语言的类型桥接到 OC 的类型
    NSString *name = (__bridge NSString *)(para);
    
    NSLog(@"===>%@ %@", [NSThread currentThread], name);
    
    return NULL;
}

拓展 C与OC的桥接

  • __bridge只做类型转换,但是不修改对象(内存)管理权
  • __bridge_retained(也可以使用CFBridgingRetain)将Objective-C的对象转换为 Core Foundation的对象,同时将对象(内存)的管理权交给我们,后续需要使用 CFRelease或者相关方法来释放对象
  • __bridge_transfer(也可以使用CFBridgingRelease)将Core Foundation的对象 转换为Objective-C的对象,同时将对象(内存)的管理权交给ARC。

7 线程安全问题

当多个线程同时访问一块资源时,容易引发数据错乱和数据安全问题,以下两种解决方案为例子介绍

  • 互斥锁(即同步锁):@synchronized
  • 自旋锁

7.1 互斥锁

  • 用于保护临界区,确保同一时间,只有一条线程能够执行
  • 如果代码中只有一个地方需要加锁,大多都使用self,这样可以避免单独再创建一个锁对象
  • 加了互斥锁的代码,当新线程访问时,如果发现其他线程正在执行锁定的代码,新线程就会进入休眠

针对互斥锁,还需要注意以下几点:

  • 互斥锁的锁定范围,应该尽量小,锁定范围越大,效率越差
  • 能够加锁的任意 NSObject 对象
  • 锁对象一定要保证所有的线程都能够访问

7.2 自旋锁

  • 自旋锁与互斥锁类似,但它不是通过休眠使线程阻塞,而是在获取锁之前一直处于忙等(即原地打转,称为自旋)阻塞状态
  • 使用场景:锁持有的时间短,且线程不希望在重新调度上花太多成本时,就需要使用自旋锁,属性修饰符atomic,本身就有一把自旋锁
  • 加入了自旋锁,当新线程访问代码时,如果发现有其他线程正在锁定代码,新线程会用死循环的方法,一直等待锁定的代码执行完成,即不停的尝试执行代码,比较消耗性能

Q & A 自旋锁 vs 互斥锁

  • 相同:
    • 在同一时间,保证了只有一条线程执行任务,即保证了相应同步的功能
  • 不同:
    • 互斥锁:发现其他线程执行,当前线程休眠(即就绪状态),进入等待执行,即挂起。一直等其他线程打开之后,然后唤醒执行
    • 自旋锁:发现其他线程执行,当前线程一直询问(即一直访问),处于忙等状态,耗费的性能比较高
  • 场景:根据任务复杂度区分,使用不同的锁,但判断不全时,更多是使用互斥锁去处理
    • 当前的任务状态比较短小精悍时,用自旋锁
    • 反之的,用互斥锁

7.3 atomic 原子锁 & nonatomic 非原子锁

atomic 和 nonatomic主要用于属性的修饰,以下是相关的一些说明:

  • atomic是原子属性,是为多线程开发准备的,是默认属性!

    • 仅仅在属性的 setter方法中,增加了锁(自旋锁),能够保证同一时间,只有一条线程对属性进行写操作
    • 同一时间 单(线程)写多(线程)读的线程处理技术
    • Mac开发中常用
  • nonatomic 是非原子属性

    • 没有锁!性能高!
    • 移动端开发常用

atomic与nonatomic 的区别

  • nonatomic
    • 非原子属性
    • 非线程安全,适合内存小的移动设备
  • atomic
    • 原子属性(线程安全),针对多线程设计的,默认值
    • 保证同一时间只有一个线程能够写入(但是同一个时间多个线程都可以取值)
    • atomic 本身就有一把锁(自旋锁) 单写多读:单个线程写入,多个线程可以读取

建议

  • 所有属性都声明为 nonatomic
  • 尽量避免多线程抢夺同一块资源 尽量将加锁、资源抢夺的业务逻辑交给服务器端处理,减小移动客户端的压力

8 线程间通讯

Threading Programming Guide文档中,提及,线程间的通讯有以下几种方式 此处输入图片的描述

  • 直接消息传递: 通过performSelector的一系列方法,可以实现由某一线程指定在另外的线程上执行任务。因为任务的执行上下文是目标线程,这种方式发送的消息将会自动的被序列化
  • 全局变量、共享内存块和对象: 在两个线程之间传递信息的另一种简单方法是使用全局变量,共享对象或共享内存块。尽管共享变量既快速又简单,但是它们比直接消息传递更脆弱。必须使用锁或其他同步机制仔细保护共享变量,以确保代码的正确性。 否则可能会导致竞争状况,数据损坏或崩溃。
  • 条件执行: 条件是一种同步工具,可用于控制线程何时执行代码的特定部分。您可以将条件视为关守,让线程仅在满足指定条件时运行。
  • Runloop sources: 一个自定义的 Runloop source 配置可以让一个线程上收到特定的应用程序消息。由于 Runloop source 是事件驱动的,因此在无事可做时,线程会自动进入睡眠状态,从而提高了线程的效率
  • Ports and sockets:基于端口的通信是在两个线程之间进行通信的一种更为复杂的方法,但它也是一种非常可靠的技术。更重要的是,端口和套接字可用于与外部实体(例如其他进程和服务)进行通信。为了提高效率,使用 Runloop source 来实现端口,因此当端口上没有数据等待时,线程将进入睡眠状态。需要注意的是,端口通讯需要将端口加入到主线程的Runloop中,否则不会走到端口回调方法
  • 消息队列: 传统的多处理服务定义了先进先出(FIFO)队列抽象,用于管理传入和传出数据。尽管消息队列既简单又方便,但是它们不如其他一些通信技术高效
  • Cocoa 分布式对象: 分布式对象是一种 Cocoa 技术,可提供基于端口的通信的高级实现。尽管可以将这种技术用于线程间通信,但是强烈建议不要这样做,因为它会产生大量开销。分布式对象更适合与其他进程进行通信,尽管在这些进程之间进行事务的开销也很高

9 线程和 Runloop的关系

  • runloop与线程是⼀⼀对应的,⼀个runloop对应⼀个核⼼的线程,为什么说是核⼼的,是因为runloop是可以嵌套的,但是核⼼的只能有⼀个,他们的关系保存在⼀个全局的字典⾥。
  • runloop是来管理线程的,当线程的runloop被开启后,线程会在执⾏完任务后进⼊休眠状态,有了任务就会被唤醒去执⾏任务。
  • runloop在第⼀次获取时被创建,在线程结束时被销毁。
  • 对于主线程来说,runloop在程序⼀启动就默认创建好了。
  • 对于⼦线程来说,runloop是懒加载的,只有当我们使⽤的时候才会创建,所以在⼦线程⽤定时器要注意:确保⼦线程的runloop被创建,不然定时器不会回调。