并发编程的理论基石

·  阅读 469

一、进程和线程

1.操作系统、进程、线程的关系

操作系统是包含多个进程的容器,而每个进程又是容纳多个线程的容器。

2.Oracle 官方定义

官方定义

  • 进程:使用 fork(2) 系统调用创建的UNIX 环境(例如文件描述符,用户 ID 等),它被设置为运行程序。
  • 线程:在进程上下文执行的一系列指令。

3.什么是进程

  • 进程(Process)是程序的运行实例。
  • 进程是程序向操作系统申请资源(如内存空间和文件句柄)的基本单位。

在用户下达运行程序的命令后,就会产生进程,任务管理器中的每一个应用都是一个进程。谷歌浏览器的每个标签页和插件都是一个进程。

4.什么是线程

线程是操作系统能够进行资源调度的最小单位,它被包含在进程之中,是进程中的实际运作单位,每个线程执行的都是进程代码的某个片段,特定的线程总是在执行特定的任务。

5.进程和线程的关系

5.1 起源不同

先有进程,后有线程。进程由于资源利用率、公平性和便利性诞生。处理器的速度往往比外设的速度快(键盘、鼠标等),为了提高 CPU 的利用率,诞生了线程,目的就是为了提高程序的执行效率。

5.2 概念不同

  • 进程是资源分配的最小单位。
  • 线程是程序执行的最小单位(线程是操作系统能够进行资源调度的最小单位,同个进程中的线程也可以被同时调度到多个 CPU 上运行),线程也被称为轻量级进程。

5.3 内存共享方式不同

  • 默认情况下,进程的内存无法与其他进程共享(进程间通信通过 IPC 进行)。
  • 线程共享由操作系统分配给其父进程的内存块。

5.4 拥有资源不同

  • 操作系统为各个独立执行的进程分配各种资源,包括内存,文件句柄以及安全证书等。
  • 线程会共享进程范围内的资源,例如内存句柄、文件句柄、进程用户 ID 以及进程组 ID 等。每个线程也有各自独立的资源,例如线程 ID、程序计数器、栈以及局部变量等。

5.5 数量不同

一个程序至少拥有一个进程,一个进程至少拥有一个线程。

5.6 开销不同

  • 线程的创建、终止时间比进程短。
  • 同一进程内的线程切换时间比进程短。
  • 同一进程的各个线程间共享内存和文件资源,可以不通过内核进行通信。

5.7 生命周期类似

进程和线程都包含就绪、运行、等待状态。

6.Java 和多线程的关系

Java 在设计之初就支持了多线程,而且 Java 中的线程会一对一映射到操作系统的内核线程中(实际的线程数量,不是虚拟线程)。除了我们启动的线程,还包括 JVM 自启动线程。

二、多线程

1.什么是多线程

1.1 概念

多线程是指单个进程中运行多个线程,如果一个程序允许运行两个或以上的线程,那么它就是多线程程序。

1.2 例子

  • 房间的例子
    • 客厅:公共空间
    • 厕所:锁
    • 独立房间:线程共享空间
    • 打扫卫生:线程合作
  • 火锅的例子
    • 大火锅一个人吃:单进程单线程
    • 大火锅多个人吃:单进程多线程

2. 使用多线程的原因

2.1 发挥多核处理器的强大能力

  • 充分发挥多核 CPU 的优势,提高处理器速度。
  • 避免无效等待(进行 I/O 操作时可以处理其他事情)。
  • 提升用户体验性,避免卡顿,缩短等待时间
    • 并行处理,提高性能,通常用于服务器(例如 Tomcat),用多个线程去处理接收的 HTTP 请求。
    • 在 Android 开发中,主线程的任务之一就是绘制屏幕, 主线程不允许进行IO 操作或网络请求,目的就是为了避免卡顿,影响用户的体验。

2.2 便于编程建模

将大的任务分割为多个小任务,分别建立程序模型,并通过多线程分别运行这几个任务。

2.3 计算机的性能定律

  • 摩尔定律失效

摩尔定律——当价格不变时,集成电路上可容纳的元器件的数目每个 18-24 个月就会翻一倍以上,性能也会提升一倍。

  • 阿姆达尔定律(Amdahl)登台

阿姆达尔定律:处理器越多,程序执行就越快,但有上限,取决于程序中串行部分的比例,并行的比例越高,多处理器的效果越明显。

最下面蓝色曲线,当并行的比例为 50% 时,最快速度可以提升2倍;最上面绿色曲线,当并行的比例为 95% 时,最快速度可以提升20倍。

3.多线程使用场景

  • 后台线程,如执行定时任务。
  • tomcat——每次有一个新的请求过来的时候,tomcat 会把这个请求交给一个新的线程去处理。
  • 多线程后台并行下载文件。

4.多线程的风险

4.1 安全性问题

当多个线程同时访问和修改相同的变量时,将会在串行编程模型中引入非串行因素,如 i++ 的数据错误。

4.2 活跃性问题

当某个操作无法继续执行下去的时候,就会发生活跃性问题,如死锁、饥饿以及活锁。

4.3 性能问题

在多线程程序中,当线程调度器临时挂起活跃线程并转而运行另一个线程时,就会频繁得出现上下文切换操作(Context Switch),这种操作会带来极大的开销:保存和恢复执行上下文,丢失局部性,并且 CPU 将更多的时间花在线程调度而不是线程运行上。当线程共享数据时,必须使用同步机制,而这些机制往往会抑制某些编译器优化,使内存缓冲区的数据无效,以及增加共享内存总线的同步流量。这些因素都将带来额外的性能开销。

三、串行、并行、并发

1.串行

串行是将多个任务按顺序排队执行,例如:听完音乐再写代码。

2.并行

真正的“同时”运行,在同一时刻有多个任务执行,需要多核处理器,因为单核处理器无法在同一时刻执行多个任务。例如:边听音乐边写代码。

3.并发

  • 两个或多个任务可以在重叠时间段内启动,运行和完成。
  • 并行(两个线程同时执行)一定是并发,并发并不一定是并行。
  • 例如一会儿听音乐,一会儿写代码,轮流执行。

4.高并发

4.1 概念

同时有很多个请求发送给服务器系统,服务器并行处理请求。

4.2 多线程和高并发

高并发是一种状态,多线程是高并发的一种重要解决方案,高并发并不意味着多线程。

4.3 高并发指标

  • QPS(Queries Per Second)
  • 带宽
  • PV (Page View)
  • UV(Unique Visitor)
  • 吞吐率(Requests Per Second)
  • 并发连接数(The number of concurrent connections)
  • 服务器平均请求等待时间(Time per request: across all concurrent requests)

五、同步、异步、阻塞、非阻塞

1.同步与异步

  • 同步和异步关注的是消息通信机制,这里指的是调用者的行为,表示请求是串行还是并行。
  • 同步(Synchronous):客户端发出一个请求后,一直等到服务端返回最终的结果。
  • 异步(Asynchronous):客户端发出一个请求后,还可以发出另外的请求,不用等待之前请求的结果返回。

2.阻塞与非阻塞

  • 阻塞非阻塞关注的程序在等待调用结果(消息,返回值)时的状态,强调状态。
  • 阻塞:客户端发起一个请求后,当前线程会被挂起,直到服务端返回结果。
  • 非阻塞:客户端发起一个请求后,不管服务器会不会立刻返回结果,当前线程都不会被挂起。

3.例子

水壶烧水的例子,有两种水壶,一种普通水壶,只能自己观察水是否烧开;一种带提醒的水壶,水烧开会有声音提醒。

  • 同步阻塞:用普通水壶烧水,一直等着该水壶的水烧开。
  • 同步非阻塞:用普通水壶烧水,然后去客厅看电视,时不时观察水烧开了没。
  • 异步阻塞:用带提醒的水壶烧水,一直等着该水壶的水烧开。
  • 异步非阻塞:用带提醒的水壶烧水,然后去玩手机,直到该水壶发出声音提醒。

《Java并发编程实战》

怎样理解阻塞非阻塞与同步异步的区别?

分类:
后端
标签:
分类:
后端
标签:
收藏成功!
已添加到「」, 点击更改