【多线程】基础理论知识

585 阅读8分钟

上一个系列是SpringCloud入门系列,以后肯定会写一期进阶系列,但是目前更新的是多线程系列。

多线程的重要性不用多说,高并发在现在的生活无处不在。618,双11,12306,支持的并发量那都不知道是多大,说再多遍也不嫌多,是非常非常非常倾佩这些团队的。

本篇文章重点是带大家了解下进程和线程方面的基础理论知识,涉及到的概念都是简单但是又很实用的,一些可能没涉及到的概念也会在后面的文章中写出来。

进程

进程的简单概念

在进程模型中,计算机所有可运行的软件,通常也包括操作系统,被组织成若干顺序进程,简称进程(process),一个进程就是一个正在执行程序的示例。

大白话来说,一个进程就相当于我们启动的项目,或者说打开任务管理器的时候看到的这些应用都是进程。一个进程主要包括程序计数器、寄存器和变量的当前值

这里还需要讲下的一个概念就是守护进程

停留在后台处理的进程称之为守护进程。

进程的状态

进程的状态有三个状态,就绪、运行、阻塞。就绪就是能运行,但是还没运行,CPU被其它进程占用了;运行就是该时刻进程已经实际占用CPU在运行了;阻塞基本上等于暂停了,除非有外界因素干扰,不然该进程就不能运行了。

拿做核酸来讲,医护人员就是CPU,正在做核酸的人就是运行态,在后面排队的就是就绪态,没有人逼他自己不想做根本没有来排队就是阻塞态。

值得注意的是,这三种状态是可以互相转换

  • 运行 》》 阻塞: 当系统发现进程无法再运行下去的时候,或者认为终止进程后就会发生该转换。
  • 运行 《 》 就绪: 这两个转换大多数时候是一体的,主要是由系统进程调度程序决定的,进程对于调度的变化基本上是感知不到的。当系统认为这个进程已经长时间占用CPU了,那么会根据一定的算法 重新分配CPU的时间片,此时就会伴随着状态的转变。
  • 阻塞 》》就绪: 当进程等待的一个外部事件发生时就会发生次转换,通俗就是,比如大规模核酸检测,社区上门提醒,就会去排队。

进程间的通信方式

进程间的通信方式有8种,但是忘记在哪本书上看到的这8种的概念,网上虽然有解释,但是不太权威,就没写出来,各位小伙伴暂时就先了解下是哪8种即可。

无名管道,有名管道,高级管道,消息队列,信号量,信号,共享内存和套接字。

线程

线程基本概念

对于线程,查了很久也没有一个明确的概念,甚至再《现代操作系统中》也是模糊的概念,迷你进程(称为线程)。

用Java程序通俗的来说呢,就是一个程序就是一个进程,然后main方法就是该进程的主线程,然后在之后我们会创建多个线程。

我们知道,每个进程都有一个地址空间和一个控制线程,这里的主线程是不是控制线程有待考量。

线程的状态

相较于进程而言,线程的状态有五种。

  • New: new是指新建了一个线程,但是还未启动。对应到代码就是只是new了一个Thread后,该线程就处于新建状态,此时仅由JVM为其分配内存,并初始化其成员变量的值

  • Runnable: 当线程调用了start()方法后,该线程就处于就绪状态,在等待cpu时间片。在虚拟机的表现就是Java虚拟机会为其创建方法调用栈和程序计数器,等待调度运行

  • Running: 顾名思义就是程序处于运行状态,对应到代码就是处于就绪状态的线程获得了CPU,开始执行run()方法的线程执行体,则该线程处于运行状态。

  • Blocked: 就是我们经常听到的阻塞状态,是指线程因为某种原因放弃了cpu使用权,即让出了cpu timeslice(时间片),暂时停止运行。这种状态会一直维持到线程进入可运行(runnable)状态,才有机会再次获取到cpu时间片,从而再次转到运行(running)状态

  • Dead: 线程结束后的状态就是死亡状态

对于阻塞状态而言,分为3种:

  • 等待阻塞: 运行中的线程中的线程调用了object.wait()方法,JVM会把该线程放入等待队列中,使得本线程进入阻塞状态。

  • 同步阻塞: 运行中线程在获取对象的同步锁时,若该同步锁被别的线程占用,大白话就是说拿不到锁,JVM会把该线程放入锁池(lock pool)中。

  • 其它阻塞: 运行中的线程执行Thread.sleep(long ms)后者t.join()方法,亦或是发出了I/O请求时,JVM会把线程置为阻塞状态。当sleep()状态超时、join()等待线程终止或者超时、或者I/O处理完毕时,线程重新转入可运行(runnable)状态。

对于线程的Dead状态而言,方式有以下三种:

  • 正常结束,就是run()或者call()方法执行完成
  • 异常结束,线程在运行的过程中抛出一个未捕获的Exception或Error
  • 调用stop()方法,直接调用该线程的stop()方法来结束线程,但是这种方法容易导致死锁,所以一般不建议使用

线程间的通信方式

线程间的通信方式主要是由3种方式,共享内存、消息传递和管道流。

  • 共享内存:java里面一般是使用volatile共享内存
  • 消息传递:java里面会使用的方式如wait/notify , join 等方法。
  • 管道流:管道输入/输出流的形式

其它

进程和线程的区别

多进程就是操作系统中同时运行的多个程序,多线程在同一个进程中同时运行的多个任务。

根本区别:进程是操作系统资源分配的基本单位,而线程是处理器任务调度和执行的基本单位

资源开销:每个进程都有独立的代码和数据空间(程序上下文),程序之间的切换会有较大的开销;线程可以看做轻量级的进程,同一类线程共享代码和数据空间,每个线程都有自己独立的运行栈和程序计数器(PC),线程之间切换的开销小。

包含关系:如果一个进程内有多个线程,则执行过程不是一条线的,而是多条线(线程)共同完成的;线程是进程的一部分,所以线程也被称为轻权进程或者轻量级进程。

内存分配:同一进程的线程共享本进程的地址空间和资源,而进程之间的地址空间和资源是相互独立的

影响关系:一个进程崩溃后,在保护模式下不会对其他进程产生影响,但是一个线程崩溃整个进程都死掉。所以多进程要比多线程健壮。

执行过程:每个独立的进程有程序运行的入口、顺序执行序列和程序出口。但是线程不能独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制,两者均可并发执行

线程不安全

在《Java并发编程实战》中有这么一句话

当多个线程访问一个类时,如果不用考虑这些线程在运行时环境下的调度和交替进行,并且不需要额外的同步及调用方代码不必作其它的协调,这个类的行为仍然是正确的,那么成这个类是线程安全的。

通俗一点来说,要想代码线程安全,其实就是保证状态的访问时不出错的,对象的状态一般情况下指的是数据。但是数据大多数情况都是共享可变的。

顾名思义,共享指的是线程之间是可以访问到这个变量,可变是是指数据的值是可以被更改的,不是写死的。

资源

什么是资源,在《现代操作系统》中的定义是

我们把这里需要排他性使用的对象称为资源。资源可以是硬件设备(如蓝光驱动器)或者是一组信息(如数据库中一个加锁的记录)......简单来说,资源就是随着时间的推移,必须能获得、使用以及释放的任何东西

对于这个资源,在java程序里面是锁呢,还是指的共享变量呢,我个人觉得更像是锁,不知道各位小伙伴怎么看。

并行和并发

并发是指同一个时间段内多个线程在执行任务,一般是交替执行;并行是指同一个时刻下多个线程同时工作。

在操作系统的层次来看,如果多个线程能同时被多个CPU执行,这样就是并行。并发是多个线程被一个CPU按照某一算法切换执行

创作不易,如果对你有帮助,欢迎点赞,收藏和分享啦!