Linux系统编程——线程(一)进程和线程的区别、线程的优点、以及线程开发的API

156 阅读4分钟

进程和线程

进程是程序执行时的一个实例,是担当分配系统资源(CPU时间、内存等)的基本单位。

进程本身不是基本运行单位,而是线程的容器。程序本身只是指令、进程才是程序(那些指令和数据)的真正运行实例。

线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。

一个线程指的是进程中一个单一顺序的控制流,一个进程中可以有多个线程,每个线程执行不同的任务。线程包括进程中表示线程的线程ID、寄存器值、栈、调度优先级、信号屏蔽字、errno常量以及线程私有数据。进程的所有信息对该进程的所有线程都是共享的,包括可执行的程序文本、程序的全局内存和堆内存、栈以及文件描述符。在Unix和中线程也被称为轻量级进程(lightweight processes),但轻量级进程更多指的是内核线程(kernel thread),而把用户线程(user thread)称为线程。

“进程——资源分配的最小单位,线程——程序执行的最小单位”

进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其它进程产生影响,而线程只是一个进程中的不同执行路径。

线程有自己的堆栈和局部变量,但线程没有单独的地址空间,一个线程死掉就等于整个进程死掉,所以多进程的程序要比多线程的程序健壮,但在进程切换时,耗费资源较大,效率要差一些。

对于一些要求同时进行并且又要共享某些变量的并发操作,只能用线程,不能用进程。

总的来说就是:进程有独立的地址空间,线程没有单独的地址空间(同一进程内的线程共享进程的地址空间)。

使用多线程的理由

理由1: 和进程相比,它是一种非常"节俭"的多任务操作方式。

在Linux系统下,一个新的进程必须分配独立的地址空间,建立众多的数据表来维护它的代码段、堆栈段和数据段,这是一种"昂贵"的多任务工作方式。而运行于一个进程中的多个线程,它们彼此之间使用相同的地址空间,共享大部分数据启动一个线程所花费的空间远远小于启动一个进程所花费的空间,而且,线程间彼此切换所需的时间也远远小于进程间切换所需要的时间

理由二: 线程间方便的通信机制。

进程具有独立的数据空间,要进行数据的传递只能通过通信的方式进行,这种方式很不方便。由于同一进程下的线程之间共享数据空间,所以一个线程的数据可以直接为其它线程所用,当然,数据的共享也带来其他一些问题,比如有的变量不能同时被两个线程所修改,有的子程序中声明为static的数据,这正是编写多线程程序时最需要注意的地方。

不和进程比较,多线程程序还有以下的优点:

1、提高应用程序响应。当一个操作耗时很长时,整个系统都会等待这个操作,此时程序不会响应外部设备,而使用多线程技术,将耗时长的操作(time consuming)置于一个新的线程,避免这种情况。

2、使多CPU系统更加有效。不同的线程运行于不同的CPU上。

3、改善程序的结构。复杂的进程可以分为多个线程。

Linux线程开发API

多线程开发在 Linux 平台上已经有成熟的 pthread 库支持。其涉及的多线程开发的最基本概念主要包含三点:线程,互斥锁,条件

线程操作又分线程的创建,退出,等待 3 种。

互斥锁则包括 4 种操作,分别是创建,销毁,加锁和解锁。

条件操作有 5 种操作:创建,销毁,触发,广播和等待。

具体如下表
在这里插入图片描述
参考文献