程序
- 是一组计算机能识别和执行的指令,运行于电子计算机上,满足人们某种需求的信息化工具
- 用于描述进程要完成的功能,是控制进程执行的指令集
进程
运行中的程序的一个副本,是被载入内存的一个指令集合,是资源分配的单位,
- 进程ID(Process ID,PID)号码被用来标记各个进程
- UID、GID语境决定对文件系统的存取和访问权限
- 通常从执行进程的用户来继承
- 存在生命周期
- 都由其父进程创建
进程的特征
- 动态性:进程是程序的一次执行过程,是临时的,有生命期的,是动态产生,动态消亡的;
- 并发性:任何进程都可以同其他进程一起并发执行;
- 独立性:进程是系统进行资源分配和调度的一个独立单位;
- 结构性:进程由程序、数据和进程控制块三部分组成。
进程的组成
进程一般由程序、数据集合和进程控制块三部分组成。
- 程序用于描述进程要完成的功能,是控制进程执行的指令集
- 数据集合是程序在执行时所需要的数据和工作区
- 程序控制块包含进程的描述信息和控制信息,是进程存在的唯一标志
僵尸进程
僵尸进程是当子进程比父进程先结束,而父进程又没有回收子进程,释放子进程占用的资源,此时子进程将成为一个僵尸进程。如果父进程先退出 ,子进程被init接管,子进程退出后init会回收其占用的相关资源。
在UNIX 系统中,一个进程结束了,但是他的父进程没有等待(调用wait / waitpid)他, 那么他将变成一个僵尸进程。 但是如果该进程的父进程已经先结束了,那么该进程就不会变成僵尸进程, 因为每个进程结束的时候,系统都会扫描当前系统中所运行的所有进程, 看有没有哪个进程是刚刚结束的这个进程的子进程,如果是的话,就由init 来接管他,成为他的父进程。
进程使用内存出现的问题
内存泄漏:Memory Leak
指程序中用malloc或new申请了一块内存,但是没有用free或delete将内存释放,导致这块内存一直处于占用状态
内存溢出:Memory Overflow
指程序申请了10M的空间,但是在这个空间写入10M以上字节的数据,就是溢出,类似红杏出墙
内存不足:OOM
OOM 即 Out Of Memory,“内存用完了”,在情况在java程序中比较常见。系统会选一个进程将之杀死,
进程状态
- 创建状态:进程在创建时需要申请一个空白PCB(process control block进程控制块),向其中填写控制和管理进程的信息,完成资源分配。如果创建工作无法完成,比如资源无法满足,就无法被调度运行,把此时进程所处状态称为创建状态
- 就绪状态:进程已准备好,已分配到所需资源,只要分配到CPU就能够立即运行
- 执行状态:进程处于就绪状态被调度后,进程进入执行状态
- 阻塞状态:正在执行的进程由于某些事件(I/O请求,申请缓存区失败)而暂时无法运行,进程受到阻塞。在满足请求时进入就绪状态等待系统调用
- 终止状态:进程结束,或出现错误,或被系统终止,进入终止状态。无法再执行
线程
在早期的操作系统中并没有线程的概念,进程是能拥有资源和独立运行的最小单位,也是程序执行的最小单位。
任务调度采用的是时间片轮转的抢占式调度方式,而进程是任务调度的最小单位,每个进程有各自独立的一块内存,使得各个进程之间内存地址相互隔离。
后来,随着计算机的发展,对CPU的要求越来越高,进程之间的切换开销较大,已经无法满足越来越复杂的程序的要求了。于是就发明了线程。
线程是程序执行中一个单一的顺序控制流程,是程序执行流的最小单元,是处理器调度和分派的基本单位。一个进程可以有一个或多个线程,各个线程之间共享程序的内存空间(也就是所在进程的内存空间)。
一个标准的线程由线程ID、当前指令指针(PC)、寄存器和堆栈组成。而进程由内存空间(代码、数据、进程空间、打开的文件)和一个或多个线程组成。
如何确定程序是多线程还是单线程
pstree
grep -i threads /proc/进程的PID/status
prtstat 进程pid号
进程与线程的区别
- 线程是程序执行的最小单位,而进程是操作系统分配资源的最小单位
- 一个进程由一个或多个线程组成,线程是一个进程中代码的不同执行路线
- 进程之间相互独立,但同一进程下的各个线程之间共享程序的内存空间(包括代码段、数据集、堆等)及一些进程级的资源(如打开文件和信号),某进程内的线程在其它进程不可见
- 调度和切换:线程上下文切换比进程上下文切换要快得多
PS
ps 即 process state,可以查看进程当前状态的快照,默认显示当前终端中的进程,Linux系统各进程的相关信息均保存在/proc/数字 目录/status 下的文件中
ps命令支持三种语法格式:
- UNIX风格。选项可以组合在一起,并且选项前必须有 "-" 连字符 。如:ps -ef
- GNU选项。选项前有两个 "-" 连字符 。如:ps --help
- BSD选项。选项可以组合在一起,但是选项前不能有 "-" 连字符。如:ps aux
例:
-
"ps aux" 可以查看系统中所有的进程; -
"ps -le" 可以查看系统中所有的进程,而且还能看到进程的父进程的 PID 和进程优先级; -
"ps -l" 只能看到当前 Shell 产生的进程。
| 常用选项 | 作用 |
|---|---|
| a | 显示当前终端下的所有进程信息,包括其他用户的进程。与“x”选项结合时将示系统中所有的进程信息 |
| u | 使用以用户为主的格式输出进程信息 |
| x | 显示当前用户在所有终端下的进程信息 |
| -e | 显示系统内的所有进程信息 |
| -l | 使用长(Long)格式显示进程信息 |
| -f | 使用完整的(Full)格式显示进程信 |
| k管道符--sort | 属性 对属性排序,属性前加 - 表示倒序 ps aux k -%cpu |
| o | 属性… 选项显示定制的信息 pid、cmd、%cpu、%mem |
ps -le
使用“ps -le”命令查看进程信息:
| 表头 | 含义 |
|---|---|
| F | 进程标志,说明进程的权限,常见的标志有两个: 1:进程可以被复制,但是不能被执行; 4:进程使用超级用户权限 |
| S | 进程状态。具体的状态和"psaux"命令中的 STAT 状态一致 |
| UID | 运行此进程的用户的 ID |
| PID | 进程的 ID |
| PPID | 父进程的 ID |
| C | 该进程的 CPU 使用率,单位是百分比 |
| PRI | 进程的优先级,数值越小,该进程的优先级越高,越早被 CPU 执行;系统定义不可以人为修改 |
| NI | 进程的优先级,数值越小,该进程越早被执行;可以人为修改 |
| ADDR | 该进程在内存的哪个位置 |
| SZ | 该进程占用多大内存 |
| WCHAN | 该进程是否运行。"-"代表正在运行 |
| TTY | 该进程由哪个终端产生 |
| TIME | 该进程占用 CPU 的运算时间,注意不是系统时间 |
| CMD | 产生此进程的命令名 |
查看进程的特定属性
ps axo
top命令
ps 命令可以一次性给出当前系统中进程状态,但使用此方式得到的信息缺乏时效性,并且,如果管理员需要实时监控进程运行情况,就必须不停地执行 ps 命令,这显然是缺乏效率的。
为此,Linux 提供了 top 命令。top 命令可以动态地持续监听进程地运行状态,与此同时,该命令还提供了一个交互界面,用户可以根据需要,人性化地定制自己的输出,进而更清楚地了进程的运行状态。
| 选项 | 效果 |
|---|---|
| -d | 秒数:指定 top 命令每隔几秒更新。默认是 3 秒。 |
| -b | 使用批次处理模式输出。一般和"-n"选项合用,用于把 top 命令重定向到文件中。 |
| -n | 次数:指定 top 命令执行的次数。一般和"-"选项合用。 |
| -p | 进程PID:仅查看指定 ID 的进程。 |
| -s | 使 top 命令在安全模式中运行,避免在交互模式中出现错误。 |
| -u | 用户名:只监听某个用户的进程。 |
在 top 命令的显示窗口中,可使用如下按键,进行交互操作:
| 选项 | 效果 |
|---|---|
| ? 或 h | 显示交互模式的帮助。 |
| c | 按照 CPU 的使用率排序,默认就是此选项。 |
| M | 按照内存(memory)的使用率排序。 |
| N | 按照 PID 排序。 |
| T | 按照 CPU 的累积运算时间排序,也就是按照 TIME+ 项排序。 |
| k | 按照 PID 给予某个进程一个信号。一般用于中止某个进程,信号 9 是强制中止的信号。 |
| r | 按照 PID 给某个进程重设优先级(Nice)值。 |
| q | 退出 top 命令。 |
| z | 彩色显示 |
| F | 通过光标设置字段是否展示,以及展示顺序。 |
第一部分
第一行为任务队列信息,具体内容如表 所示。
| 内 容 | 说 明 |
|---|---|
| 17:46:38 | 系统当前时间 |
| up 2:03 | 系统的运行时间.本机已经运行2小时3 分钟 |
| 1 users | 当前登录了一个用户 |
| load average: 0.00,0.00,0.00 | 系统在之前 1 分钟、5 分钟、15 分钟的平均负载。如果 CPU 是单核的,则这个数值超过 1 就是高负载:如果 CPU 是四核的,则这个数值超过 4 就是高负载 (这个平均负载完全是依据个人经验来进行判断的,一般认为不应该超过服务器 CPU 的核数) |
第二行为进程信息,具体内容如表
| 内 容 | 说 明 |
|---|---|
| Tasks: 158 total | 系统中的进程总数 |
| 1 running | 正在运行的进程数 |
| 157 sleeping | 睡眠的进程数 |
| 0 stopped | 正在停止的进程数 |
| 0 zombie | 僵尸进程数。如果不是 0,则需要手工检查僵尸进程 |
第三行为 CPU 信息,具体内容如表
| 内 容 | 说 明 |
|---|---|
| Cpu(s): 0.1 %us | 用户模式占用的 CPU 百分比 个人用户开启的进程占用的 cpu 率 |
| 0.1%sy | 系统模式占用的 CPU 百分比 |
| 0.0%ni | 改变过优先级的用户进程占用的 CPU 百分比 |
| 99.7%id | 空闲 CPU 占用的 CPU 百分比 |
| 0.1%wa | 等待输入/输出的进程占用的 CPU 百分比 1 |
| 0.0%hi | 硬中断请求服务占用的 CPU 百分比 |
| 0.1%si | 软中断请求服务占用的 CPU 百分比 |
| 0.0%st | st(steal time)意为虚拟程序占用 cpu 时间百分比,就是当有虚拟机时,虚拟 CPU 等待实际 CPU 的时间百分比 |
第四行为物理内存信息,具体内容如表buff cache
| 内 容 | 说 明 |
|---|---|
| Mem: 625344k total | 物理内存的总量,单位为KB |
| 571504k used | 己经使用的物理内存数量 |
| 53840k&ee | 空闲的物理内存数量。我们使用的是虚拟机,共分配了 628MB内存,所以只有53MB的空闲内存 |
| 65800k buffers | 作为缓冲的内存数量 |
第五行为交换分区(swap)信息,如表
| 内 容 | 说 明 |
|---|---|
| Swap: 524280k total | 交换分区(虚拟内存)的总大小 |
| Ok used | 已经使用的交换分区的大小 |
| 524280k free | 空闲交换分区的大小 |
| 409280k cached | 作为缓存的交换分区的大小 |
通过 top 命令的第一部分就可以判断服务器的健康状态。如果 1 分钟、5 分钟、15 分钟的平均负载高于 1,则证明系统压力较大。如果 CPU 的使用率过高或空闲率过低,则证明系统压力较大。如果物理内存的空闲内存过小,则也证明系统压力较大。
这时,我们就应该判断是什么进程占用了系统资源。如果是不必要的进程,就应该结束这些进程;如果是必需进程,那么我们该増加服务器资源(比如増加虚拟机内存),或者建立集群服务器。
缓冲(buffer)和缓存(cache)的区别:
- 缓存(cache)是在读取硬盘中的数据时,把最常用的数据保存在内存的缓存区中,再次读取该数据时,就不去硬盘中读取了,而在缓存中读取。
- 缓冲(buffer)是在向硬盘写入数据时,先把数据放入缓冲区,然后再一起向硬盘写入,把分散的写操作集中进行,减少磁盘碎片和硬盘的反复寻道,从而提高系统性能。
简单来说,缓存(cache)是用来加速数据从硬盘中"读取"的,而缓冲(buffer)是用来加速数据"写入"硬盘的。
第二部分
top 命令的第二部分输出,主要是系统进程信息,各个字段的含义如下:
| 表头 | 说明 |
|---|---|
| PID | 进程的ID号 |
| USER | 该进程所属的用户 |
| PRpriority | 优先级,数值越小 优先级越高 |
| NInice | 优先级,数值越小 优先级越高 |
| VIRT | 该进程使用的虚拟内存的大小,单位为 KB |
| RES | 该进程使用的物理内存的大小,单位为 KB |
| SHR | 共享内存大小,单位为 KB |
| S | 进程状态 |
| %CPU | 该进程占用 CPU 的百分比 |
| %MEM | 该进程占用内存的百分比 |
| TIME+ | 该进程总共占用的 CPU 时间 |
| COMMAND | 进程的命令名(进程文件、进程名称) |
pgrep命令
根据特定条件查询进程的PID信息。
| 选项 | 作用 |
|---|---|
| -U | 指定用户 |
| -l | 显示进程名 |
| -a | 显示完整格式的进程名 |
| -P < PID> | 显示指定进程的子进程 |
prtstat命令
查看指定的进程
| 常用 | 选项 |
|---|---|
| -r | 格式显示(raw) |
pstree命令
以树形结构列出进程信息
| 常用选项 | 作用 |
|---|---|
| -a | 显示启动每个进程对应的完整指令,包括启动进程的路径、参数等。 |
| -p | 显示PID。 |
| -p < pid> | 显示指定进程及其子进程,同时显示每个进程的PID。 |
| -u | 显示进程的用户名称。 |
| -u 用户名 | 显示指定用户的进程。 |
| -H < pid> | 高亮显示指定进程及其前辈进程。 |
| -T | 不显示线程thread,默认显示线程。 |
vmstat命令
监控系统资源
如果想动态地了解一下系统资源的使用状况,以及查看当前系统中到底是哪个环节最占用系统资源,就可以使用 vmstat 命令。
vmstat命令,是 Virtual Meomory Statistics(虚拟内存统计)的缩写,可用来监控 CPU 使用、进程状态、内存使用、虚拟内存使用、硬盘输入/输出状态等信息。
vmstat 几秒刷新 刷新几次
| 字段 | 含义 |
|---|---|
| procs | 进程信息字段: -r:等待运行的进程数,数量越大,系统越繁忙。 -b:不可被唤醒的进程数量,数量越大,系统越繁忙。 |
| memory | 内存信息字段: -swpd:虚拟内存的使用情况,单位为 KB。 -free:空闲的内存容量,单位为 KB。-buff:缓冲的内存容量,单位为 KB。-cache:缓存的内存容量,单位为 KB。 |
| swap | 交换分区信息字段: -si:从磁盘中交换到内存中数据的数量,单位为 KB。 -so:从内存中交换到磁盘中数据的数量,单位为 KB。这两个数越大,表明数据需要经常在磁盘和内存之间进行交换,系统性能越差。 |
| io | 磁盘读/写信息字段: -bi:从块设备中读入的数据的总量,单位是块。 -bo:写到块设备的数据的总量,单位是块。这两个数越大,代表系统的 I/O 越繁忙。 |
| system | 系统信息字段: -in:每秒被中断的进程次数。 -cs:每秒进行的事件切换次数。这两个数越大,代表系统与接口设备的通信越繁忙。 |
| cpu | CPU信息字段: -us:非内核进程消耗 CPU 运算时间的百分比。 -sy:内核进程消耗 CPU 运算时间的百分比。 -id:空闲 CPU 的百分比。 -wa:等待 I/O 所消耗的 CPU 百分比。 -st:被虚拟机所盗用的 CPU 百分比 |
| 选项 | 含义 |
|---|---|
| -f | 显示从启动到目前为止,系统复制(fork)的程序数。此信息是从 /proc/stat 中的 processes 字段中取得的 |
| -s | 将从启动到目前为止,由一些事件导致的内存变化情况列表说明。这些信息的分别来自于/proc/meminfo,/proc/stat和/proc/vmstat |
| -S | 单位令输出的数据显示单位,例如用 K/M 取代 bytes 的容量 |
| -d | 列出硬盘有关读写总量的统计表 |
| -p | 分区设备文件名查看硬盘分区的读写情况 |
free
查看内存
- free -h
- free -m #以m为单位查看
iostat
iostat 可以提供更丰富的IO性能状态数据
| 常用选项 | 含义 |
|---|---|
| -c | 只显示CPU行 |
| -d | 显示设备〈磁盘)使用状态 |
| -k | 以千字节为为单位显示输出 |
| -t | 在输出中包括时间戳 |
| -x | 在输出中包括扩展的磁盘指标 |
kill
kill 从字面来看,就是用来杀死进程的命令,但事实上,这个或多或少带有一定的误导性。从本质上讲,kill 命令只是用来向进程发送一个信号,至于这个信号是什么,是用户指定的。
kill 命令的执行原理是这样的,kill 命令会向操作系统内核发送一个信号(多是终止信号)和目标进程的 PID,然后系统内核根据收到的信号类型,对指定进程进行相应的操作。
kill [信号] PID
| 信号编号 | 信号名 | 含义 |
|---|---|---|
| 0 | EXIT | 程序退出时收到该信息。 |
| 1 | HUP | 挂掉电话线或终端连接的挂起信号,这个信号也会造成某些进程在没有终止的情况下重新初始化。 |
| 2 | INT | 表示结束进程,但并不是强制性的,常用的 "Ctrl+C" 组合键发出就是一个 kill -2 的信号。 |
| 3 | QUIT | 退出。 |
| 9 | KILL | 杀死进程,即强制结束进程。 |
| 11 | SEGV | 段错误。 |
| 15 | TERM | 正常结束进程,是 kill 命令的默认信号。 |
killall命令
killall 也是用于关闭进程的一个命令,但和 kill 不同的是,killall 命令不再依靠 PID 来杀死单个进程,而是通过程序的进程名来杀死一类进程,也正是由于这一点,该命令常与 ps、pstree 等命令配合使用。
killall [选项] [信号] 进程名