内核的功用:进程管理、内存管理、文件系统、网络功能、驱动程序、安全功能等。
1 程序
1.1 什么是程序?
- 是一组计算机能识别和执行的指令,运行于电子计算机上,满足人们某种需求的信息化工具。
- 用于描述进程要完成的功能,是控制进程执行的指令集。
- 保存在硬盘、光盘等介质中的可执行代码和数据。
- 静态保存的代码。
2 进程
2.1 什么是进程
运行中的程序的一个副本,是被载入内存的一个指令集合,是资源分配的单位。
- 在CPU及内存中运行的程序代码
- 动态执行的代码
- 进程ID(Process ID,PID)号码被用来标记各个进程
- UID、GID、和SELinux语境决定对文件系统的存取和访问权限
- 通常从执行进程的用户来继承
- 存在生命周期
- 都由其父进程创建
进程是已启动的可执行程序的运行实例,进程有以下组成部分:
- 已分配内存的地址空间;
- 安全属性,包括所有权凭据和特权;
- 有权限限制;
- 程序代码的一个或多个执行线程;
父进程与子进程:
父进程复制自己的地址空间(fork派生)创建一个新的(子)进程结构。
每个进程分配一个唯一的进程ID(PID),满足跟踪安全性之需。
任何进程都可以创建子进程。
所有进程都是第一个系统进程的后代。
2.2 进程具有的特征
- 动态性:进程是程序的一次执行过程,是临时的,有生命期的,是动态产生,动态消亡的;
- 并发性:任何进程都可以同其他进程一起并发执行;
- 独立性:进程是系统进行资源分配和调度的一个独立单位;
- 结构性:进程由程序、数据和进程控制块三部分组成。
2.3 僵尸进程
僵尸进程是当子进程比父进程先结束,而父进程又没有回收子进程,释放子进程占用的资源,此时子进程将成为一个僵尸进程。如果父进程先退出 ,子进程被init接管,子进程退出后init会回收其占用的相关资源。
在UNIX 系统中,一个进程结束了,但是他的父进程没有等待(调用wait / waitpid)他, 那么他将变成一个僵尸进程。 但是如果该进程的父进程已经先结束了,那么该进程就不会变成僵尸进程, 因为每个进程结束的时候,系统都会扫描当前系统中所运行的所有进程, 看有没有哪个进程是刚刚结束的这个进程的子进程,如果是的话,就由init 来接管他,成为他的父进程。
2.4 线程
线程(英语:thread)是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。
60年代,在OS中能拥有资源和独立运行的基本单位是进程,然而随着计算机技术的发展,进程出现了很多弊端,一是由于进程是资源拥有者,创建、撤消与切换存在较大的时空开销,因此需要引入轻型进程;二是由于对称多处理机(SMP)出现,可以满足多个运行单位,而多个进程并行开销过大。因此在80年代,出现了能独立运行的基本单位——线程(Threads)。
查看进程有几个线程,可以使用 "cat /proc/PID/status"查看。
3 查看进程
3.1 ps命令——静态查看进程
ps 命令是 Process Status 的缩写 ,可以查看进程当前状态的快照。查看静态的进程统计信息,即执行 ps 命令的那个时刻的进程快照。默认显示当前终端中的进程,Linux系统各进程的相关信息均保存在/proc/PID 目录下的各文件中。
ps命令支持三种语法格式:
- UNIX风格。选项可以组合在一起,并且选项前必须有 "-" 连字符 。如:ps -ef。
- GNU选项。选项前有两个 "-" 连字符 。如:ps --help。
- BSD选项。选项可以组合在一起,但是选项前不能有 "-" 连字符。如:ps aux。
ps [option]...
常用选项
- a:显示当前终端下的所有进程信息,包括其他用户的进程。与“x”选项结合时将示系统中所有的进程信息。
- u:使用以用户为主的格式输出进程信息。
- x:显示当前用户在所有终端下的进程信息。
- -e:显示系统内的所有进程信息。
- -l:使用长(Long)格式显示进程信息。
- -f:使用完整的(Full)格式显示进程信
- k|--sort 属性:对属性排序,属性前加 - 表示降序排列。
举例说明:
- "ps aux" 可以查看系统中所有的进程;
- "ps -le" 可以查看系统中所有的进程,而且还能看到进程的父进程的 PID 和进程优先级;
- "ps -l" 只能看到当前 Shell 产生的进程。
3.1.1 ps aux
使用“ps aux”命令查看进程信息:
[root@localhost ~]# ps aux |head -5
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.2 125496 3988 ? Ss 17:06 0:01 /usr/lib/systemd/systemd --switched-root --system --deserialize 21
root 2 0.0 0.0 0 0 ? S 17:06 0:00 [kthreadd]
root 3 0.0 0.0 0 0 ? S 17:06 0:01 [ksoftirqd/0]
root 5 0.0 0.0 0 0 ? S< 17:06 0:00 [kworker/0:0H]
进程信息共有11个字段,每个字段含义如下:
| 表头(列名) | 含义 |
|---|---|
| USER | 该进程是由哪个用户产生的。 |
| PID | 进程的 ID。 |
| %CPU | 该进程占用 CPU 资源的百分比,占用的百分比越高,进程越耗费资源。 |
| %MEM | 该进程占用物理内存的百分比,占用的百分比越高,进程越耗费资源。 |
| VSZ | 该进程占用虚拟内存的大小,单位为 KB。 |
| RSS | 该进程占用实际物理内存的大小,单位为 KB。 |
| TTY | 该进程是在哪个终端运行的。 其中,tty1 ~ tty7 代表本地控制台终端(可以通过 Alt+F1 ~ F7 快捷键切换不同的终端),tty1~tty6 是本地的字符界面终端,tty7 是图形终端。 pts/0 ~ 255 代表虚拟终端,一般是远程连接的终端,第一个远程连接占用 pts/0,第二个远程连接占用 pts/1,依次増长。 |
| STAT | 进程状态。常见的状态有以下几种: -D:不可被唤醒的睡眠状态,通常用于 I/O 情况。 -R:该进程正在运行。 -S:该进程处于睡眠状态,可被唤醒。 -T:停止状态,可能是在后台暂停或进程处于除错状态。 -W:内存交互状态(从 2.6 内核开始无效)。 -X:死掉的进程(应该不会出现)。 -Z:僵尸进程。进程已经中止,但是还是占用硬件资源。 -<:高优先级(以下状态在 BSD 格式中出现)。 -N:低优先级。 -L:被锁入内存。 -s:包含子进程。 -l:多线程(小写 L)。 -+:进程位于后台。 |
| START | 该进程的启动时间。 |
| TIME | 该进程占用 CPU 的运算时间,注意不是系统时间。 |
| COMMAND | 产生此进程的命令名。 |
3.1.2 ps -le
使用“ps -le”命令查看进程信息:
[root@localhost ~]# ps -le|head -5
F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD
4 S 0 1 0 0 80 0 - 31374 ep_pol ? 00:00:01 systemd
1 S 0 2 0 0 80 0 - 0 kthrea ? 00:00:00 kthreadd
1 S 0 3 2 0 80 0 - 0 smpboo ? 00:00:01 ksoftirqd/0
1 S 0 5 2 0 60 -20 - 0 worker ? 00:00:00 kworker/0:0H
进程信息共有14个字段,每段含义如下:
| 表头(列名) | 含义 |
|---|---|
| F | 进程标志,说明进程的权限,常见的标志有两个: 1:进程可以被复制,但是不能被执行; 4:进程使用超级用户权限; |
| S | 进程状态。具体的状态和"psaux"命令中的 STAT 状态一致; |
| UID | 运行此进程的用户的 ID; |
| PID | 进程的 ID; |
| PPID | 父进程的 ID; |
| C | 该进程的 CPU 使用率,单位是百分比; |
| PRI | 进程的优先级,数值越小,该进程的优先级越高,越早被 CPU 执行;系统定义不可以人为修改 |
| NI | 进程的优先级,数值越小,该进程越早被执行;可以人为修改 |
| ADDR | 该进程在内存的哪个位置; |
| SZ | 该进程占用多大内存; |
| WCHAN | 该进程是否运行。"-"代表正在运行; |
| TTY | 该进程由哪个终端产生; |
| TIME | 该进程占用 CPU 的运算时间,注意不是系统时间; |
| CMD | 产生此进程的命令名; |
如果不想看到所有的进程,只想查看一下当前登录的终端产生了哪些进程,那只需使用 "ps -l" 命令就足够了。
3.1.3 自定义显示字段(查看进程的特定属性)
命令格式:
ps axo 列名,列名,列名...
ps -eo 列名,列名,列名...
示例:
1)查看进程的PID、PPID、%MEM、COMMAND四个属性
[root@localhost ~]# ps axo pid,ppid,%mem,command |head -5
PID PPID %MEM COMMAND
1 0 0.2 /usr/lib/systemd/systemd --switched-root --system --deserialize 21
2 0 0.0 [kthreadd]
3 2 0.0 [ksoftirqd/0]
5 2 0.0 [kworker/0:0H]
2)查看进程的USER、PID、PPID、%CPU、COMMAND五个属性
[root@localhost ~]# ps -eo user,pid,ppid,%cpu,command |head -5
USER PID PPID %CPU COMMAND
root 1 0 0.0 /usr/lib/systemd/systemd --switched-root --system --deserialize 21
root 2 0 0.0 [kthreadd]
root 3 2 0.0 [ksoftirqd/0]
root 5 2 0.0 [kworker/0:0H]
3.1.4 进程排序
命令格式:
ps aux --sort=列名(或-列名)
ps axo 列名,列名,列名... --sort=列名(或-列名)
ps -eo 列名,列名,列名... --sort=列名(或-列名)
#列名前加减号“-”,表示降序排列。不加减号,表示升序排列。
示例:
1)按CPU占比升序排列,ps aux --sort=%cpu。
[root@localhost ~]# ps aux --sort=%cpu |head -5
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.2 125496 3988 ? Ss 17:06 0:01 /usr/lib/systemd/systemd --switched-root --system --deserialize 21
root 2 0.0 0.0 0 0 ? S 17:06 0:00 [kthreadd]
root 3 0.0 0.0 0 0 ? S 17:06 0:01 [ksoftirqd/0]
root 5 0.0 0.0 0 0 ? S< 17:06 0:00 [kworker/0:0H]
2)按内存占比降序排列,ps aux --sort=-%mem。
[root@localhost ~]# ps aux --sort=-%mem |head -4
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
gdm 1579 0.0 6.2 1829132 116748 ? Sl 17:07 0:04 /usr/bin/gnome-shell
gdm 1643 0.0 1.1 1230884 21948 ? Sl 17:07 0:00 /usr/libexec/gnome-settings-daemon
root 1336 0.0 0.9 267920 16948 tty1 Ssl+ 17:07 0:00 /usr/bin/X :0 -background none -noreset -audit 4 -verbose -auth /run/gdm/auth-for-gdm-u0i80j/database -seat seat0 -nolisten tcp vt1
3.2 top命令——动态查看进程
ps 命令可以一次性给出当前系统中进程状态,但使用此方式得到的信息缺乏时效性,并且,如果管理员需要实时监控进程运行情况,就必须不停地执行 ps 命令,这显然是缺乏效率的。
为此,Linux 提供了 top 命令。top 命令可以动态地持续监听进程地运行状态,与此同时,该命令还提供了一个交互界面,用户可以根据需要,人性化地定制自己的输出,进而更清楚地了进程的运行状态。
选项:
- -d 秒数:指定 top 命令每隔几秒更新。默认是 3 秒。
- -b:使用批次处理模式输出。一般和"-n"选项合用,用于把 top 命令重定向到文件中。
- -n 次数:指定 top 命令执行的次数。一般和"-"选项合用。
- -p 进程PID:仅查看指定 ID 的进程。
- -s:使 top 命令在安全模式中运行,避免在交互模式中出现错误。
- -u 用户名:只监听某个用户的进程。
在 top 命令的显示窗口中,可使用如下按键,进行交互操作:
- ? 或 h:显示交互模式的帮助。
- c:按照 CPU 的使用率排序,默认就是此选项。
- M:按照内存(memory)的使用率排序。
- N:按照 PID 排序。
- T:按照 CPU 的累积运算时间排序,也就是按照 TIME+ 项排序。
- k:按照 PID 给予某个进程一个信号。一般用于中止某个进程,信号 9 是强制中止的信号。
- r:按照 PID 给某个进程重设优先级(Nice)值。
- q:退出 top 命令。
- z:彩色显示
- F:通过光标设置字段是否展示,以及展示顺序。
示例:
[root@localhost ~]# top -d 10 //每10秒刷新一次
[root@localhost ~]# top -d 10 -n 5 //每10秒刷新一次,只执行5次,刷新5次后自动退出
[root@localhost ~]# top -p 655,1120 //查看PID为655和1120的进程
[root@localhost ~]# top -u nancy //查看nancy用户的进程
3.2.1 top命令输出内容
top 命令的输出内容是动态的,默认每隔 3 秒刷新一次。
命令的输出主要分为两部分:
- 第一部分是前五行,显示的是整个系统的资源使用状况,我们就是通过这些输出来判断服务器的资源使用状态的。
- 第二部分从第六行开始,显示的是系统中进程的信息。
3.2.2 top命令输出内容——第一部分详解
第一部分是前五行,显示的是整个系统的资源使用状况。
top - 15:42:37 up 35 min, 2 users, load average: 0.28, 0.37, 0.30
Tasks: 169 total, 1 running, 168 sleeping, 0 stopped, 0 zombie
%Cpu(s): 6.0 us, 9.4 sy, 0.0 ni, 84.6 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 1867024 total, 1243576 free, 255592 used, 367856 buff/cache
KiB Swap: 4194300 total, 4194300 free, 0 used. 1423048 avail Mem
1)第一行是任务队列信息,具体内容如表所示。 top - 15:33:35 up 26 min, 2 users, load average: 0.48, 0.33, 0.22
| 内 容 | 说 明 |
|---|---|
| 15:33:35 | 系统当前时间 |
| up 26 min | 系统的运行时间。本机己经运行 26分钟 |
| 2 users | 当前登录了两个用户 |
| load average: 0.48, 0.33, 0.22 | 系统在之前 1 分钟、5 分钟、15 分钟的平均负载。如果 CPU 是单核的,则这个数值超过 1 就是高负载:如果 CPU 是四核的,则这个数值超过 4 就是高负载 (这个平均负载完全是依据个人经验来进行判断的,一般认为不应该超过服务器 CPU 的核数) |
2)第二行是进程信息,具体内容如表。
Tasks: 169 total, 1 running, 168 sleeping, 0 stopped, 0 zombie
| 内 容 | 说 明 |
|---|---|
| Tasks: 169 total | 系统中的进程总数 |
| 1 running | 正在运行的进程数 |
| 168 sleeping | 睡眠的进程数 |
| 0 stopped | 停止(暂停)的进程数 |
| 0 zombie | 僵尸进程数。如果不是 0,则需要手工检查僵尸进程。 |
3)第三行是 CPU 信息,具体内容如表。
%Cpu(s): 6.0 us, 9.4 sy, 0.0 ni, 84.6 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
| 内 容 | 说 明 |
|---|---|
| %Cpu(s): 6.0 us | 用户模式占用的 CPU 百分比 |
| 9.4 sy, | 系统模式占用的 CPU 百分比 |
| 0.0 ni | 改变过优先级的用户进程占用的 CPU 百分比 |
| 84.6 id | 空闲 CPU 占用的 CPU 百分比 |
| 0.0 wa | 等待输入/输出的进程占用的 CPU 百分比 |
| 0.0 hi | 硬中断请求服务占用的 CPU 百分比 |
| 0.0 si | 软中断请求服务占用的 CPU 百分比 |
| 0.0 st | st(steal time)意为虚拟时间百分比,就是当有虚拟机时,虚拟 CPU 等待实际 CPU 的时间百分比 |
4)第四行是物理内存信息,具体内容如表。
KiB Mem : 1867024 total, 1243576 free, 255592 used, 367856 buff/cache
| 内 容 | 说 明 |
|---|---|
| KiB Mem : 1867024 total | 物理内存的总量,单位为KB |
| 1243576 free | 空闲的物理内存数量 |
| 255592 used | 已使用的物理内存数量 |
| 367856 buff/cache | 作为缓冲的内存数量 |
5)第五行是交换分区(swap)信息,具体内容如表。
KiB Swap: 4194300 total, 4194300 free, 0 used. 1423048 avail Mem
| 内 容 | 说 明 |
|---|---|
| KiB Swap: 4194300 total | 交换分区(虚拟内存)的总大小,单位KB |
| 4194300 free | 空闲交换分区的大小 |
| 0 used. | 已使用的交换分区的大小 |
| 1423048 avail Mem | 可用于进程下一次分配的物理内存数量 |
根据第一部分判断服务器健康状况:
通过 top 命令的第一部分就可以判断服务器的健康状态。如果 1 分钟、5 分钟、15 分钟的平均负载高于 1,则证明系统压力较大。如果 CPU 的使用率过高或空闲率过低,则证明系统压力较大。如果物理内存的空闲内存过小,则也证明系统压力较大。
这时,我们就应该判断是什么进程占用了系统资源。如果是不必要的进程,就应该结束这些进程;如果是必需进程,那么我们该増加服务器资源(比如増加虚拟机内存),或者建立集群服务器。
缓冲(buffer)和缓存(cache)的区别:
- 缓存(cache)是在读取硬盘中的数据时,把最常用的数据保存在内存的缓存区中,再次读取该数据时,就不去硬盘中读取了,而在缓存中读取。
- 缓冲(buffer)是在向硬盘写入数据时,先把数据放入缓冲区,然后再一起向硬盘写入,把分散的写操作集中进行,减少磁盘碎片和硬盘的反复寻道,从而提高系统性能。
简单来说,缓存(cache)是用来加速数据从硬盘中"读取"的,而缓冲(buffer)是用来加速数据"写入"硬盘的。
3.2.3 top命令输出内容——第二部分详解
top 命令的第二部分输出,主要是系统进程信息,各个字段的含义如下:
| 表头(字段名) | 说明 |
|---|---|
| PID | 进程的 ID号 |
| USER | 该进程所属的用户 |
| PR | priority优先级,数值越小 优先级越高 |
| NI | nice优先级,数值越小 优先级越高 |
| VIRT | 该进程使用的虚拟内存的大小,单位为 KB |
| RES | 该进程使用的物理内存的大小,单位为 KB |
| SHR | 共享内存大小,单位为 KB |
| S | 进程状态 |
| %CPU | 该进程占用 CPU 的百分比 |
| %MEM | 该进程占用内存的百分比 |
| TIME+ | 该进程总共占用的 CPU 时间 |
| COMMAND | 进程的命令名(进程文件、进程名称) |
内存说明:
VIRT:virtual memory usage虚拟内存
- 进程需要的内存大小,但并没有占满。
- 假如进程新申请100MB的内存,但实际只使用了50MB,那么它会增长100MB,而不是实际的50MB使用量。
- VIRT = SWAP + RES
RES:resident memory usage常驻内存
- 进程当前使用的内存大小,不包括swap。
- 包含其他进程的共享内存。
- 如果申请100MB的内存,实际使用50MB,它只增长50MB,与VIRT相反。
- RES = CODE + DATA
SHR:shared memory 共享内存
- 除了自身进程的共享内存,也包括其他进程的共享内存。
- 计算某个进程所占的物理内存大小公式:RES – SHR
3.3 pgrep命令——查询进程的PID
根据特定条件查询进程的PID信息。
- -U:指定用户
- -l:显示进程名
- -a:显示完整格式的进程名
- -P < PID>:显示指定进程的子进程
示例:
[root@localhost ~]# pgrep -U nancy -l //查询nancy用户的进程PID,并显示进程名
21169 bash
21365 su
[root@localhost ~]# pgrep "log" -l //查询进程名称中带有"log"的进程的PID,并显示进程名称
466 xfs-log/dm-0
655 xfs-log/sdb5
656 xfs-log/sda1
657 xfs-log/sdb1
738 xfs-log/dm-2
813 systemd-logind
817 rsyslogd
819 abrt-watch-log
820 abrt-watch-log
[root@localhost ~]# pgrep -P 823 //查询PID为823的进程的子进程
846
3.4 prtstat命令——查看指定的进程
命令格式:
prtstat [options] PID
常用选项:
-r :格式显示(raw)
示例:
[root@localhost ~]# prtstat 1121
Process: sshd State: S (sleeping)
CPU#: 0 TTY: 0:0 Threads: 1
Process, Group and Session IDs
Process ID: 1121 Parent ID: 1
Group ID: 1121 Session ID: 1121
T Group ID: -1
Page Faults
This Process (minor major): 1288 9
Child Processes (minor major): 0 0
CPU Times
This Process (user system guest blkio): 0.01 0.02 0.00 0.34
Child processes (user system guest): 0.00 0.00 0.00
Memory
Vsize: 108 MB
RSS: 4182 kB RSS Limit: 18446744073709 MB
Code Start: 0x55973c7bf000 Code Stop: 0x55973c886a24
Stack Start: 0x7ffdccc33580
Stack Pointer (ESP): 0x7ffdccc32b58 Inst Pointer (EIP): 0x7f1fd7de9783
Scheduling
Policy: normal
Nice: 0 RT Priority: 0 (non RT)
prtstat -r,格式显示
[root@localhost ~]# prtstat -r 1121
pid: 1121 comm: sshd
state: S ppid: 1
pgrp: 1121 session: 1121
tty_nr: 0 tpgid: -1
flags: 40402100 minflt: 1288
cminflt: 0 majflt: 9
cmajflt: 0 utime: 1
stime: 2 cutime: 0
cstime: 0 priority: 20
nice: 0 num_threads: 1
itrealvalue: 0 starttime: 2643
vsize: 108539904 rss: 1021
rsslim: 18446744073709551615 startcode: 94108043177984
endcode: 94108043995684 startstack: 140728038798720
kstkesp: 7FFDCCC32B58 kstkeip: 7F1FD7DE9783
wchan: 18446744071581032117 nswap: 0
cnswap: 18446744071581032117 exit_signal: 17
processor: 0 rt_priority: 0
policy: 0 delayaccr_blkio_ticks: 34
guest_time: 0 cguest_time: 0
3.5 pstree命令——以树形结构列出进程信息
命令格式:
pstree [OPTION] [ PID | USER ]
常用选项:
- -a:显示启动每个进程对应的完整指令,包括启动进程的路径、参数等。
- -p:显示PID。
- -p < pid> : 显示指定进程及其子进程,同时显示每个进程的PID。
- -u:显示进程的用户名称。
- -u 用户名:显示指定用户的进程。
- -H < pid>:高亮显示指定进程及其前辈进程。
- -T:不显示线程thread,默认显示线程。
示例:
1)pstree PID,显示指定进程及其子进程
[root@localhost ~]# pstree 1121 //显示1121进程及其子进程
sshd─┬─sshd─┬─bash───pstree
│ ├─bash───top
│ └─bash───sleep
└─sshd───6*[sftp-server]
2)pstree -p PID,显示指定进程及其子进程,同时显示PID。
[root@localhost ~]# pstree -p 1121 //显示1121进程及其子进程,同时显示PID
sshd(1121)─┬─sshd(1872)─┬─bash(1876)───pstree(94984)
│ ├─bash(1903)───top(2063)
│ └─bash(94973)───sleep(94983)
└─sshd(1902)─┬─sftp-server(1931)
├─sftp-server(1963)
├─sftp-server(1974)
├─sftp-server(1992)
├─sftp-server(2000)
└─sftp-server(2019)
3)pstree -u 用户名,显示指定用户的进程。
[root@localhost ~]# pstree -u nancy -p //显示nancy用户的进程,同时显示进程号。
bash(109643)───su(109754,root)───bash(109807)───pstree(110068)
4)-a,显示启动进程的完整指令,包括启动进程的路径、参数等。
[root@localhost ~]# pstree 1645 -a //显示启动1645进程的完整指令
wpa_supplicant -u -f /var/log/wpa_supplicant.log -c/etc/wpa_supplicant/wpa_sup
5)-aup,同时显示启动进程的完整指令、进程的所属用户、进程PID。
[root@localhost ~]# pstree -aup
3.6 lsof命令——列举被打开的文件
lsof 命令,“list opened files”的缩写,直译过来,就是列举系统中已经被打开的文件。通过 lsof 命令,我们就可以根据文件找到对应的进程信息,也可以根据进程信息找到进程打开的文件。
命令格式:
lsof [options]
常用选项:
| 选项 | 功能 |
|---|---|
| -c 字符串 | 只列出以字符串开头的进程打开的文件。 |
| +d 目录名 | 列出某个目录中所有被进程调用的文件。 |
| -u 用户名 | 只列出某个用户的进程打开的文件。 |
| -p pid | 列出某个 PID 进程打开的文件。 |
示例:
[root@localhost ~]# lsof | more //查询系统中所有进程调用的文件
[root@localhost ~]# lsof +d /dev |more //显示/dev目录下所有被打开的文件及对应进程
[root@localhost ~]# lsof -u nancy //查询nancy用户打开的所有文件
[root@localhost ~]# lsof -p 655 //查询655进程打开的所有文件
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
xfs-log/s 655 root cwd DIR 253,0 4096 64 /
xfs-log/s 655 root rtd DIR 253,0 4096 64 /
xfs-log/s 655 root txt unknown /proc/655/exe
[root@localhost ~]# lsof /bin/bash //查询打开/bin/bash文件的所有进程
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
ksmtuned 894 root txt REG 253,0 960472 25197358 /usr/bin/bash
bash 1955 root txt REG 253,0 960472 25197358 /usr/bin/bash
bash 1983 root txt REG 253,0 960472 25197358 /usr/bin/bash
bash 18235 nancy txt REG 253,0 960472 25197358 /usr/bin/bash
bash 18439 root txt REG 253,0 960472 25197358 /usr/bin/bash
bash 24904 root txt REG 253,0 960472 25197358 /usr/bin/bash
3.7 vmstat命令——监控系统资源
如果想动态地了解一下系统资源的使用状况,以及查看当前系统中到底是哪个环节最占用系统资源,就可以使用 vmstat 命令。
vmstat命令,是 Virtual Meomory Statistics(虚拟内存统计)的缩写,可用来监控 CPU 使用、进程状态、内存使用、虚拟内存使用、硬盘输入/输出状态等信息。
3.7.1 vmstat命令格式一
vmstat [-a] [刷新延时 刷新次数]
#-a:显示活跃和非活跃内存
示例:
[root@localhost ~]# vmstat 3 2 //每3秒刷新一次,共执行2次
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
2 0 0 1223600 2332 370860 0 0 109 9 207 219 4 6 90 1 0
2 0 0 1223652 2332 370856 0 0 0 6 276 242 6 7 86 0 0
查询出的信息共分6段,下面是具体说明:
| 字段 | 含义 |
|---|---|
| procs | 进程信息字段: -r:等待运行的进程数,数量越大,系统越繁忙。 -b:不可被唤醒的进程数量,数量越大,系统越繁忙。 |
| memory | 内存信息字段: -swpd:虚拟内存的使用情况,单位为 KB。 -free:空闲的内存容量,单位为 KB。 -buff:缓冲的内存容量,单位为 KB。 -cache:缓存的内存容量,单位为 KB。 |
| swap | 交换分区信息字段: -si:从磁盘中交换到内存中数据的数量,单位为 KB。 -so:从内存中交换到磁盘中数据的数量,单位为 KB。 这两个数越大,表明数据需要经常在磁盘和内存之间进行交换,系统性能越差。 |
| io | 磁盘读/写信息字段: -bi:从块设备中读入的数据的总量,单位是块。 -bo:写到块设备的数据的总量,单位是块。这两个数越大,代表系统的 I/O 越繁忙。 |
| system | 系统信息字段: -in:每秒被中断的进程次数。 -cs:每秒进行的事件切换次数。 这两个数越大,代表系统与接口设备的通信越繁忙。 |
| cpu | CPU信息字段: -us:非内核进程消耗 CPU 运算时间的百分比。 -sy:内核进程消耗 CPU 运算时间的百分比。 -id:空闲 CPU 的百分比。 -wa:等待 I/O 所消耗的 CPU 百分比。 -st:被虚拟机所盗用的 CPU 百分比 |
通过分析 vmstat 命令的执行结果,可以获得一些与当前 Linux 运行性能相关的信息。比如说:
- r 列表示运行和等待 CPU 时间片的进程数,如果这个值长期大于系统 CPU 的个数,就说明 CPU 不足,需要增加 CPU。
- swpd 列表示切换到内存交换区的内存数量(以 kB 为单位)。如果 swpd 的值不为 0,或者比较大,而且 si、so 的值长期为 0,那么这种情况下一般不用担心,不用影响系统性能。
- cache 列表示缓存的内存数量,一般作为文件系统缓存,频繁访问的文件都会被缓存。如果缓存值较大,就说明缓存的文件数较多,如果此时 I/O 中 bi 比较小,就表明文件系统效率比较好。
- 一般情况下,si(数据由硬盘调入内存)、so(数据由内存调入硬盘) 的值都为 0,如果 si、so 的值长期不为 0,则表示系统内存不足,需要增加系统内存。
- 如果 bi+bo 的参考值为 1000 甚至超过 1000,而且 wa 值较大,则表示系统磁盘 I/O 有问题,应该考虑提高磁盘的读写性能。
- 输出结果中,CPU 项显示了 CPU 的使用状态,其中当 us 列的值较高时,说明用户进程消耗的 CPU 时间多,如果其长期大于 50%,就需要考虑优化程序或算法;sy 列的值较高时,说明内核消耗的 CPU 资源较多。通常情况下,us+sy 的参考值为 80%,如果其值大于 80%,则表明可能存在 CPU 资源不足的情况。
总的来说,vmstat 命令的输出结果中,我们应该重点注意 procs 项中 r 列的值,以及 CPU 项中 us 列、sy 列和 id 列的值。
3.7.2 vmstat命令格式二
vmstat [选项]...
常用选项:
| 选项 | 含义 |
|---|---|
| -f | 显示从启动到目前为止,系统复制(fork)的程序数。此信息是从 /proc/stat 中的 processes 字段中取得的。 |
| -s | 将从启动到目前为止,由一些事件导致的内存变化情况列表说明。这些信息的分别来自于/proc/meminfo,/proc/stat和/proc/vmstat。 |
| -S 单位 | 令输出的数据显示单位,例如用 K/M 取代 bytes 的容量。 |
| -d | 列出硬盘有关读写总量的统计表。 |
| -p 分区设备文件名 | 查看硬盘分区的读写情况。 |
示例:
1)-f,显示从启动到目前为止,系统共fork(派生)的程序数。
[root@localhost ~]# vmstat -f //显示从启动到目前为止,系统共派生的程序数
54540 forks
2)-S 单位,令输出的数据按指定单位显示。k/K,以KB为单位;m/M,以MB为单位。
[root@localhost ~]# vmstat -S k //令输出的内容以KB为单位
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
2 0 0 1256337 2387 382066 0 0 88 9 217 224 4 6 89 0 0
[root@localhost ~]# vmstat -S m //令输出的内容以MB为单位
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
2 0 0 1255 2 382 0 0 87 9 217 224 4 6 89 0 0
3)-d,列出硬盘有关读写总量的统计表。
[root@localhost ~]# vmstat -d
disk- ------------reads------------ ------------writes----------- -----IO------
total merged sectors ms total merged sectors ms cur sec
sda 9849 23 738172 136120 4940 155 72326 6248 0 62
sdb 739 0 19241 7312 8 0 8192 1973 0 4
sdc 400 0 8025 2046 4 0 4096 1374 0 2
sr0 18 0 2056 461 0 0 0 0 0 0
dm-0 9342 0 668005 132045 5091 0 68230 4148 0 61
dm-1 94 0 4456 29 0 0 0 0 0 0
dm-2 145 0 2433 1912 4 0 4096 1374 0 2
4) -s,显示内存相关统计信息及多种系统活动数量。
[root@localhost ~]# vmstat -s
1867024 K total memory
302616 K used memory
245500 K active memory
250252 K inactive memory
1149732 K free memory
2332 K buffer memory
412344 K swap cache
4194300 K total swap
0 K used swap
4194300 K free swap
19190 non-nice user cpu ticks
41 nice user cpu ticks
28128 system cpu ticks
388810 idle cpu ticks
1790 IO-wait cpu ticks
0 IRQ cpu ticks
341 softirq cpu ticks
0 stolen cpu ticks
383747 pages paged in
44308 pages paged out
0 pages swapped in
0 pages swapped out
982034 interrupts
1003112 CPU context switches
1646377828 boot time
73210 forks
5)-p 分区设备文件名,查看硬盘分区的读写情况。
[root@localhost ~]# vmstat -p /dev/sdb1 //查看/dev/sdb1的读写情况
sdb1 reads read sectors writes requested writes
312 5249 4 4096
4 启动进程
4.1 手工启动
- 前台启动:用户输入命令,直接执行程序。
- 后台启动:在命令行尾加入“&”符号。
使用sleep命令来观察前台启动与后台启动的区别。
1)"sleep 600"让系统睡眠600秒,在前台运行。
那么进程会占用终端,在进程结束前无法执行其他命令。必须等待进程结束。
2)"sleep 700 &"让系统睡眠700秒,在后台运行。可以看到后台任务序号和PID。
进程不会占用终端,终端可以正常执行其他命令。使用ps命令可以查询到该进程。
4.2 调度启动
- 使用at命令,设置一次性计划任务。
- 使用crontab命令,设置周期性计划任务。
调度启动在下文 ” 8 计划任务管理 “ 中详细介绍。
5 进程的前后台调度(作业控制)
命令介绍:
& //在命令行尾加入“&”符号,把命令放到后台执行。
Ctrl+Z 组合键 //将当前进程挂起,即调入后台并停止执行。
jobs //查看处于后台的任务列表。
fg 任务序号 //将后台进程恢复到前台运行,可指定任务序号。
bg 任务序号 //将一个在后台暂停的任务,变成继续执行。
示例:
1)在命令行尾加入“&”符号,输出的信息包括后台任务序号和PID号。
[root@localhost data]# sleep 700 & //将进程放到后台运行
[1] 73216
2)Ctrl+Z 组合,可以将当前进程挂起(即调入后台并停止执行)。
[root@localhost ~]# dd if=/dev/zero of=/tmp/test/bigfile bs=1G count=20
^Z
[1]+ 已停止 dd if=/dev/zero of=/tmp/test/bigfile bs=1G count=20
3)jobs 命令,查看处于后台的任务列表。
[root@localhost ~]# jobs //查看后台任务列表
[1]+ 已停止 dd if=/dev/zero of=/tmp/test/bigfile bs=1G count=20
4)fg 任务序号,将后台进程恢复到前台运行。
[root@localhost ~]# jobs
[1]+ 已停止 dd if=/dev/zero of=/tmp/test/bigfile bs=1G count=20
[root@localhost ~]# fg 1 //将1号任务恢复到前台运行,运行过程中会占用终端
dd if=/dev/zero of=/tmp/test/bigfile bs=1G count=20
dd: warning: partial read (884142080 bytes); suggest iflag=fullblock
dd: 写入"/tmp/test/bigfile" 出错: 设备上没有空间
记录了5+1 的读入
记录了4+1 的写出
5538648064字节(5.5 GB)已复制,150.624 秒,36.8 MB/秒
5)bg 任务序号,将一个在后台暂停的任务,变成继续执行。
[root@localhost ~]# dd if=/dev/zero of=/data/aa/f1 bs=1G count=10 //执行后,使用ctrl+z将该进程挂起
^Z
[1]+ 已停止 dd if=/dev/zero of=/data/aa/f1 bs=1G count=10
[root@localhost ~]# jobs //查看后台任务列表,任务是停止状态
[1]+ 已停止 dd if=/dev/zero of=/data/aa/f1 bs=1G count=10
[root@localhost ~]# bg 1 //让暂停的后台任务,变成继续执行
[1]+ dd if=/dev/zero of=/data/aa/f1 bs=1G count=10 &
[root@localhost ~]# jobs //查看任务列表,进程是运行状态
[1]+ 运行中 dd if=/dev/zero of=/data/aa/f1 bs=1G count=10 &
6 进程的优先级设置
每个CPU在一个时间点上只能处理一个进程,通过时间分片技术,来同时运行多个进程。每个进程都有相应的优先级,优先级决定它何时运行和接收多少 CPU 时间。
在 Linux 系统中,表示进程优先级的有两个参数:Priority 和 Nice。数值越小,优先级越高,该进程越优先被 CPU 处理。
不过,PRI值是由内核动态调整的,用户不能直接修改。所以我们只能通过修改 NI 值来影响 PRI 值,间接地调整进程优先级。
PRI 和 NI 的关系如下:
PRI (最终值) = PRI (原始值) + NI
修改 NI 值时有几个注意事项:
- NI 范围是 -20~19。
- 普通用户调整 NI 值的范围是 0~19,而且只能调整自己的进程。
- 普通用户只能调高 NI 值,而不能降低。如原本 NI 值为 0,则只能调整为大于 0。
- 只有 root 用户才能设定进程 NI 值为负值,而且可以调整任何用户的进程。
6.1 启动具有不同nice级别的进程——nice命令
启动进程时,进程通常会继承父进程的nice级别,默认为0。
可以在启动程序时,加上nice命令来设置程序运行的优先级。
nice命令:
nice -n 优先级 命令
示例:
在启动程序时,设置程序的nice级别为 -5。
[root@localhost ~]# nice -n -5 dd if=/dev/zero of=/data01/f1 bs=500M count=20 & //启动程序时,设置nice级别为-5
[1] 89002
[root@localhost ~]# top -p 89002
6.2 更改现有进程的nice级别——renice命令
renice命令格式:
renice -n 优先级 -p PID //修改现有进程的nice级别
示例:
sshd进程的当前nice级别为0,使用renice命令修改为-10。
[root@localhost ~]# top -p 68219 //查看68219进程的nice级别,为0
[root@localhost ~]# renice -n -10 -p 68219 //将68219进程的nice级别修改为-10
68219 (进程 ID) 旧优先级为 0,新优先级为 -10
[root@localhost ~]# top -p 68219 //修改后的nice级别为-10
7 结束进程
7.1 kill命令
kill 从字面来看,就是用来杀死进程的命令,但事实上,这个或多或少带有一定的误导性。从本质上讲,kill 命令只是用来向进程发送一个信号,至于这个信号是什么,是用户指定的。
也就是说,kill 命令的执行原理是这样的,kill 命令会向操作系统内核发送一个信号(多是终止信号)和目标进程的 PID,然后系统内核根据收到的信号类型,对指定进程进行相应的操作。
命令格式:
kill [信号] PID
#kill 命令是按照 PID 来确定进程的,所以 kill 命令只能识别 PID,而不能识别进程名。
Linux 定义了几十种不同类型的信号,可以使用 kill -l 命令查看所有信号及其编号。
常用信号:
| 信号编号 | 信号名 | 含义 |
|---|---|---|
| 0 | EXIT | 程序退出时收到该信息。 |
| 1 | HUP | 挂掉电话线或终端连接的挂起信号,这个信号也会造成某些进程在没有终止的情况下重新初始化。 |
| 2 | INT | 表示结束进程,但并不是强制性的,常用的 "Ctrl+C" 组合键发出就是一个 kill -2 的信号。 |
| 3 | QUIT | 退出。键盘退出使用 "Ctrl+\ "。 |
| 9 | KILL | 杀死进程,即强制结束进程。 |
| 11 | SEGV | 段错误。 |
| 15 | TERM | 正常结束进程,是 kill 命令的默认信号。 |
| 18 | CONT | 继续。 |
| 19 | STOP | 暂停。 |
示例:
[root@localhost data]# sleep 400 & //将程序放到后台执行,PID118477
[1] 118477
[root@localhost data]# jobs //查看后台任务列表,进程在运行中
[1]+ 运行中 sleep 400 &
[root@localhost data]# kill -9 118477 //杀死PID为118477的进程
[root@localhost data]# jobs //查看后台任务列表,进程已被杀死
[1]+ 已杀死 sleep 400
7.2 killall命令
killall 也是用于关闭进程的一个命令,但和 kill 不同的是,killall 命令不再依靠 PID 来杀死单个进程,而是通过程序的进程名来杀死一类进程,也正是由于这一点,该命令常与 ps、pstree 等命令配合使用。
命令格式:
killall [选项] [信号] 进程名
常用选项:
- -i:交互式,询问是否要杀死某个进程。
- -I:忽略进程名的大小写。
示例:
[root@localhost ~]#killall -i sshd //以交互方式杀死sshd
7.3 pkill命令
当作于管理进程时,pkill 命令和 killall 命令的用法相同,都是通过进程名杀死一类进程,该命令的基本格式如下:
命令格式:
pkill [信号] 进程名
pkill命令踢出登陆用户:
pkill [-U 用户名] 进程名
pkill [-t 终端号] 进程名
-U:根据进程所属的用户名终止相应进程
-t:根据进程所在的终端终止相应进程
示例:
[root@localhost ~]# pgrep -l -u nancy //查看nancy用户的进程,并显示进程名
57564 bash
[root@localhost ~]# pkill -9 -U nancy //杀死nancy用户的进程
[root@localhost ~]# pgrep -l -u nancy //查看nancy用户的进程,已无数据
8 计划任务管理
8.1 at一次性任务设置
at 工具介绍:
- 由包 at 提供
- 依赖与atd服务,需要启动才能实现at任务
- at队列存放在/var/spool/at目录中,ubuntu存放在/var/spool/cron/atjobs目录下
- 执行任务时PATH变量的值和当前定义任务的用户身份一致
at 命令的访问控制是依靠 /etc/at.allow(白名单)和 /etc/at.deny(黑名单)这两个文件来实现的,具体规则如下:
- 如果系统中有 /etc/at.allow 文件,那么只有写入 /etc/at.allow 文件(白名单)中的用户可以使用 at 命令,其他用户不能使用 at 命令(注意,/etc/at.allow 文件的优先级更高,也就是说,如果同一个用户既写入 /etc/at.allow 文件,又写入 /etc/at.deny 文件,那么这个用户是可以使用 at 命令的)。
- 如果系统中没有 /etc/at.allow 文件,只有 /etc/at.deny 文件,那么写入 /etc/at.deny 文件(黑名单)中的用户不能使用 at 命令,其他用户可以使用 at 命令。不过这个文件对 root 用户不生效。
- 如果系统中这两个文件都不存在,那么只有 root 用户可以使用 at 命令。
系统中默认只有 /etc/at.deny 文件,而且这个文件是空的,因此,系统中所有的用户都可以使用 at 命令。不过,如果我们打算控制用户的 at 命令权限,那么只需把用户写入 /etc/at.deny 文件即可。
at 设置任务
at [选项] [时间]
at [HH:MM] [yyyy-mm-dd]
#设置具体任务后,按 ctrl+d 提交 。
#若设置具体任务时,想要退格重写,按ctrl+backspace进行退格。
查询和删除at任务:
atq //查看at任务列表
atrm [工作号] //删除指定的at任务
时间格式说明:
| 格式 | 用法 |
|---|---|
| HH:MM | 比如 04:00 AM。如果时间已过,则它会在第二天的同一时间执行。 |
| Midnight(midnight) | 代表 12:00 AM(也就是 00:00)。 |
| Noon(noon) | 代表 12:00 PM(相当于 12:00)。 |
| Teatime(teatime) | 代表 4:00 PM(相当于 16:00)。 |
| 英文月名 日期 年份 | 比如 January 15 2018 表示 2018 年 1 月 15 号,年份可有可无。 |
| MMDDYY、MM/DD/YY、MM.DD.YY | 比如 011518 表示 2018 年 1 月 15 号。 |
| now+时间 | 以 minutes、hours、days 或 weeks 为单位,例如 now+5 days 表示命令在 5 天之后的此时此刻执行。 |
常用时间格式:
HH:MM //在今日的 HH:MM 进行,若该时刻已过,则明天此时执行任务
02:00 //表示在今天2点执行任务,若2点已过,则在明天2点执行
HH:MM YYYY-MM-DD //规定在某年某月的某一天的特殊时刻进行该项任务
02:00 2022-06-30 //在2022年6月30日执行该项任务
HH:MM[am|pm] [Month] [Date] //指定上午或下午
06pm March 17 //3月17日下午6点执行
HH:MM[am|pm] + number [minutes|hours|days|weeks] //在某个时间点再加几个时间后才进行该项任务
now+5min //5分钟后执行该项任务
02pm+3days //在3天后的下午2点执行该项任务
示例:
1)使用具体年月日设置定时任务。
[root@localhost ~]# at 08:00 2022-03-10 //在2022年3月10日8点执行任务
at> touch /tmp/test/fa.txt //设置具体任务,在/tmp/test 目录下创建文件
at> <EOT> //按ctrl+d 提交任务
job 5 at Thu Mar 10 08:00:00 2022 //任务已成功设置
[root@localhost ~]# atq //查看at任务列表
5 Thu Mar 10 08:00:00 2022 a root
2)使用now+时间,设置任务。
[root@localhost ~]# at now+30min //在30分钟后执行该任务
at> cp /etc/passwd /tmp/test //设置具体任务,将passwd文件复制到/tmp/test目录下
at> <EOT> //按ctrl+d 提交任务
job 7 at Fri Mar 4 21:20:00 2022 //任务已成功设置
[root@localhost ~]# atq
7 Fri Mar 4 21:20:00 2022 a root
3)HH:MM,在今日的 HH:MM 执行,若该时刻已过,则明天此时执行任务。
[root@localhost ~]# date //查询当前时间,为3月4日下午9点
2022年 03月 04日 星期五 21:03:34 CST
[root@localhost ~]# at 5pm //在今天下午5点执行
at> touch /ceshi/1.txt
at> <EOT>
job 11 at Sat Mar 5 17:00:00 2022 //因为今天下午5点已过,所以系统自动改为明天下午5点
4)atq查询at任务列表,atrm删除at任务。
[root@localhost ~]# atq //查询at任务列表,有3个任务
5 Thu Mar 10 08:00:00 2022 a root
7 Fri Mar 4 21:20:00 2022 a root
11 Sat Mar 5 17:00:00 2022 a root
[root@localhost ~]# atrm 11 //删除工作号为11的at任务
[root@localhost ~]# atq //查询at任务列表,只剩2个任务
5 Thu Mar 10 08:00:00 2022 a root
7 Fri Mar 4 21:20:00 2022 a root
8.2 crontab周期性任务设置
8.2.1 crontab命令简介
- 按照预先设置的时间周期(分钟、小时、天......)重复执行用户指定的命令操作。
- 属于周期性计划任务。
- 主要设置文件。
- 全局配置文件,位于文件:/etc/crontab
- 系统默认的设置,位于目录:/etc/cron.*/
- 用户定义的设置,位于文件:/var/spool/cron/用户名
查看/etc/crontab文件:
8.2.2 管理crontab计划任务
crontab命令格式:
crontab -e [-u 用户名] //编辑计划任务
crontab -l [-u 用户名] //查看计划任务
crontab -r [-u 用户名] //删除计划任务
#-u选项缺省时默认针对当前用户,只有超级用户才可以使用-u
使用 "crontab -e" 进入 crontab 编辑界面。会打开vim编辑你的任务,输入格式为:
* * * * * 需要执行的任务
#即:时间周期设置 任务内容设置。
#任务内容设置中,命令一定要用绝对路径,例如cp命令,要用/usr/bin/cp,可以用which查看命令的绝对路径
每个星号(*)表示不同的时间概念:
| 项目 | 含义 | 范围 |
|---|---|---|
| 第一个"*" | 一小时当中的第几分钟(minute) | 0~59 |
| 第二个"*" | 一天当中的第几小时(hour) | 0~23 |
| 第三个"*" | 一个月当中的第几天(day) | 1~31 |
| 第四个"*" | 一年当中的第几个月(month) | 1~12 |
| 第五个"*" | 一周当中的星期几(week) | 0~7(0和7都代表星期日) |
时间数值的特殊表示方法:
| 特殊符号 | 含义 |
|---|---|
| *(星号) | 代表任何时间。比如第一个"*"就代表一小时中每分钟都执行一次的意思。 |
| ,(逗号) | 代表多个不连续的时间点。比如 "0 8,12,16 * * * 命令" 就代表在每天的 8 点 0 分、12 点 0 分、16 点 0 分都执行一次命令。 |
| -(中杠) | 代表连续的时间范围。比如"0 5 * * 1-6 命令",代表在周一到周六的凌晨 5 点 0 分执行命令。 |
| /(正斜线) | 代表每隔多久执行一次(即间隔的时间频率)。比如"*/10命令",代表每隔 10 分钟就执行一次命令。 |
时间示例:
0 17 * * 1-5 //周一到周五每天17:00
30 8 * * 1,3,5 //每周一、三、五的8:30
0 8-18/2 * * * //8点到18点之间每2小时
0 * */3 * * //每3天的每个整点
应用示例:
1)使用crontab -e 编辑计划任务。每月1日备份文件。
[root@localhost ~]# which cp //查看cp命令的绝对路径
alias cp='cp -i'
/usr/bin/cp
[root@localhost ~]# crontab -e //编辑计划任务
no crontab for root - using an empty one
crontab: installing new crontab
[root@localhost ~]# crontab -l //查看计划任务
0 4 1 * * /usr/bin/cp /etc/passwd /data01
2)每周五8:00~18:00之间,每隔2小时备份一次。
[root@localhost data01]# crontab -e
crontab: installing new crontab
[root@localhost data01]# crontab -l
0 4 1 * * /usr/bin/cp /etc/passwd /data01
0 8-18/2 * * 5 /usr/bin/cp /etc/group /data01
8.2.3 crontab注意事项
在书写 crontab 定时任务时,需要注意以下几个事项:
- 6 个选项都不能为空,必须填写。如果不确定,则使用“*”代表任意时间。
- crontab 定时任务的最小有效时间是分钟,最大有效时间是月。像 2018 年某时执行、3 点 30 分 30 秒这样的时间都不能被识别。
- 在定义时间时,日期和星期最好不要在一条定时任务中出现,因为它们都以天为单位,非常容易让管理员混淆。
- 在定时任务中,不管是直接写命令,还是在脚本中写命令,最好都使用绝对路径。有时使用相对路径的命令会报错。
9 总结
1、查看进程命令
静态查看:ps aux,ps -elf
动态查看:top
查看指定进程:prtstat
以树形结构列出:pstree
列举被打开的文件:lsof
监控系统资源:vmstat、iostat
发现僵尸进程(状态为Z)一定要杀掉。
“cat /proc/PID/status" 可以查看指定进程具体有几个线程。
2、控制进程
- 后台启动:
命令行尾加”&“符号。
- 前后台调度:
ctrl+z 挂起当前进程,
jobs查看任务列表
fg 序号,将前台进程调到后台运行。
bg 序号,将后台暂停的进程恢复执行状态。
- 修改优先级:
nice,启动程序时设置优先级。
renice,修改现有进程的优先级。
- 杀死进程:
kill [信号] PID
killall 进程名
pkill [信号] [-U 用户名]
pkill [信号] [-t 终端名]
3、计划任务管理
- at一次性任务设置
at [HH:MM] [yyyy-mm-dd]:设置一次性任务,按ctrl+d 提交任务。
atq :查看at任务。
atrm:删除at任务。
- crontab周期性任务设置
crontab -e:编辑计划任务。
crontab -l:查看计划任务。
时间格式:分、时、日、月、周几。 可以查看cat /etc/crontab 文件。
*表示任意。
,表示多个不连续的时间点。
-表示连续的时间范围。
/表示频率。
命令要使用绝对路径。
6个选项(时间+任务)都不能为空,必须填写。