cpu指标
cpu查看工具
常用命令及其解释
top命令
user(通常缩写为us),代表用户态CPU时间。注意,它不包括下面的nice时间,但包括了guest时间- nice(通常缩写为ni),代表低优先级用户态CPU时间,也就是进程nice值被调整为1-19之间的CPU时间。这里注意,nice可取值范围是-20到19,数值越大,优先级反而越低
- system(通常缩写为sys),代表内核态CPU时间
- idle (通常缩写为id),代表空闲时间,注意,它不包括等待iowait的时间
- iowait(通常缩写为wa),代表等待I/O的CPU时间
- irq(通常缩写为hi),代表处理硬中断的CPU时间。
- softirq(通常缩写为si),代表处理软中断的CPU时间。
- steal(通常缩写为st),代表当系统运行在虚拟机中的时候,被其他虚拟机占用的CPU时间
- guest (通常缩写为guest),代表通过虚拟化运行其他操作系统的时间,也就是运行虚拟机的CPU时间
- guest_nice (通常缩写为gnice),代表以低优先级运行虚拟机的时间
vmstat命令
procs部分的解释
r 列表示运行和等待cpu时间片的进程数,如果长期大于1,说明cpu不足,需要增加cpu。b 列表示在等待资源的进程数,比如正在等待I/O、或者内存交换等。
cpu部分的解释
-us 列显示了用户方式下所花费 CPU 时间的百分比。us的值比较高时,说明用户进程消耗的cpu时间多,但是如果长期大于50%,需要考虑优化用户的程序。
-
sy 列显示了内核进程所花费的cpu时间的百分比。这里us + sy的参考值为80%,如果us+sy 大于 80%说明可能存在CPU不足。
-
wa 列显示了IO等待所占用的CPU时间的百分比。这里
wa的参考值为30%,如果wa超过30%,说明IO等待严重,这可能是磁盘大量随机访问造成的,也可能磁盘或者磁盘访问控制器的带宽瓶颈造成的(主要是块操作)。
-id 列显示了cpu处在空闲状态的时间百分比
system部分的解释
-
in列表示在某一时间间隔中观测到的每秒设备中断数。 -
cs列表示每秒产生的上下文切换次数,如当 cs 比磁盘 I/O 和网络信息包速率高得多,都应进行进一步调查。
memory部分的解释
-
swpd 切换到内存交换区的内存数量(k表示)。如果swpd的值不为0,或者比较大,比如超过了100m,只要si、so的值长期为0,系统性能还是正常`
-
free 当前的空闲页面列表中内存数量(k表示)
-
buff 作为buffer cache的内存数量,一般对块设备的读写才需要缓冲。
-
cache: 作为page cache的内存数量,一般作为文件系统的cache,如果cache较大,说明用到cache的文件较多,如果此时IO中bi比较小,说明文件系统效率比较好。
swap部分的解释
-
si 由内存进入内存交换区数量。
-
so由内存交换区进入内存数量。
IO部分的解释
bi 从块设备读入数据的总量(读磁盘)(每秒kb)。
bo 块设备写入数据的总量(写磁盘)(每秒kb)
pidstat命令
- 安装 yum install sysstat / apt install sysstat
- pidstat -u cpu pidstat -r mem pidstat -d io -p 进程id
sar 命令
- sar -n DEV 网卡历史流量
iftop、iptraf、nethogs
- iftop 类似于iptraf,显示每一对连接之间的流量
- iptraf按照端口统计
- nethogs按照流量统计
查看进程下的线程
- ps -p $(pidof cmdname) -T 或者top -H -p pid或者htop -p
- taskset -p 查看线程运行在哪个cpu上