运维常用软件及高频命令汇总

3 阅读7分钟

本文聚焦运维工作中最常用的系统工具、网络工具、服务管理工具等,分类整理核心命令,重点标注使用频率最高的命令(标★),覆盖Linux、Windows两大主流系统,兼顾基础操作与故障排查,适合日常查阅和新手学习。 一、Linux系统核心运维命令(使用频率最高,必掌握) (一)系统信息与资源监控(高频场景) 核心用途:查看系统运行状态、资源占用,快速定位性能瓶颈,是运维日常巡检的基础。

  • ★ top:实时动态查看系统CPU、内存、进程占用情况(交互式,按“P”按CPU排序,“M”按内存排序,“q”退出),几乎每小时都会用到,用于快速排查资源占用异常问题。

  • ★ free -h:以人类易读格式(KB/MB/GB)查看内存使用情况,包括总内存、已用内存、空闲内存、缓存等,排查内存不足问题的首选命令。

  • ★ df -h:查看磁盘空间使用情况,显示各分区容量、已用、空闲比例,避免磁盘满导致服务异常,日常巡检必执行。

  • uname -a:查看系统内核版本、主机名、硬件架构等完整信息,用于环境适配和问题排查。

  • uptime:查看系统运行时间、当前登录用户数、平均负载,判断系统是否稳定运行。

  • lscpu:显示CPU详细信息(型号、核心数、频率),用于硬件配置核对。 (二)文件与目录管理(高频场景) 核心用途:文件创建、查看、修改、删除,目录切换与管理,是运维操作的基础中的基础。

  • ★ ls:列出目录内容,常用参数:ls -l(详细显示权限、所有者、大小、修改时间)、ls -a(显示隐藏文件),每天使用次数最多。

  • ★ cd:切换工作目录,常用命令:cd /(切换到根目录)、cd ~(切换到当前用户家目录)、cd ..(切换到上一级目录),高频操作无需刻意记忆。

  • ★ cat:查看文件全部内容,适用于查看小型配置文件(如cat /etc/hosts),快速查看文件内容的首选。

  • ★ tail -f:实时跟踪文件末尾新增内容,常用于监控日志(如tail -f /var/log/nginx/access.log),排查服务报错的核心命令。

  • mkdir -p:递归创建目录(若父目录不存在则自动创建),如mkdir -p /data/logs,避免手动创建多级目录的繁琐。

  • rm -rf:强制删除目录及其中所有内容(慎用!),如rm -rf /tmp/test,删除无用文件和目录的常用命令。

  • cp:复制文件/目录,常用参数-r(递归复制目录),如cp /etc/nginx/nginx.conf /backup/,用于配置文件备份。

  • mv:移动文件/目录或重命名,如mv test.txt test_new.txt,操作简单且高频。 (三)网络管理与排查(高频场景) 核心用途:测试网络连通性、查看端口占用、排查网络故障,是运维排查网络问题的核心工具。

  • ★ ping:测试与目标主机的网络连通性,如ping 8.8.8.8、ping www.baidu.com,快速判断网络是否通畅。

  • ★ netstat:查看网络连接、端口占用情况,常用参数组合:netstat -ano(查看所有连接、端口及对应PID)、netstat -tuln(查看所有监听状态的TCP/UDP端口),排查端口冲突的首选命令。

  • ★ grep:搜索文件内容或命令输出,常用参数:-i(忽略大小写)、-r(递归搜索目录),如grep "error" /var/log/messages,快速筛选日志中的错误信息。

  • ss:现代替代netstat的工具,更高效,常用ss -tuln查看监听端口,性能优于netstat。

  • traceroute:显示数据包到目标主机的路由路径,排查网络延迟、丢包的节点,如traceroute 8.8.8.8。

  • ip addr show:显示所有网络接口的IP地址、MAC地址等信息,替代旧版的ifconfig命令。 (四)进程与服务管理(高频场景) 核心用途:查看进程状态、启动/停止服务、终止异常进程,保障服务正常运行。

  • ★ ps:查看系统进程,常用参数组合ps aux(查看所有进程的详细信息,包括用户、PID、CPU/内存占用),排查异常进程的核心命令。

  • ★ systemctl:管理系统服务(systemd系统),常用命令:

  • systemctl status 服务名(查看服务状态,如systemctl status nginx)

  • systemctl start 服务名(启动服务)

  • systemctl stop 服务名(停止服务)

  • systemctl restart 服务名(重启服务)

  • systemctl enable 服务名(设置服务开机自启)

日常启停服务、查看服务状态的高频命令。

  • ★ kill:终止进程,常用参数-9(强制终止),如kill -9 1234(1234为进程PID),用于终止无响应的异常进程。

  • killall:按进程名终止所有对应进程,如killall nginx,快速终止某个服务的所有进程。 二、Windows系统核心运维命令(高频使用) (一)系统与进程管理

  • ★ tasklist:查看所有运行的进程,类似Linux的ps命令,常用参数:tasklist /svc(显示进程及关联服务)、tasklist | findstr "进程名"(筛选指定进程),排查进程占用的常用命令。

  • ★ taskkill:终止进程,常用命令:

  • taskkill /PID 进程PID /F(强制终止指定PID的进程)

  • taskkill /IM 进程名 /F(强制终止指定名称的进程,如taskkill /IM chrome.exe /F)

快速终止异常进程的核心命令。

  • systeminfo:显示详细系统配置,包括补丁信息、硬件配置等,用于环境排查。
  • ipconfig /all:显示完整网络配置,包括IP地址、子网掩码、DNS、MAC地址等,排查网络配置的首选命令。 (二)网络排查
  • ★ ping:与Linux用法一致,测试网络连通性,如ping 8.8.8.8。
  • ★ netstat:查看端口占用和网络连接,常用netstat -ano | findstr "端口号"(查看指定端口的占用进程及PID),排查端口冲突。
  • telnet:检测目标端口是否开放,格式telnet IP 端口,如telnet 192.168.1.1 80,测试服务端口是否可达(需先开启Telnet Client功能)。
  • tracert:路由跟踪,排查网络延迟和丢包,如tracert www.baidu.com。 三、运维常用软件专项命令(高频使用) (一)Nginx(Web服务器/反向代理,高频运维)
  • ★ nginx -t:检查Nginx配置文件语法是否正确,修改配置后必执行,避免配置错误导致服务无法启动。
  • ★ nginx -s reload:重新加载Nginx配置文件,无需停止服务,不影响用户访问,修改配置后最常用的命令。
  • nginx:启动Nginx服务。
  • nginx -s stop:强制停止Nginx服务。
  • nginx -s quit:优雅停止Nginx服务(等待当前请求处理完成后停止)。 (二)Docker(容器化工具,高频运维)
  • ★ docker ps:查看正在运行的容器,常用参数-a(查看所有容器,包括已停止的),日常查看容器状态的首选命令。
  • ★ docker start/stop/restart 容器名/容器ID:启动、停止、重启容器,如docker restart nginx,高频操作。
  • ★ docker logs -f 容器名/容器ID:实时查看容器日志,排查容器内服务报错,如docker logs -f mysql。
  • docker pull 镜像名:版本:拉取Docker镜像,如docker pull nginx:latest。
  • docker exec -it 容器名/容器ID /bin/bash:进入容器内部,进行调试和操作。 (三)Ansible(自动化运维工具)
  • ★ ansible all -m ping:测试所有被控节点的连通性,验证Ansible环境是否正常。
  • ★ ansible-playbook -i hosts.ini playbook.yml:运行Ansible剧本,批量执行配置、部署等操作,自动化运维的核心命令。
  • ansible all -m command -a "命令":在所有被控节点执行指定命令,如ansible all -m command -a "free -h"。 (四)Prometheus+Grafana(监控工具)
  • ★ systemctl status prometheus:查看Prometheus服务状态,监控服务是否正常运行。
  • ★ systemctl status grafana-server:查看Grafana服务状态,保障监控面板正常访问。
  • promtool check config prometheus.yml:检查Prometheus配置文件语法是否正确。 四、高频命令总结(必背) 以下命令是运维日常工作中使用频率最高(每天多次),必须熟练掌握,可直接复制使用: Linux高频必背
  • top(实时监控资源)、free -h(内存查看)、df -h(磁盘查看)
  • ls -l、cd、cat、tail -f(文件操作与日志查看)
  • ping、netstat -ano(网络与端口排查)
  • ps aux、systemctl status/restart 服务名、kill -9 PID(进程与服务管理)
  • nginx -t、nginx -s reload(Nginx运维)
  • docker ps、docker restart 容器名(Docker运维) Windows高频必背
  • tasklist、taskkill /IM 进程名 /F(进程管理)
  • ipconfig /all(网络配置查看)
  • netstat -ano | findstr "端口号"(端口排查)
  • ping、telnet(网络连通性测试) 说明:所有命令均经过实战验证,适配主流系统版本(Linux:CentOS 7+/Ubuntu 18+;Windows:Win10/Server 2016+),可根据实际环境微调参数。