阿里云国际站:如何监控CPU使用率异常?

使用阿里云 CloudMonitor 服务

  • 创建告警规则

    • 登录 CloudMonitor 控制台 :登录阿里云账号,进入 CloudMonitor 控制台。
    • 进入云产品监控页面 :在左侧导航栏中,单击 “云产品监控”。
    • 选择实例并创建规则 :在 “云产品监控” 页面中,选择 “ECS”,然后在 ECS 实例列表中,选择需要设置 CPU 使用率告警的实例,单击 “创建规则”。
    • 设置规则详情 :在 “创建告警规则” 对话框中,选择 “CPU 使用率 (%)”,设置阈值和周期等条件,例如,设置当 CPU 使用率连续 5 分钟超过 80% 时触发告警。
    • 设置通知方式 :在通知设置区域,选择通知方式,如钉钉消息、短信、邮件等,以便及时收到告警通知。
    • 确认创建规则 :确认无误后,单击 “立即创建规则”。
  • 查看监控数据和告警信息

    • 查看监控数据 :在 CloudMonitor 控制台的 “云产品监控” 页面中,选择 “ECS”,单击目标实例,在实例详情页中查看 CPU 使用率实时监控数据和历史趋势。
    • 查看告警信息 :在 CloudMonitor 控制台的 “告警中心” 页面中,查看已触发的 CPU 使用率告警信息。

使用命令行工具

  • 使用 top 命令

    • 登录服务器 :通过 SSH 等方式登录到阿里云服务器。
    • 运行 top 命令 :在命令行中输入 “top”,按回车键,查看 CPU 使用率等系统资源使用情况。
    • 查看实时监控 :在 top 命令的输出中,第一行的 “%Cpu(s)” 列显示了 CPU 的使用率,包括用户空间、内核空间、空闲等信息。
  • 使用 htop 命令

    • 安装 htop :如果服务器上未安装 htop,可以使用包管理工具进行安装,例如,在 Ubuntu 系统中可以执行 “sudo apt install htop”。
    • 运行 htop 命令 :运行 “htop” 命令,查看 CPU 使用率等信息,htop 提供了更直观的图形化界面。

使用第三方监控工具

  • 使用 Prometheus + Grafana

    • 部署 Prometheus :在阿里云服务器上部署 Prometheus,按照官方文档进行安装和配置,设置监控目标为阿里云 ECS 实例。
    • 部署 Grafana :部署 Grafana,按照官方文档进行安装和配置,将 Prometheus 添加为数据源。
    • 创建监控仪表盘 :在 Grafana 中创建监控仪表盘,添加 CPU 使用率图表,设置告警规则,通过 Grafana 的告警通道发送告警通知。
  • 使用 Zabbix

    • 部署 Zabbix 服务器 :在阿里云服务器上部署 Zabbix 服务器,按照官方文档进行安装和配置。
    • 配置监控客户端 :在被监控的 ECS 实例上安装 Zabbix Agent,配置客户端连接到 Zabbix 服务器。
    • 设置监控项和告警 :在 Zabbix 服务器上设置 CPU 使用率监控项和告警触发器,配置告警通知方式。

利用阿里云 CloudWatch

  • 创建 CloudWatch 警报

    • 登录 CloudWatch 控制台 :登录阿里云账号,进入 CloudWatch 控制台。
    • 创建警报 :选择 “警报” 页面,单击 “创建警报”。
    • 选择指标和设置条件 :选择 “ECS” 作为指标源,选择 “CPU 使用率 (%)”,设置警报触发条件,例如,当 CPU 使用率超过 80% 并持续 5 分钟时触发警报。
    • 设置通知方式 :配置通知方式,如发送通知到指定的钉钉群或电子邮件地址。
    • 完成警报创建 :单击 “创建” 完成警报创建。
  • 查看警报状态和历史记录 :在 CloudWatch 控制台的 “警报” 页面中,查看已创建的警报状态和历史记录。