GaussDB--Ops巡检-CMA进程启动时间异常解决方法

125 阅读1分钟

告警解释

此告警对应指标“CMA进程启动时间”,此指标反映cm_agent进程启动的时间超出阈值,如果此指标的值发生更新,说明cm_agent进程重启。

对系统的影响

重启会导致业务闪断。

可能原因

  • 存在变更操作
  • 存在重启进程操作。
  • 虚拟机、物理机重启。
  • CMA故障。

处理步骤

  1. 收到告警后,首先查看监控指标查看指标“CMA进程启动时间”,确认指标情况以及触发告警的组件。

  2. 确认是否有内核升级或重启进程的操作。

    • 如果有属于正常重启,重启时间在变更期间,符合预期。
    • 如果无,执行3
  3. 确认虚拟机和物理机是否发生过重启,可以通过登录告警组件所在节点,执行如下命令,查看所有进程的启动时间。

    ps -T

    • 如果节点上所有进程启动时间相同,可能是虚拟机或者物理机发生过重启,执行5

    • 如果不相同,执行4

  4. 确认重启时间周围,是否有其他的事件告警或者故障告警存在。

    • 如果有,按照对应告警的处理方式处理,处理完再关注告警是否自动消除,长时间未消除,执行5
    • 如果无,执行5
  5. 联系技术支持

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

更多详情请参考GaussDB 文档中心:doc.hcs.huawei.com/db/zh-cn/ga…