GaussDB--Ops巡检-OMA进程启动时间异常怎么避免?

33 阅读1分钟

告警解释

=======

此告警对应指标“oma进程启动时间”,此指标反映om_agent进程启动的时间,如果此指标的值发生更新,说明om_agent进程重启。

对系统的影响

重启会导致运维操作失败,比如:备份等。

可能原因

  • 变更操作重启进程。
  • 虚拟机、物理机重启。

处理步骤

  1. 收到告警后,通过查看监控指标查看指标“oma进程启动时间”,确认指标情况以及触发告警的组件。

  2. 确认是否有内核升级或重启om_agent进程的变更操作。

    • 如果有属于正常重启,重启时间在变更期间,符合预期。
    • 否则,执行3
  3. 确认虚拟机和物理机是否发生过重启,可以登录告警组件所在节点,执行如下命令,查看所有进程的启动时间。

    ps -T

    • 如果节点上所有进程启动时间相同,可能是虚拟机或者物理机发生过重启,需要查看云底座问题,联系技术支持协助处理。
    • 否则,执行4
  4. 确认重启时间周围,是否有其他的事件告警或者故障告警。

    • 如果有,按照对应告警的处理方式处理。
    • 否则,执行5
  5. 上述无法处理,联系技术支持

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

更多详情请参考GaussDB 文档中心:doc.hcs.huawei.com/db/zh-cn/ga…