GaussDB--Ops巡检-GTM进程内存占用异常处理步骤

70 阅读2分钟

告警解释

=======

此告警对应指标“gtm进程内存占用”超出配置阈值,此指标反映gtm进程占用内存的大小。

对系统的影响

  • 一般情况下,如果无变更,gtm进程占用内存都是平稳恒定的。不同的数据库内核版本之间,gtm进程占用的内存会有差别,如果内核升级之后出现此指标上涨之后很快平稳,属于正常现象。
  • 如果出现内存持续上涨不趋于平稳,可能会影响gtm进程的运行,严重时会导致节点上内存资源耗尽,其他组件无法申请到内存。

可能原因

内存泄漏。

处理步骤

  1. 收到告警后,参考查看监控指标查看指标“gtm进程内存占用”,确认指标情况以及触发告警的组件。

  2. 持续观察指标,确认是否趋于平稳,并同步排查是否有数据库内核的升级操作。

    • 如果指标很快趋于平稳,且数据库内核有升级操作,为正常现象,对系统无影响,建议联系技术支持确认上涨后的内存值是否合理。
    • 如果数据库内核没有升级且指标持续上涨,执行3
  3. 登录实例节点,执行如下命令确认gtm的内存占用情况。

    1. 获取gtm进程的PID。

      ps ux | grep gtm | grep -v grep | awk '{print $2}'

    2. 确认RSS列的值和指标展示的是否一致,并联系技术支持处理。

      ps -p 113744 v

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

更多详情请参考GaussDB 文档中心:doc.hcs.huawei.com/db/zh-cn/ga…