GaussDB--Ops巡检-泄漏句柄数异常如何解决?

112 阅读1分钟

告警解释

=======

此告警对应指标“泄漏句柄数”超出配置的阈值,反映节点上泄漏的句柄总数。

对系统的影响

  • 如果有大量句柄泄漏,可能会导致句柄和磁盘资源被占用。
  • 如果指标持续上涨,不见平稳,极端情况下,会导致句柄或磁盘用尽,影响系统运行。
  • 如果指标上涨后趋于平稳或周期性上涨回落,业务依然正常运行,那风险可控。

可能原因

打开的句柄未关闭。

处理步骤

  1. 收到告警后,通过查看监控指标查看泄漏句柄数指标情况,确认指标情况以及触发告警的节点。

  2. 根据指标的趋势,判断影响。

    • 如果指标持续上涨,无平稳趋势,极端情况下,会导致句柄或磁盘用尽,影响系统运行。
    • 如果指标上涨后趋于平稳或周期性上涨回落,业务依然正常运行,则风险可控,尽快确定泄漏的句柄,彻底消除风险。
  3. 通过登录实例节点,登录告警节点,执行如下命令确认是否有数据输出,输出数据即泄漏的句柄。

    ps ux | grep -E -- 'gaussdb|cm_agent|gs_gtm|agent|cm_server|etcd' | grep -v 'grep' | awk '{print $2}' | xargs -n1 lsof -p | grep 'delete'

  4. 联系技术支持

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

更多详情请参考GaussDB 文档中心:doc.hcs.huawei.com/db/zh-cn/ga…