【GaussDB】Ops巡检-ETCD盘使用率异常解决方法

80 阅读2分钟

告警解释

=======

仅支持混合部署。此告警对应指标“etcd盘使用率(仅混合部署)”超出配置阈值,此指标反映ETCD盘的使用率。

对系统的影响

一般情况下,ETCD数据目录占用的磁盘空间是恒定的,在350MB ~ 400MB。如果此指标达到100%,可能导致ETCD不可用。

可能原因

  • 异常占用磁盘。
  • 磁盘规格变更。

处理步骤

  1. 收到告警后,参考查看监控指标,查看指标“etcd盘使用率(仅混合部署)”,确认指标情况以及触发告警的组件。

  2. 排查ETCD数据目录占用磁盘的情况。

    1. 通过登录实例节点,登录到告警的ETCD所在节点。

    2. 执行命令,获取ETCD数据目录**。**

      ps ux | grep etcd | grep -v grep

      上述命令结果中,--data-dir参数后的值即为ETCD的数据目录,沙箱环境要在此目录前加上/var/chroot。

      如下图示例所示,ETCD的数据目录为:/var/chroot/usr/local/etcd。

    3. 执行du -sh /var/chroot/usr/local/etcd ,获取ETCD数据目录占用磁盘大小。

      • 如果ETCD数据目录占用磁盘大小在350MB ~ 400MB之间,且恒定不上升,执行3
      • 如果ETCD数据目录占用磁盘大小超过400MB,或持续上涨,执行4
  3. 执行命令 查看磁盘大小,如下图所示可以看到ETCD的磁盘大小为63G,使用率1%。

    df -h

    如果因为ETCD盘降规格导致使用率超阈值,执行5

  4. 进入到ETCD的数据目录下,查看目录下文件占用磁盘的大小。

    du -h /var/chroot/usr/local/etcd/*

    • 使用此命令如果查出来的文件同上图不一致,需要现场排查文件来源,是否是误操作。
    • 如果文件名一致,但是占用磁盘大小差距较大,执行5
  5. 联系技术支持进行处理。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

更多详情请参考GaussDB 文档中心:doc.hcs.huawei.com/db/zh-cn/ga…