云数据库 GaussDB启动增备失败如何解决?

62 阅读2分钟

告警解释

=======

GaussDB启动增备失败,产生告警。

对系统的影响

实例启动增备备份失败,未产生增备的时间点无法恢复。

可能原因

  • Agent处理异常。
  • 内核处理异常。

处理步骤

  1. 参考下载管理节点日志,收集相关失败日志。

  2. 如果管理节点日志中存在“archive on failed”关键字,则错误原因是内核处理异常或者agent处理异常。先尝试通过重新触发关键全备来再次开启(3~7),如果仍然失败在RdsBackupStartAgentLogBackupJob,则需要联系开发人员进行实例节点修复。

  3. 在DBS运维管理平台,选择“实例运维 > 实例管理”,在“实例列表”页签的搜索框中通过实例ID搜索实例信息。

  4. 单击实例名称,进入实例详情页。

  5. 在实例详情页下方“备份设置”处,单击“创建备份”,在弹出框选择是否是关键备份的选项中,选择“True”,单击“确定”,就下发了关键备份操作。

  6. 观察实例的状态,是否为“备份中”,等待备份完成。

  7. 如果备份流程出现失败,停留在RdsBackupStartAgentLogBackupJob处理异常,需要参考登录实例节点登录实例所在虚拟机,并且参考下载管理节点日志收集日志,并收集告警信息,联系技术支持进行处理。

    需要下载的日志信息有:

    管理侧:

    • DBS-GaussDB-backupmanager组件下的日志。
    • DBS-GaussDB-instancemanager组件下的日志。

    租户侧:

    Agent组件下的:

    • /home/Ruby/log/agent.log
    • /home/Ruby/log/asyncJobResult.dat

    GaussDB Kernel组件下的:/var/lib/log/Ruby

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

更多详情请参考GaussDB 文档中心:doc.hcs.huawei.com/db/zh-cn/ga…