告警解释
=======
GaussDB启动增备失败,产生告警。
对系统的影响
实例启动增备备份失败,未产生增备的时间点无法恢复。
可能原因
- Agent处理异常。
- 内核处理异常。
处理步骤
-
参考下载管理节点日志,收集相关失败日志。
-
如果管理节点日志中存在“archive on failed”关键字,则错误原因是内核处理异常或者agent处理异常。先尝试通过重新触发关键全备来再次开启(3~7),如果仍然失败在RdsBackupStartAgentLogBackupJob,则需要联系开发人员进行实例节点修复。
-
在DBS运维管理平台,选择“实例运维 > 实例管理”,在“实例列表”页签的搜索框中通过实例ID搜索实例信息。
-
单击实例名称,进入实例详情页。
-
在实例详情页下方“备份设置”处,单击“创建备份”,在弹出框选择是否是关键备份的选项中,选择“True”,单击“确定”,就下发了关键备份操作。
-
观察实例的状态,是否为“备份中”,等待备份完成。
-
如果备份流程出现失败,停留在RdsBackupStartAgentLogBackupJob处理异常,需要参考登录实例节点登录实例所在虚拟机,并且参考下载管理节点日志和收集日志,并收集告警信息,联系技术支持进行处理。
需要下载的日志信息有:
管理侧:
- DBS-GaussDB-backupmanager组件下的日志。
- DBS-GaussDB-instancemanager组件下的日志。
租户侧:
Agent组件下的:
- /home/Ruby/log/agent.log
- /home/Ruby/log/asyncJobResult.dat
GaussDB Kernel组件下的:/var/lib/log/Ruby
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。
更多详情请参考GaussDB 文档中心:doc.hcs.huawei.com/db/zh-cn/ga…