当数据库发生故障时,你会如何进行应急处理?本文通过梳理南大通用GBase 8a数据库系统使用中可能出现的各种异常情况,以期帮助大家应对GBase 8a数据库使用中的突发故障,提供基本的问题解决思路。
4.数据库服务异常
4.1 GBase集群服务进程crash
现象描述
集群各节点服务:gclusterd、gbased、gcware、gcrecover、gc_sync_server 5个进程异常crash。
现象分析
集群各节点服务:gclusterd、gbased、gcware、gcrecover、gc_sync_server 5个进程异常crash。
应急操作流程
此种异常大多由于某条SQL或某场景下触发GBase bug导致,需要通知应用协助排查问题原因。
1)通知开放平台和GBase厂商协助排查问题。
2)运行部门分析系统中运行的异常SQL。
3)运行部门停止产生问题的SQL。
4)GBase厂商分析该问题场景,提供短期解决方法及后续修复时间。
4.2.GBase集群服务无法启动
现象描述
集群各节点服务:gclusterd、gbased、gcware、gcrecover、gc_sync_server服务无法启动。
现象分析
集群各节点服务:gclusterd、gbased、gcware、gcrecover、gc_sync_server 服务无法启动,通常情况为GBase 8a集群产品bug导致。
应急操作流程
通常情况为GBase 8a集群产品bug导致。
1)运行部门通知开放平台和GBase厂商协助排查问题。
2)运行部门和GBase厂商分析运行日志及运行场景。
3)GBase厂商分析该问题场景,提供短期解决方法及后续修复时间