关键字:
KingbaseFlySync、KFS、同步程序、replicator、高可用、重连重试、flysync.ini
1.功能描述
KingbaseFlySync在同步过程中,不可避免的会遇到异常情况(例如网络异常、数据库状态异常、磁盘存储异常等)。这些外在的、不可控的异常情况可能会导致replicator状态异常,最终造成KingbaseFlySync同步数据失败。 针对此类场景,KingbaseFlySync提供了自动重连重试机制,根据相关配置,在指定的时间段内,每隔一定的时间间隔,replicator主动发起重连重试,直至replicator状态恢复正常。 如果在指定的时间段内,异常始终未解决,那么replicator将会停止重连重试。待异常恢复后,需要通过手动执行replicator restart来恢复数据同步
2.重连重试场景介绍
主要场景分为以下几类 A、replicator源端和源端数据库间 B、replicator源端和replicator目标端之间(源端和目标端部署在不同服务器) C、replicator目标端和目标端数据库之间 D、replicator读写本地KUFL时
3.配置使用方式介绍
KingbaseFlySync是默认配置重连重试的,也可以根据现场实际业务场景,在flysync.ini文件中手动配置相关参数。具体参数配置如下:
- repl_auto_recovery_max_attempts •描述:自动恢复尝试次数,系统 OFFLINE 时,尝试将系统重新置于 ONLINE 状态的次数 •作用:自动恢复尝试次数,系统 OFFLINE 时,尝试将系统重新置于 ONLINE 状态的次数 •默认值:30 •适用数据源:全部
- repl_auto_recovery_delay_interval •描述:系统 OFFLINE 时,尝试 ONLINE 之前的等待时间 s(秒)、m(分钟)、h(小时) •作用:系统 OFFLINE 时,尝试 ONLINE 之前的等待时间 s(秒)、m(分钟)、h(小时) •默认值:60s •适用数据源:全部
- repl_auto_recovery_reset_interval •描述:系统自动恢复次数重置时间 s(秒)、m(分钟)、h(小时) •作用:自动重启成功后,等待多久可以重置重试次数 •默认值:300s •适用数据源:全部
4.使用示例
flysync.ini中配置示例如下:
效果示例如下(此处通过手动启停数据库模拟)
-
关闭数据库前服务状态正常
-
关闭数据库,KingbaseFlySync因连不上数据库导致服务状态异常
-
再次启动数据库,KingbaseFlySync通过重连重试后服务正常