电科金仓KingbaseFlySync 高可用功能-自动重连重试功能配置与说明

48 阅读2分钟

关键字:

KingbaseFlySync、KFS、同步程序、replicator、高可用、重连重试、flysync.ini

1.功能描述

KingbaseFlySync在同步过程中,不可避免的会遇到异常情况(例如网络异常、数据库状态异常、磁盘存储异常等)。这些外在的、不可控的异常情况可能会导致replicator状态异常,最终造成KingbaseFlySync同步数据失败。 针对此类场景,KingbaseFlySync提供了自动重连重试机制,根据相关配置,在指定的时间段内,每隔一定的时间间隔,replicator主动发起重连重试,直至replicator状态恢复正常。 如果在指定的时间段内,异常始终未解决,那么replicator将会停止重连重试。待异常恢复后,需要通过手动执行replicator restart来恢复数据同步

2.重连重试场景介绍

主要场景分为以下几类 A、replicator源端和源端数据库间 B、replicator源端和replicator目标端之间(源端和目标端部署在不同服务器) C、replicator目标端和目标端数据库之间 D、replicator读写本地KUFL时

3.配置使用方式介绍

KingbaseFlySync是默认配置重连重试的,也可以根据现场实际业务场景,在flysync.ini文件中手动配置相关参数。具体参数配置如下:

  • repl_auto_recovery_max_attempts •描述:自动恢复尝试次数,系统 OFFLINE 时,尝试将系统重新置于 ONLINE 状态的次数 •作用:自动恢复尝试次数,系统 OFFLINE 时,尝试将系统重新置于 ONLINE 状态的次数 •默认值:30 •适用数据源:全部
  • repl_auto_recovery_delay_interval •描述:系统 OFFLINE 时,尝试 ONLINE 之前的等待时间 s(秒)、m(分钟)、h(小时) •作用:系统 OFFLINE 时,尝试 ONLINE 之前的等待时间 s(秒)、m(分钟)、h(小时) •默认值:60s •适用数据源:全部
  • repl_auto_recovery_reset_interval •描述:系统自动恢复次数重置时间 s(秒)、m(分钟)、h(小时) •作用:自动重启成功后,等待多久可以重置重试次数 •默认值:300s •适用数据源:全部

4.使用示例

flysync.ini中配置示例如下: 图片.png

效果示例如下(此处通过手动启停数据库模拟)
  • 关闭数据库前服务状态正常 图片.png

  • 关闭数据库,KingbaseFlySync因连不上数据库导致服务状态异常 图片.png 图片.png

  • 再次启动数据库,KingbaseFlySync通过重连重试后服务正常 图片.png