同步利器之Canal源码解析canal是阿里巴巴开源的mysql数据库binlog的增量订阅&消费组件。项目g

canal是阿里巴巴开源的mysql数据库binlog的增量订阅&消费组件。项目github地址为：github.com/alibaba/can…

本教程是从源码的角度来分析canal，适用于对canal有一定基础的同学。本教程使用的版本是1.1.4，这也是笔者写这篇教程时的最新稳定版，关于canal的基础知识可以参考：github.com/alibaba/can…

下载项目源码

git clone https://github.com/alibaba/canal.git

切换到canal-1.1.4这个tag

git checkout canal-1.1.4

1. 源码模块划分

canal是基于maven构建的，使用模块如下所示：

模块虽多，但是每个模块的代码都很少。各个模块的作用如下所示：

common模块：主要是提供了一些公共的工具类和接口。

client模块：canal的客户端。核心接口为CanalConnector

example模块：提供client模块使用案例。

protocol模块：client和server模块之间的通信协议

deployer：部署模块。通过该模块提供的CanalLauncher来启动canal server

server模块：canal服务器端。核心接口为CanalServer

instance模块：一个server有多个instance。每个instance都会模拟成一个mysql实例的slave。instance模块有四个核心组成部分：parser模块、sink模块、store模块，meta模块。核心接口为CanalInstance

parser模块：数据源接入，模拟slave协议和master进行交互，协议解析。parser模块依赖于dbsync、driver模块。

driver模块和dbsync模块：从这两个模块的artifactId(canal.parse.driver、canal.parse.dbsync)，就可以看出来，这两个模块实际上是parser模块的组件。事实上parser 是通过driver模块与mysql建立连接，从而获取到binlog。由于原始的binlog都是二进制流，需要解析成对应的binlog事件，这些binlog事件对象都定义在dbsync模块中，dbsync 模块来自于淘宝的tddl。

sink模块：parser和store链接器，进行数据过滤，加工，分发的工作。核心接口为CanalEventSink

store模块：数据存储。核心接口为CanalEventStore

meta模块：增量订阅&消费信息管理器，核心接口为CanalMetaManager，主要用于记录canal消费到的mysql binlog的位置，

下面再通过一张图来说明各个模块之间的依赖关系：

通过deployer模块，启动一个canal-server，一个cannal-server内部包含多个instance，每个instance都会伪装成一个mysql实例的slave。client与server之间的通信协议由protocol模块定义。client在订阅binlog信息时，需要传递一个destination参数，server会根据这个destination确定由哪一个instance为其提供服务。

我们先看一下deployer模块：

canal有两种使用方式：1、独立部署 2、内嵌到应用中。 deployer模块主要用于独立部署canal server。关于这两种方式的区别，请参见server模块源码分析。deployer模块源码目录结构如下所示：

deployer模块主要完成以下功能：

读取canal,properties配置文件

启动canal server，监听canal client的请求

启动canal instance，连接mysql数据库，伪装成slave，解析binlog

在canal的运行过程中，监听配置文件的变化

startup.sh脚本内，会调用com.alibaba.otter.canal.deployer.CanalLauncher类来进行启动，这是分析Canal源码的入口类，如下图所示：

所以我们来解析一下CanalLauncher类

读取canal.properties文件中的配置

利用读取的配置构造一个CanalController实例，将所有的启动操作都委派给CanalController进行处理。

最后注册一个钩子函数，在JVM停止时同时也停止canal server。

public class CanalLauncher {
 
    private static final String CLASSPATH_URL_PREFIX = "classpath:";
    private static final Logger logger               = LoggerFactory.getLogger(CanalLauncher.class);
 
    public static void main(String[] args) throws Throwable {
        try {
            //1、读取canal.properties文件中配置，默认读取classpath下的canal.properties
            String conf = System.getProperty("canal.conf", "classpath:canal.properties");
            Properties properties = new Properties();
            if (conf.startsWith(CLASSPATH_URL_PREFIX)) {
                conf = StringUtils.substringAfter(conf, CLASSPATH_URL_PREFIX);
                properties.load(CanalLauncher.class.getClassLoader().getResourceAsStream(conf));
            } else {
                properties.load(new FileInputStream(conf));
            }
            //2、启动canal，首先将properties对象传递给CanalController，然后调用其start方法启动
            logger.info("## start the canal server.");
            final CanalController controller = new CanalController(properties);
            controller.start();
            logger.info("## the canal server is running now ......");
            //3、关闭canal，通过添加JVM的钩子，JVM停止前会回调run方法，其内部调用controller.stop()方法进行停止
            Runtime.getRuntime().addShutdownHook(new Thread() {
 
                public void run() {
                    try {
                        logger.info("## stop the canal server");
                        controller.stop();
                    } catch (Throwable e) {
                        logger.warn("##something goes wrong when stopping canal Server:\n{}",
                            ExceptionUtils.getFullStackTrace(e));
                    } finally {
                        logger.info("## canal server is down.");
                    }
                }
 
            });
        } catch (Throwable e) {
            logger.error("## Something goes wrong when starting up the canal Server:\n{}",
                ExceptionUtils.getFullStackTrace(e));
            System.exit(0);
        }
    }
}

可以看到，CanalLauncher实际上只是负责读取canal.properties配置文件，然后构造CanalController对象，并通过其start和stop方法来开启和停止canal。因此，如果说CanalLauncher是canal源码分析的入口类，那么CanalController就是canal源码分析的核心类。

在CanalController的构造方法中，会对配置文件内容解析，初始化相关成员变量，做好canal server的启动前的准备工作，之后在CanalLauncher中调用CanalController.start方法来启动。

public class CanalController {
 
    private static final Logger  logger   = LoggerFactory.getLogger(CanalController.class);
    private Long                                     cid;
    private String                                   ip; 
    private int                                  port;
    // 默认使用spring的方式载入    
    private Map<String, InstanceConfig>              instanceConfigs;
    private InstanceConfig                           globalInstanceConfig;
    private Map<String, CanalConfigClient>           managerClients;
    // 监听instance config的变化
    private boolean                             autoScan = true;
    private InstanceAction                           defaultAction;
    private Map<InstanceMode, InstanceConfigMonitor> instanceConfigMonitors;
    private CanalServerWithEmbedded                  embededCanalServer;
    private CanalServerWithNetty                     canalServer;
 
    private CanalInstanceGenerator                   instanceGenerator;
    private ZkClientx                                zkclientx;
 
    public CanalController(){
        this(System.getProperties());
    }
 
    public CanalController(final Properties properties){
        managerClients = MigrateMap.makeComputingMap(new Function<String, CanalConfigClient>() {
 
            public CanalConfigClient apply(String managerAddress) {
                return getManagerClient(managerAddress);
            }
        });
         //1、配置解析    
       globalInstanceConfig = initGlobalConfig(properties);
        instanceConfigs = new MapMaker().makeMap();      
       initInstanceConfig(properties);
 
        // 2、准备canal server
        cid = Long.valueOf(getProperty(properties, CanalConstants.CANAL_ID));
        ip = getProperty(properties, CanalConstants.CANAL_IP);
        port = Integer.valueOf(getProperty(properties, CanalConstants.CANAL_PORT));
        embededCanalServer = CanalServerWithEmbedded.instance();
        embededCanalServer.setCanalInstanceGenerator(instanceGenerator);// 设置自定义的instanceGenerator       
       canalServer = CanalServerWithNetty.instance();
        canalServer.setIp(ip);
        canalServer.setPort(port);
        
         //3、初始化zk相关代码 
        // 处理下ip为空，默认使用hostIp暴露到zk中       
       if (StringUtils.isEmpty(ip)) {
            ip = AddressUtils.getHostIp();
        }
        final String zkServers = getProperty(properties, CanalConstants.CANAL_ZKSERVERS);
        if (StringUtils.isNotEmpty(zkServers)) {
            zkclientx = ZkClientx.getZkClient(zkServers);
            // 初始化系统目录           
          zkclientx.createPersistent(ZookeeperPathUtils.DESTINATION_ROOT_NODE, true);
            zkclientx.createPersistent(ZookeeperPathUtils.CANAL_CLUSTER_ROOT_NODE, true);
        }
        //4 CanalInstance运行状态监控
        final ServerRunningData serverData = new ServerRunningData(cid, ip + ":" + port);
        ServerRunningMonitors.setServerData(serverData);
        ServerRunningMonitors.setRunningMonitors(//...);
 
        //5、autoScan机制相关代码    
       autoScan = BooleanUtils.toBoolean(getProperty(properties, CanalConstants.CANAL_AUTO_SCAN));
        if (autoScan) {
            defaultAction = new InstanceAction() {//....};
 
            instanceConfigMonitors = //....
        }
    }
....
}

为了读者能够尽量容易的看出CanalController的构造方法中都做了什么，上面代码片段中省略了部分代码。这样，我们可以很明显的看出来，，在CanalController构造方法中的代码分划分为了固定的几个处理步骤，下面按照几个步骤的划分，逐一进行讲解，并详细的介绍CanalController中定义的各个字段的作用。

配置解析相关代码

// 初始化全局参数设置       
globalInstanceConfig = initGlobalConfig(properties);
instanceConfigs = new MapMaker().makeMap();
// 初始化instance config       
initInstanceConfig(properties);

表示canal instance的全局配置，类型为InstanceConfig，通过initGlobalConfig方法进行初始化。主要用于解析canal.properties以下几个配置项：

canal.instance.global.mode：确定canal instance配置加载方式，取值有manager|spring两种方式

canal.instance.global.lazy：确定canal instance是否延迟初始化

canal.instance.global.manager.address：配置中心地址。如果canal.instance.global.mode=manager，需要提供此配置项

canal.instance.global.spring.xml：spring配置文件路径。如果canal.instance.global.mode=spring，需要提供此配置项 initGlobalConfig源码如下所示：

private InstanceConfig initGlobalConfig(Properties properties) {
    InstanceConfig globalConfig = new InstanceConfig();
    //读取canal.instance.global.mode
    String modeStr = getProperty(properties, CanalConstants.getInstanceModeKey(CanalConstants.GLOBAL_NAME));
    if (StringUtils.isNotEmpty(modeStr)) {
        //将modelStr转成枚举InstanceMode，这是一个枚举类，只有2个取值，SPRING\MANAGER，对应两种配置方式
        globalConfig.setMode(InstanceMode.valueOf(StringUtils.upperCase(modeStr)));
    }
    //读取canal.instance.global.lazy
    String lazyStr = getProperty(properties, CanalConstants.getInstancLazyKey(CanalConstants.GLOBAL_NAME));
    if (StringUtils.isNotEmpty(lazyStr)) {
        globalConfig.setLazy(Boolean.valueOf(lazyStr));
    }
   //读取canal.instance.global.manager.address
    String managerAddress = getProperty(properties,
        CanalConstants.getInstanceManagerAddressKey(CanalConstants.GLOBAL_NAME));
    if (StringUtils.isNotEmpty(managerAddress)) {
        globalConfig.setManagerAddress(managerAddress);
    }
    //读取canal.instance.global.spring.xml
    String springXml = getProperty(properties, CanalConstants.getInstancSpringXmlKey(CanalConstants.GLOBAL_NAME));
    if (StringUtils.isNotEmpty(springXml)) {
        globalConfig.setSpringXml(springXml);
    }
 
    instanceGenerator = //...初始化instanceGenerator 
 
    return globalConfig;
}

其中canal.instance.global.mode用于确定canal instance的全局配置加载方式，其取值范围有2个：spring、manager。我们知道一个canal server中可以启动多个canal instance，每个instance都有各自的配置。instance的配置也可以放在本地，也可以放在远程配置中心里。我们可以自定义每个canal instance配置文件存储的位置，如果所有canal instance的配置都在本地或者远程，此时我们就可以通过canal.instance.global.mode这个配置项，来统一的指定配置文件的位置，避免为每个canal instance单独指定。

spring方式：

表示所有的canal instance的配置文件位于本地。此时，我们必须提供配置项canal.instance.global.spring.xml指定spring配置文件的路径。canal提供了多个spring配置文件：file-instance.xml、default-instance.xml、memory-instance.xml、local-instance.xml、group-instance.xml。这么多配置文件主要是为了支持canal instance不同的工作方式。我们在稍后将会讲解各个配置文件的区别。而在这些配置文件的开头，我们无一例外的可以看到以下配置：

<bean class="com.alibaba.otter.canal.instance.spring.support.PropertyPlaceholderConfigurer" lazy-init="false">
        <property name="ignoreResourceNotFound" value="true" />
        <property name="systemPropertiesModeName" value="SYSTEM_PROPERTIES_MODE_OVERRIDE"/><!-- 允许system覆盖 -->
        <property name="locationNames">
            <list>
                <value>classpath:canal.properties</value>
                <value>classpath:${canal.instance.destination:}/instance.properties</value>
            </list>
        </property>
    </bean>

这里我们可以看到，所谓通过spring方式加载canal instance配置，无非就是通过spring提供的PropertyPlaceholderConfigurer来加载canal instance的配置文件instance.properties。

这里instance.properties的文件完整路径是 ${canal.instance.destination:}/instance.properties，其中$ {canal.instance.destination}是一个变量。这是因为我们可以在一个canal server中配置多个canal instance，每个canal instance配置文件的名称都是instance.properties，因此我们需要通过目录进行区分。例如我们通过配置项canal.destinations指定多个canal instance的名字

canal.destinations= example1,example2

此时我们就要conf目录下，新建两个子目录example1和example2，每个目录下各自放置一个instance.properties。

canal在初始化时就会分别使用example1和example2来替换${canal.instance.destination:}，从而分别根据example1/instance.properties和example2/instance.properties创建2个canal instance。

manager方式：

表示所有的canal instance的配置文件位于远程配置中心，此时我们必须提供配置项 canal.instance.global.manager.address来指定远程配置中心的地址。目前alibaba内部配置使用这种方式。开发者可以自己实现CanalConfigClient，连接各自的管理系统，完成接入。

准备canal server相关代码

cid = Long.valueOf(getProperty(properties, CanalConstants.CANAL_ID));
ip = getProperty(properties, CanalConstants.CANAL_IP);
port = Integer.valueOf(getProperty(properties, CanalConstants.CANAL_PORT));
 
embededCanalServer = CanalServerWithEmbedded.instance();
embededCanalServer.setCanalInstanceGenerator(instanceGenerator);// 设置自定义的instanceGenerator
canalServer = CanalServerWithNetty.instance();
canalServer.setIp(ip);
canalServer.setPort(port);

上述代码中，首先解析了cid、ip、port字段，其中：

cid：Long，对应canal.properties文件中的canal.id，目前无实际用途

ip：String，对应canal.properties文件中的canal.ip，canal server监听的ip。

port：int，对应canal.properties文件中的canal.port，canal server监听的端口之后分别为以下两个字段赋值：

embededCanalServer：类型为CanalServerWithEmbedded

canalServer：类型为CanalServerWithNetty

CanalServerWithEmbedded 和 CanalServerWithNetty都实现了CanalServer接口，且都实现了单例模式，通过静态方法instance获取实例。

关于这两种类型的实现，canal官方文档有以下描述：说白了，就是我们可以不必独立部署canal server。在应用直接使用CanalServerWithEmbedded直连mysql数据库。如果觉得自己的技术hold不住相关代码，就独立部署一个canal server，使用canal提供的客户端，连接canal server获取binlog解析后数据。而CanalServerWithNetty是在CanalServerWithEmbedded的基础上做的一层封装，用于与客户端通信。

在独立部署canal server时，Canal客户端发送的所有请求都交给CanalServerWithNetty处理解析，解析完成之后委派给了交给CanalServerWithEmbedded进行处理。因此CanalServerWithNetty就是一个马甲而已。CanalServerWithEmbedded才是核心。

因此，在上述代码中，我们看到，用于生成CanalInstance实例的instanceGenerator被设置到了CanalServerWithEmbedded中，而ip和port被设置到CanalServerWithNetty中。

关于CanalServerWithNetty如何将客户端的请求委派给CanalServerWithEmbedded进行处理，我们将在server模块源码分析中进行讲解。

初始化zk相关代码

 //读取canal.properties中的配置项canal.zkServers，如果没有这个配置，则表示项目不使用zk
final String zkServers = getProperty(properties, CanalConstants.CANAL_ZKSERVERS);
if (StringUtils.isNotEmpty(zkServers)) {
    //创建zk实例
    zkclientx = ZkClientx.getZkClient(zkServers);
    // 初始化系统目录
    //destination列表，路径为/otter/canal/destinations
    zkclientx.createPersistent(ZookeeperPathUtils.DESTINATION_ROOT_NODE, true);
    //整个canal server的集群列表，路径为/otter/canal/cluster
    zkclientx.createPersistent(ZookeeperPathUtils.CANAL_CLUSTER_ROOT_NODE, true);
}

canal支持利用了zk来完成HA机制、以及将当前消费到到的mysql的binlog位置记录到zk中。ZkClientx是canal对ZkClient进行了一层简单的封装。

显然，当我们没有配置canal.zkServers，那么zkclientx不会被初始化。

关于Canal如何利用ZK做HA，我们将在稍后的代码中进行分。而利用zk记录binlog的消费进度，将在之后的章节进行分析。

CanalInstance运行状态监控相关代码

由于这段代码比较长且恶心，这里笔者暂时对部分代码进行省略，以便读者看清楚整各脉络

final ServerRunningData serverData = new ServerRunningData(cid, ip + ":" + port);
        ServerRunningMonitors.setServerData(serverData);
        ServerRunningMonitors.setRunningMonitors(MigrateMap.makeComputingMap(new Function<String, ServerRunningMonitor>() {
            public ServerRunningMonitor apply(final String destination) {
                ServerRunningMonitor runningMonitor = new ServerRunningMonitor(serverData);
                runningMonitor.setDestination(destination);
                runningMonitor.setListener(new ServerRunningListener() {....});//省略ServerRunningListener的具体实现
                if (zkclientx != null) {
                    runningMonitor.setZkClient(zkclientx);
                }
                // 触发创建一下cid节点
                runningMonitor.init();
                return runningMonitor;
            }
        }));

上述代码中，ServerRunningMonitors是ServerRunningMonitor对象的容器，而ServerRunningMonitor用于监控CanalInstance。

canal会为每一个destination创建一个CanalInstance，每个CanalInstance都会由一个ServerRunningMonitor来进行监控。而ServerRunningMonitor统一由ServerRunningMonitors进行管理。

除了CanalInstance需要监控，CanalServer本身也需要监控。因此我们在代码一开始，就看到往ServerRunningMonitors设置了一个ServerRunningData对象，封装了canal server监听的ip和端口等信息。

ServerRunningMonitors源码如下所示：

public class ServerRunningMonitors {
    private static ServerRunningData serverData;
    private static Map               runningMonitors; // <String,ServerRunningMonitor>
    public static ServerRunningData getServerData() {
        return serverData;
    }
    public static Map<String, ServerRunningMonitor> getRunningMonitors() {
        return runningMonitors;
    }
    public static ServerRunningMonitor getRunningMonitor(String destination) {
        return (ServerRunningMonitor) runningMonitors.get(destination);
    }
    public static void setServerData(ServerRunningData serverData) {
        ServerRunningMonitors.serverData = serverData;
    }
    public static void setRunningMonitors(Map runningMonitors) {
        ServerRunningMonitors.runningMonitors = runningMonitors;
    }
}

ServerRunningMonitors的setRunningMonitors方法接收的参数是一个Map，其中Map的key是destination，value是ServerRunningMonitor，也就是说针对每一个destination都有一个ServerRunningMonitor来监控。

上述代码中，在往ServerRunningMonitors设置Map时，是通过MigrateMap.makeComputingMap方法来创建的，其接受一个Function类型的参数，这是guava中定义的接口，其声明了apply抽象方法。其工作原理可以通过下面代码片段进行介绍：

Map<String, User> map = MigrateMap.makeComputingMap(new Function<String, User>() {
            @Override
            public User apply(String name) {
                return new User(name);
            }
        });
User user = map.get("tianshouzhi");//第一次获取时会创建
assert user != null;
assert user == map.get("tianshouzhi");//之后获取，总是返回之前已经创建的对象

这段代码中，我们利用MigrateMap.makeComputingMap创建了一个Map，其中key为String类型，value为User类型。当我们调用map.get("tianshouzhi")方法，最开始这个Map中并没有任何key/value的，于是其就会回调Function的apply方法，利用参数"tianshouzhi"创建一个User对象并返回。之后当我们再以"tianshouzhi"为key从Map中获取User对象时，会直接将前面创建的对象返回。不会回调apply方法，也就是说，只有在第一次尝试获取时，才会回调apply方法。

而在上述代码中，实际上就利用了这个特性，只不过是根据destination获取ServerRunningMonitor对象，如果不存在就创建。

在创建ServerRunningMonitor对象时，首先根据ServerRunningData创建ServerRunningMonitor实例，之后设置了destination和ServerRunningListener对象，接着，判断如果zkClientx字段如果不为空，也设置到ServerRunningMonitor中，最后调用init方法进行初始化。

ServerRunningMonitor runningMonitor = new ServerRunningMonitor(serverData);
runningMonitor.setDestination(destination);
runningMonitor.setListener(new ServerRunningListener(){...})//省略ServerRunningListener具体代码
if (zkclientx != null) {
runningMonitor.setZkClient(zkclientx);
}
// 触发创建一下cid节点
runningMonitor.init();
return runningMonitor;

ServerRunningListener的实现如下：

new ServerRunningListener() {
    /*内部调用了embededCanalServer的start(destination)方法。
    此处需要划重点，说明每个destination对应的CanalInstance是通过embededCanalServer的start方法启动的，
    这与我们之前分析将instanceGenerator设置到embededCanalServer中可以对应上。
    embededCanalServer负责调用instanceGenerator生成CanalInstance实例，并负责其启动。*/
     public void processActiveEnter() {
         try {
             MDC.put(CanalConstants.MDC_DESTINATION, String.valueOf(destination));
             embededCanalServer.start(destination);
         } finally {
             MDC.remove(CanalConstants.MDC_DESTINATION);
         }
     }
  //内部调用embededCanalServer的stop(destination)方法。与上start方法类似，只不过是停止CanalInstance。
     public void processActiveExit() {
         try {
             MDC.put(CanalConstants.MDC_DESTINATION, String.valueOf(destination));
             embededCanalServer.stop(destination);
         } finally {
             MDC.remove(CanalConstants.MDC_DESTINATION);
         }
     }
     /*处理存在zk的情况下，在Canalinstance启动之前，在zk中创建节点。
     路径为：/otter/canal/destinations/{0}/cluster/{1}，其0会被destination替换，1会被ip:port替换。
     此方法会在processActiveEnter()之前被调用*/
     public void processStart() {
         try {
             if (zkclientx != null) {
                 final String path = ZookeeperPathUtils.getDestinationClusterNode(destination, ip + ":" + port);
                 initCid(path);
                 zkclientx.subscribeStateChanges(new IZkStateListener() {
                     public void handleStateChanged(KeeperState state) throws Exception {
                     }
                     public void handleNewSession() throws Exception {
                         initCid(path);
                     }
                 });
             }
         } finally {
             MDC.remove(CanalConstants.MDC_DESTINATION);
         }
     }
//处理存在zk的情况下，在Canalinstance停止前，释放zk节点，路径为/otter/canal/destinations/{0}/cluster/{1}，
//其0会被destination替换，1会被ip:port替换。此方法会在processActiveExit()之前被调用
     public void processStop() {
         try {
             MDC.put(CanalConstants.MDC_DESTINATION, String.valueOf(destination));
             if (zkclientx != null) {
                 final String path = ZookeeperPathUtils.getDestinationClusterNode(destination, ip + ":" + port);
                 releaseCid(path);
             }
         } finally {
             MDC.remove(CanalConstants.MDC_DESTINATION);
         }
     }
}

上述代码中，我们可以看到启动一个CanalInstance实际上是在ServerRunningListener的processActiveEnter方法中，通过调用embededCanalServer的start(destination)方法进行的，对于停止也是类似。

那么ServerRunningListener中的相关方法到底是在哪里回调的呢？我们可以在ServerRunningMonitor的start和stop方法中找到答案，这里只列出start方法。

public class ServerRunningMonitor extends AbstractCanalLifeCycle {
 
...
public void start() {
    super.start();
    processStart();//其内部会调用ServerRunningListener的processStart()方法
    if (zkClient != null) {//存在zk，以HA方式启动
        // 如果需要尽可能释放instance资源，不需要监听running节点，不然即使stop了这台机器，另一台机器立马会start
        String path = ZookeeperPathUtils.getDestinationServerRunning(destination);
        zkClient.subscribeDataChanges(path, dataListener);
 
        initRunning();
    } else {//没有zk，直接启动
        processActiveEnter();
    }
}
 
//...stop方法逻辑类似，相关代码省略
}

当ServerRunningMonitor的start方法被调用时，其首先会直接调用processStart方法，这个方法内部直接调了ServerRunningListener的processStart()方法，源码如下所示。通过前面的分析，我们已经知道在存在zkClient!=null的情况，会往zk中创建一个节点。

private void processStart() {
    if (listener != null) {
        try {
            listener.processStart();
        } catch (Exception e) {
            logger.error("processStart failed", e);
        }
    }
}

之后会判断是否存在zkClient，如果不存在，则以本地方式启动，如果存在，则以HA方式启动。我们知道，canal server可以部署成两种方式：集群方式或者独立部署。其中集群方式是利用zk来做HA，独立部署则可以直接进行启动。我们先来看比较简单的直接启动。

直接启动：

不存在zk的情况下，会进入else代码块，调用processActiveEnter方法，其内部调用了listener的processActiveEnter，启动相应destination对应的CanalInstance。

private void processActiveEnter() {
    if (listener != null) {
        try {
            listener.processActiveEnter();
        } catch (Exception e) {
            logger.error("processActiveEnter failed", e);
        }
    }
}

HA方式启动：

存在zk，说明canal server可能做了集群，因为canal就是利用zk来做HA的。首先根据destination构造一个zk的节点路径，然后进行监听。

/*构建临时节点的路径：/otter/canal/destinations/{0}/running，其中占位符{0}会被destination替换。
在集群模式下，可能会有多个canal server共同处理同一个destination，
在某一时刻，只能由一个canal server进行处理，处理这个destination的canal server进入running状态，其他canal server进入standby状态。*/
String path = ZookeeperPathUtils.getDestinationServerRunning(destination);
 
/*对destination对应的running节点进行监听，一旦发生了变化，则说明可能其他处理相同destination的canal server可能出现了异常，
此时需要尝试自己进入running状态。*/
zkClient.subscribeDataChanges(path, dataListener);

上述只是监听代码，之后尝试调用initRunning方法通过HA的方式来启动CanalInstance。

private void initRunning() {
    if (!isStart()) {
        return;
    }
    //构建临时节点的路径：/otter/canal/destinations/{0}/running，其中占位符{0}会被destination替换
    String path = ZookeeperPathUtils.getDestinationServerRunning(destination);
    // 序列化
    //构建临时节点的数据，标记当前destination由哪一个canal server处理
    byte[] bytes = JsonUtils.marshalToByte(serverData);
    try {
        mutex.set(false);
        //尝试创建临时节点。如果节点已经存在，说明是其他的canal server已经启动了这个canal instance。
        //此时会抛出ZkNodeExistsException，进入catch代码块。
        zkClient.create(path, bytes, CreateMode.EPHEMERAL);
        activeData = serverData;
        processActiveEnter();//如果创建成功，触发一下事件，内部调用ServerRunningListener的processActiveEnter方法
        mutex.set(true);
    } catch (ZkNodeExistsException e) {
      //创建节点失败，则根据path从zk中获取当前是哪一个canal server创建了当前canal instance的相关信息。
      //第二个参数true，表示的是，如果这个path不存在，则返回null。
        bytes = zkClient.readData(path, true);
        if (bytes == null) {// 如果不存在节点，立即尝试一次            
            initRunning();
        } else {
        //如果的确存在，则将创建该canal instance实例信息存入activeData中。
            activeData = JsonUtils.unmarshalFromByte(bytes, ServerRunningData.class);
        }
    } catch (ZkNoNodeException e) {//如果/otter/canal/destinations/{0}/节点不存在，进行创建其中占位符{0}会被destination替换
        zkClient.createPersistent(ZookeeperPathUtils.getDestinationPath(destination), true); 
       // 尝试创建父节点        
        initRunning();
    }
}

可以看到，initRunning方法内部只有在尝试在zk中创建节点成功后，才会去调用listener的processActiveEnter方法来真正启动destination对应的canal instance，这是canal HA方式启动的核心。canal官方文档中介绍了CanalServer HA机制启动的流程，如下：

事实上，这个说明的前两步，都是在initRunning方法中实现的。从上面的代码中，我们可以看出，在HA机启动的情况下，initRunning方法不一定能走到processActiveEnter()方法，因为创建临时节点可能会出错。

此外，根据官方文档说明，如果出错，那么当前canal instance则进入standBy状态。也就是另外一个canal instance出现异常时，当前canal instance顶上去。那么相关源码在什么地方呢？在HA方式启动最开始的2行代码的监听逻辑中：

String path = ZookeeperPathUtils.getDestinationServerRunning(destination);
zkClient.subscribeDataChanges(path, dataListener);

其中dataListener类型是IZkDataListener，这是zkclient客户端提供的接口，定义如下：

public interface IZkDataListener {
    public void handleDataChange(String dataPath, Object data) throws Exception;
    public void handleDataDeleted(String dataPath) throws Exception;
}

当zk节点中的数据发生变更时，会自动回调这两个方法，很明显，一个是用于处理节点数据发生变化，一个是用于处理节点数据被删除。

而dataListener是在ServerRunningMonitor的构造方法中初始化的，如下：

public ServerRunningMonitor(){
    // 创建父节点
    dataListener = new IZkDataListener() {
        //！！！目前看来，好像并没有存在修改running节点数据的代码，为什么这个方法不是空实现？
        public void handleDataChange(String dataPath, Object data) throws Exception {
            MDC.put("destination", destination);
            ServerRunningData runningData = JsonUtils.unmarshalFromByte((byte[]) data, ServerRunningData.class);
            if (!isMine(runningData.getAddress())) {
                mutex.set(false);
            }
 
            if (!runningData.isActive() && isMine(runningData.getAddress())) { // 说明出现了主动释放的操作，并且本机之前是active                                   
              release = true;
                releaseRunning();// 彻底释放mainstem            }
 
            activeData = (ServerRunningData) runningData;
        }
        //当其他canal instance出现异常，临时节点数据被删除时，会自动回调这个方法，此时当前canal instance要顶上去
        public void handleDataDeleted(String dataPath) throws Exception {
            MDC.put("destination", destination);
            mutex.set(false);
            if (!release && activeData != null && isMine(activeData.getAddress())) {
                // 如果上一次active的状态就是本机，则即时触发一下active抢占                
                initRunning();
            } else {
                // 否则就是等待delayTime，避免因网络瞬端或者zk异常，导致出现频繁的切换操作                
                delayExector.schedule(new Runnable() {
 
                    public void run() {
                        initRunning();//尝试自己进入running状态
                    }
                }, delayTime, TimeUnit.SECONDS);
            }
        }
 
    };
 
}

那么现在问题来了？ServerRunningMonitor的start方法又是在哪里被调用的，这个方法被调用了，才能真正的启动canal instance。这部分代码我们放到后面的CanalController中的start方法进行讲解。

autoScan机制相关代码

//   
autoScan = BooleanUtils.toBoolean(getProperty(properties, CanalConstants.CANAL_AUTO_SCAN));
        if (autoScan) {
            defaultAction = new InstanceAction() {//....};
 
            instanceConfigMonitors = //....
        }

可以看到，autoScan是否需要自动扫描的开关，只有当autoScan为true时，才会初始化defaultAction字段和instanceConfigMonitors字段。其中：

其中： defaultAction：其作用是如果配置发生了变更，默认应该采取什么样的操作。其实现了InstanceAction接口定义的三个抽象方法：start、stop和reload。当新增一个destination配置时，需要调用start方法来启动；当移除一个destination配置时，需要调用stop方法来停止；当某个destination配置发生变更时，需要调用reload方法来进行重启。

instanceConfigMonitors：类型为Map<InstanceMode, InstanceConfigMonitor>。defaultAction字段只是定义了配置发生变化默认应该采取的操作，那么总该有一个类来监听配置是否发生了变化，这就是InstanceConfigMonitor的作用。官方文档中，只提到了对canal.conf.dir配置项指定的目录的监听，这指的是通过spring方式加载配置。显然的，通过manager方式加载配置，配置中心的内容也是可能发生变化的，也需要进行监听。此时可以理解为什么instanceConfigMonitors的类型是一个Map，key为InstanceMode，就是为了对这两种方式的配置加载方式都进行监听。

defaultAction字段初始化源码如下所示：

defaultAction = new InstanceAction() {
 
    public void start(String destination) {
        InstanceConfig config = instanceConfigs.get(destination);
        if (config == null) {
            // 重新读取一下instance config
            config = parseInstanceConfig(properties, destination);
            instanceConfigs.put(destination, config);
        }
 
        if (!embededCanalServer.isStart(destination)) {
            // HA机制启动
            ServerRunningMonitor runningMonitor = ServerRunningMonitors.getRunningMonitor(destination);
            if (!config.getLazy() && !runningMonitor.isStart()) {
                runningMonitor.start();
            }
        }
    }
 
    public void stop(String destination) {
        // 此处的stop，代表强制退出，非HA机制，所以需要退出HA的monitor和配置信息
        InstanceConfig config = instanceConfigs.remove(destination);
        if (config != null) {
            embededCanalServer.stop(destination);
            ServerRunningMonitor runningMonitor = ServerRunningMonitors.getRunningMonitor(destination);
            if (runningMonitor.isStart()) {
                runningMonitor.stop();
            }
        }
    }
 
    public void reload(String destination) {
        // 目前任何配置变化，直接重启，简单处理
        stop(destination);
        start(destination);
    }
};

instanceConfigMonitors字段初始化源码如下所示：

instanceConfigMonitors = MigrateMap.makeComputingMap(new Function<InstanceMode, InstanceConfigMonitor>() {
       public InstanceConfigMonitor apply(InstanceMode mode) {
           int scanInterval = Integer.valueOf(getProperty(properties, CanalConstants.CANAL_AUTO_SCAN_INTERVAL));
           if (mode.isSpring()) {//如果加载方式是spring，返回SpringInstanceConfigMonitor
               SpringInstanceConfigMonitor monitor = new SpringInstanceConfigMonitor();
               monitor.setScanIntervalInSecond(scanInterval);
               monitor.setDefaultAction(defaultAction);
               // 设置conf目录，默认是user.dir + conf目录组成
               String rootDir = getProperty(properties, CanalConstants.CANAL_CONF_DIR);
               if (StringUtils.isEmpty(rootDir)) {
                   rootDir = "../conf";
               }
               if (StringUtils.equals("otter-canal", System.getProperty("appName"))) {
                   monitor.setRootConf(rootDir);
               } else {
                   // eclipse debug模式
                   monitor.setRootConf("src/main/resources/");
               }
               return monitor;
           } else if (mode.isManager()) {//如果加载方式是manager，返回ManagerInstanceConfigMonitor
               return new ManagerInstanceConfigMonitor();
           } else {
               throw new UnsupportedOperationException("unknow mode :" + mode + " for monitor");
           }
       }
   });

可以看到instanceConfigMonitors也是根据mode属性，来采取不同的监控实现类SpringInstanceConfigMonitor 或者ManagerInstanceConfigMonitor，二者都实现了InstanceConfigMonitor接口。

public interface InstanceConfigMonitor extends CanalLifeCycle {
    void register(String destination, InstanceAction action);
    void unregister(String destination);
}

当需要对一个destination进行监听时，调用register方法

当取消对一个destination监听时，调用unregister方法。

事实上，unregister方法在canal 内部并没有有任何地方被调用，也就是说，某个destination如果开启了autoScan=true，那么你是无法在运行时停止对其进行监控的。如果要停止，你可以选择将对应的目录删除。

InstanceConfigMonitor本身并不知道哪些canal instance需要进行监控，因为不同的canal instance，有的可能设置autoScan为true，另外一些可能设置为false。

在CanalConroller的start方法中，对于autoScan为true的destination，会调用InstanceConfigMonitor的register方法进行注册，此时InstanceConfigMonitor才会真正的对这个destination配置进行扫描监听。对于那些autoScan为false的destination，则不会进行监听。

目前SpringInstanceConfigMonitor对这两个方法都进行了实现，而ManagerInstanceConfigMonitor目前对这两个方法实现的都是空，需要开发者自己来实现。

在实现ManagerInstanceConfigMonitor时，可以参考SpringInstanceConfigMonitor。

此处不打算再继续进行分析SpringInstanceConfigMonitor的源码，因为逻辑很简单，感兴趣的读者可以自行查看SpringInstanceConfigMonitor 的scan方法，内部在什么情况下会回调defualtAction的start、stop、reload方法。

总结

deployer模块的主要作用：

读取canal.properties，确定canal instance的配置加载方式

确定canal instance的启动方式：独立启动或者集群方式启动

监听canal instance的配置的变化，动态停止、启动或新增

启动canal server，监听客户端请求