ZooKeeper是什么?

475 阅读4分钟

1. ZooKeeper是什么?

ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,由雅虎公司创建,它可以用于构建和维护具有复杂同步要求的分布式应用程序。在2010年,ZooKeeper成为了Apache的顶级项目。

ZooKeeper集群,也称为ZooKeeper ensemble,是一组运行ZooKeeper服务的机器,这些机器通过互相通信和维护状态信息来提供高可用性和故障容忍能力。如果一个ZooKeeper实例(称为"znode")发生故障,其他znode可以接管其工作,从而保证服务的连续性。

ZooKeeper集群的主要功能包括:

  1. 命名服务:它帮助在分布式环境下,对应用程序或者服务进行命名,便于识别。

  2. 配置管理:在分布式系统中,ZooKeeper帮助分散和管理系统或应用配置信息。

  3. 集群管理:它可以监控节点的实时状态,根据节点的上线和下线进行动态上下文的改变。

  4. 分布式锁:在分布式计算中,我们有时候需要对资源进行互斥访问,ZooKeeper可以实现分布式锁的功能。

  5. 分布式队列:ZooKeeper可以管理分布式环境下的队列,可以实现并发控制。

ZooKeeper集群的设计能够确保在网络分区或者部分节点失效的情况下,仍然能够提供服务,但前提是集群中过半数的节点(大多数)是正常的。这就是所谓的“过半数机制”或者"Quorum机制"。因此,ZooKeeper集群通常建议有奇数个节点,例如3个,5个等等。

2. 为什么ZooKeeper 集群的节点个数是单数?

ZooKeeper 集群中通常推荐使用奇数个节点,这主要是因为它的工作原理和“过半数机制”或"Quorum机制"有关。具体来说:

  1. 过半数机制:为了保持集群状态的一致性,ZooKeeper 需要在进行状态更新(如写入操作)时,获得超过半数的节点(大多数)的确认。只有当大多数节点都已确认这个变更,这个变更才会被认为是有效的。这就是所谓的"过半数机制"或"Quorum机制"。

  2. 容错能力:使用奇数个节点可以提供更好的容错能力。例如,对于一个有3个节点的集群,即使有1个节点发生故障,仍然有2个节点可以继续工作,并且这2个节点仍然构成了大多数(超过原始节点数的一半)。但是,对于一个有4个节点的集群,如果有1个节点发生故障,剩下的3个节点虽然仍然可以继续工作,但是,如果再有一个节点发生故障,剩下的2个节点就不再构成大多数了。所以,尽管4个节点的集群在资源上比3个节点的集群多了一个节点,但是其容错能力却并没有增加。

  3. 避免平局:使用奇数个节点可以避免在投票过程中出现平局的情况。在ZooKeeper 集群中,节点会通过投票的方式来选择一个领导者(Leader)。如果集群中有偶数个节点,那么在进行领导者选举的时候可能会出现平局的情况,从而导致领导者选举无法进行。

因此,ZooKeeper集群通常建议使用奇数个节点,以提供更好的容错能力并避免选举平局的情况发生。

3. 简单案例

下面是一个用 Spring Boot 和 Apache Curator(ZooKeeper的客户端库)进行服务注册和发现的基础示例。在这个例子中,我将创建一个简单的服务并将其注册到ZooKeeper集群,然后再从ZooKeeper集群中发现这个服务。

首先,你需要在你的 Maven pom.xml 文件中添加相关的依赖项:

<dependencies>
    <!-- Spring Boot Starter -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>
    
    <!-- Apache Curator Framework -->
    <dependency>
        <groupId>org.apache.curator</groupId>
        <artifactId>curator-framework</artifactId>
        <version>4.3.0</version> <!-- Use the version suitable for your environment -->
    </dependency>
    
    <!-- Apache Curator recipes -->
    <dependency>
        <groupId>org.apache.curator</groupId>
        <artifactId>curator-recipes</artifactId>
        <version>4.3.0</version> <!-- Use the version suitable for your environment -->
    </dependency>
</dependencies>

在Spring Boot的主配置类中,配置Curator的客户端:

@Configuration
public class CuratorConfiguration {

    @Value("${zookeeper.url}")
    private String zookeeperUrl;

    @Bean(initMethod = "start")
    public CuratorFramework curatorFramework() {
        return CuratorFrameworkFactory.newClient(
            zookeeperUrl,
            new RetryNTimes(5, 1000)
        );
    }
}

然后,你可以创建一个 ServiceRegistry 类,用于服务的注册:

@Service
public class ServiceRegistry {

    private final CuratorFramework client;

    public ServiceRegistry(CuratorFramework client) {
        this.client = client;
    }

    public void registerService(String serviceName, String serviceAddress) {
        String zkPath = "/services/" + serviceName + "/" + serviceAddress;

        try {
            client.create()
                .creatingParentsIfNeeded()
                .withMode(CreateMode.EPHEMERAL)
                .forPath(zkPath);
        } catch (Exception e) {
            throw new RuntimeException(e);
        }
    }
}

同样,你也可以创建一个 ServiceDiscovery 类,用于服务的发现:

@Service
public class ServiceDiscovery {

    private final CuratorFramework client;

    public ServiceDiscovery(CuratorFramework client) {
        this.client = client;
    }

    public List<String> getAvailableServices(String serviceName) {
        String zkPath = "/services/" + serviceName;

        try {
            return client.getChildren().forPath(zkPath);
        } catch (Exception e) {
            throw new RuntimeException(e);
        }
    }
}

以上是一个简单的示例,它展示了如何在 Spring Boot 中使用 Apache Curator 客户端库与 ZooKeeper 进行交互。在真实的应用中,你可能还需要处理更多的复杂情况,如服务地址的解析、服务状态的检查等等。