大数据王者之路 - Ambari 02 架构简介

379 阅读2分钟

这是我参与8月更文挑战的第27天,活动详情查看:8月更文挑战

对了,学委是搞大数据的,别看整体搞那么多极简单系列,NodeJS,小白趣味故事。大数据还是拿捏得住的。

让我们继续大数据之旅。 本文继续前篇 Ambari 初步认识 的后续补充。

Ambari架构

Ambari 自身也是一个分布式架构的软件,主要由两部分组成:Ambari Server 和 Ambari Agent。

简单理解server 和 agent

Ambari Server 通知 Ambari Agent 安装对应的软件;

Agent 会定时地发送各个机器每个软件模块的状态给 Ambari Server,最终这些状态信息会呈现在 Ambari 的 GUI,方便用户了解到集群的各种状态,并进行相应的维护。

如下图:

在这里插入图片描述
解析:

  1. Ambari Server 从整个集群上收集信息。
  2. 每个主机上都有 Ambari Agent, Ambari Server 通过
    Ambari Agent 控制每部主机。
  3. Ambari Agent收集主机上的节点信息,汇报给AmbariServer
  4. AmbariServer讲收集的数据存储在数据库中(MySql或者Postgresql,我其他还没有试过)
  5. 用户访问Web UI,WebUI通过AmbariServer的RESTful API获取数据绘制,集群组件健康指标。

这里的数据库可以选择主流的数据。

Ambari web

这个组件提供了中央控制的web dashboard(面板)。

  • 展示集群整体状态
  • 展示集群节点状态
  • 集群管理功能包括HIVE VIEW/HDFS 操作界面等等。

整合了很多组件的接口,还有很多后面细讲。

Agent 功能

Agent除了收集节点信息,实际上还包括安装其他大数据技术棧和管理上面。

这一块也比较多,本次主要是先了解整体架构。 后面还有更多介绍,我们下一篇再看。

持续学习持续开发,我是雷学委!
编程很有趣,关键是把技术搞透彻讲明白。
创作不易,请多多支持,点赞收藏支持学委吧!