小知识,大挑战!本文正在参与“程序员必备小知识”创作活动。
虚拟化资源支持用户通过自定义方式或基于模板创建虚拟机,并对集群资源进行管理,包括资源自行动态调度、虚拟机管理(包含创建、删除、启动、关闭、重启、休眠、唤醒虚拟机)、存储资源管理(包含普通磁盘和共享磁盘的管理)、虚拟机安全管理,支持虚拟机热迁移和虚拟机HA等基本功能。
离线计算
分布式批处理计算框架,将输入的数据集切分成块后并行处理、排序再归集的整个过程,支持PB级数据的离线处理。
内存计算
内存计算基于ApacheSpark开发的专用分布式计算引擎,不仅提高了计算性能,而且解决了Spark自身诸多的稳定性问题,在海量小数据比对、关系分析等应用方面性能有明显提升。
实时计算
实时流数据计算处理模块基于Twitter Storm技术,具备流数据计算处理能力和复杂的业务应用逻辑。通过在集群内将实时流数据组成运算处理流水线,依次完成信息提取、数据分析、规则判断等数据计算,实现高吞吐数据的实时并发处理。
图计算
图计算模块基于“图论”基础实现对数据元素关系的抽象处理,通过对数据节点、边和权重等数据分析处理,建立数据实体之间的关联性,支持TB级数据间数据关系查询、关系网络分析等应用。