获得徽章 0
大数据
置顶 大数据
大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产
2021-06-19 04:35 · 文章数 21 · 订阅人数 15
Spark
Spark
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点
2021-06-19 04:49 · 文章数 0 · 订阅人数 1
Flink
Flink
Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。Flink以数据并行和流水线方式执行任意流数据程序,Flink的流水线运行时系统可以执行批处理和流处理程序。此外,Flink的运行时本身也支持迭代算法的执行。
2021-06-19 04:46 · 文章数 0 · 订阅人数 1
Scala
Scala
scala是运行在JVM上的多范式编程语言,同时支持面向对象和面向函数编程
2021-06-19 04:44 · 文章数 0 · 订阅人数 1
ZooKeeper
ZooKeeper
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务
2021-06-19 04:41 · 文章数 0 · 订阅人数 0
Hadoop
Hadoop
Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台。允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理
2021-06-19 04:39 · 文章数 5 · 订阅人数 5
Hive
Hive
hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。
2021-06-19 04:37 · 文章数 13 · 订阅人数 12
个人成就
文章被点赞 611
文章被阅读 60,814
掘力值 1,743
收藏集
0
关注标签
15
加入于