大数据 - wizard13014的收藏集 - 掘金

大数据

更多收藏集

16篇文章 · 0订阅

Docker-Compose搭建Hadoop集群

持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第2天，点击查看活动详情一、前言在许多大数据实验中，需要使用到hdfs集群，但是创建按照教程一步步配置虚拟机并搭建一个可用的集群

liedmirror
3年前
4.7k
10
2

兄弟，用大白话告诉你小白都能看懂的Hadoop架构原理

Hadoop是目前大数据领域最主流的一套技术体系，包含了多种技术。包括HDFS（分布式文件系统），YARN（分布式资源调度系统），MapReduce（分布式计算系统），等等。有些朋友可能听说过Hadoop，但是却不太清楚他到底是个什么东西，这篇文章就用大白话给各位阐述一下。…

石杉的架构笔记
7年前
15k
178
30

兄弟，用大白话告诉你小白都能看懂的Hadoop架构原理

数据引擎查询原理及应用

数据查询引擎是大数据处理架构的核心组件之一，通常是面向数据应用层的直接接口。

极牛
9年前
1.2k
59
评论

不同的瑞士军刀：对比 Spark 和 MapReduce

作为一个开源的数据处理框架，Spark 是如何做到如此迅速地处理数据的呢？秘密就在于它是运行在集群的内存上的，而且不受限于 MapReduce 的二阶段范式。这大大加快了重复访问同一数据的速度。

关关_关关
10年前
1.1k
16
评论

一篇文看懂 Hadoop：风雨十年，未来何去何从

我们很荣幸能够见证 Hadoop 十年从无到有，再到称王。感动于技术的日新月异时，希望通过这篇内容深入解读 Hadoop 的昨天、今天和明天，憧憬下一个十年。

阿里百川
10年前
2.6k
46
3

一篇文看懂 Hadoop：风雨十年，未来何去何从

饿了么推荐系统：从 0 到 1

饿了么推荐系统：从 0 到 1

丁一
9年前
3.4k
58
评论

Pythonの数据分析练手（一）

最近拿到本《Python for Data Analysis》，就用Jupyter Notebook来跑了一遍里面的例子，现在想把他做个记录，以后翻翻看也好（PS：早上翘课被点名了，欲哭无泪）

一个普普通通简简单单
8年前
885
19
评论

Hive 数据仓库系列分析汇总

一个分享大数据技术的优秀博客

__1024
9年前
2.7k
58
2

Hive 数据仓库系列分析汇总

hadoop 学习之路

在大数据时代，要想个性化实现业务的需求，还是得操纵各类的大数据软件，如：hadoop、hive、spark 等。笔者（阿里封神）混迹 Hadoop 圈子多年，经历了云梯 1、ODPS 等项目，目前 base 在 E-Mapreduce。在这，笔者尽可能梳理下 hadoop 的学习之路。

阿里百川
10年前
2.8k
93
1

使用 Docker 搭建本地 Hadoop 集群

利用 docker 在本机搭建虚拟 hadoop 集群

欧阳我去
9年前
2.8k
53
2

使用 Docker 搭建本地 Hadoop 集群