Hadoop - lyndon879的收藏集 - 掘金

Hadoop

更多收藏集

20篇文章 · 0订阅

咱们一起聊聊Zookeeper

Google的三篇论文影响了很多很多人，也影响了很多很多系统。这三篇论文一直是分布式领域传阅的经典。根据MapReduce，于是我们有了Hadoop；根据GFS，于是我们有了HDFS；根据BigTable，于是我们有了HBase。而在这三篇论文里都提及Google的一个Lock…

HBLOG
7年前
11k
287
8

Hive 与 ElasticSearch 的数据交互

本文将详细介绍利用 ES 与 Hive 直接的数据交互；通过 Hive 外部表的方式，可以快速将 ES 索引数据映射到 Hive 中，使用易于上手的 Hive SQL 实现对数据的进一步加工。 Hive 在 Hadoop 生态系统中扮演着数据仓库的角色，借助 Hive 可以方便…

rochy_he
7年前
8.3k
7
评论

一文读懂 Apache Spark

Apache Spark 是当今最流行的开源大数据处理框架。和人们耳熟能详的 MapReduce 一样，Spark 用于进行分布式、大规模的数据处理，但 Spark 作为 MapReduce 的接任者，提供了更高级的编程接口、更高的性能。除此之外，Spark 不仅能进行常规的批…

fuyufjh
7年前
8.0k
25
评论

一文读懂 Apache Spark

《离线和实时大数据开发实战》作者与你探讨大数据开发究竟如何入门？

其实这不仅仅是大数据开发从业人员的问题，而是对任何希望进入某一新领域的技术人员来说都会面临这个挑战？因为目前是一个信息过度的时代，理论上互联网上包含了人类以来的所有知识，浩如烟海。

互联网先驱者
7年前
382
4
评论

Hadoop学习（二）——MapReduce\Yarn架构

本文先讲MapReduce 1.x的框架。再讲MapReduce 1.x升级改进后MapReduce 2.x/Yarn的框架。目前主要是用MapReduce 2.x/Yarn的框架。用户编写的MapReduce程序通过Client提交到JobTracker端；同时，用户可通过…

Hiway
7年前
2.0k
3
评论

Hive技术初探

Innodb,Myisam,Ndb做数据存储引擎。

贝途
7年前
3.2k
22
评论

Spark 2.2.0 中文文档

Spark 2.2.0 中文文档

布客飞龙
8年前
1.1k
23
评论

什么是ZooKeeper？

上次写了一篇什么是消息队列？以后，本来想入门一下Kafka的(装一下环境、看看Kafka一些概念啥的)。后来发现Kafka用到了ZooKeeper，而我又对ZooKeeper不了解，所以想先来学学什么是ZooKeeper，再去看看什么是Kafka。 ZooKeeper相信大家…

Java3y
7年前
6.6k
122
7

Hello Spark! | Spark，从入门到精通

Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架，是专为大规模数据处理而设计的快速通用的大数据处理引擎及轻量级的大数据处理统一平台。当我们在谈 Spark 的时候可能是指一个 Spark 应用程序，替代 Ma…

美图数据技术团队
7年前
12k
157
5

Hello Spark! | Spark，从入门到精通

成为专业程序员路上用到的各种优秀资料、神器及框架

成为一名专业程序员的道路上，需要坚持练习、学习与积累，技术方面既要有一定的广度，更要有自己的深度。

足下_
9年前
23k
1.8k
23

成为专业程序员路上用到的各种优秀资料、神器及框架