Hadoop大数据 - 云之君兮鹏的收藏集 - 掘金

Hadoop大数据

云之君兮鹏

更多收藏集

4篇文章 · 0订阅

Hadoop 小文件处理理论在Hive数据处理上的落地-Hadoop商业环境实战

版权声明：本套技术专栏是作者（秦凯新）平时工作的总结和升华，通过从真实商业环境抽取案例进行总结和分享，并给出商业应用的调优建议和集群环境容量规划等内容，请持续关注本套博客。QQ邮箱地址：1120746959@qq.com，如有任何技术交流，可随时联系。小文件是指文件size小…

技术洞察TIC
7年前
856
7
评论

是时候学习真正的 spark 技术了

spark sql 可以说是 spark 中的精华部分了，我感觉整体复杂度是 spark streaming 的 5 倍以上，现在 spark 官方主推 structed streaming， spark streaming 维护的也不积极了，我们基于 spark 来构建大数…

七牛云
7年前
4.9k
32
2

是时候学习真正的 spark 技术了

spark入门笔记

用户编写的Spark程序，通过一个有main方法的类执行,完成一个计算任务的处理。它是由一个Driver程序和一组运行于Spark集群上的Executor组成弹性分布式数据集。RDD是Spark的核心数据结构，可以通过一系列算子进行操作。当RDD遇到Action算子时，将之前…

fengye
8年前
6.0k
20
3

Hive技术初探

Innodb,Myisam,Ndb做数据存储引擎。

贝聊科技
7年前
1.6k
9
评论