获得徽章 1
8月13日打卡,今日份阅读分享《入门Hbase,看这一篇就够了》,本文作者讲解了Hbase 的特征及应用情景,并且详细解析了Hbase的架构,并将Hbase的安装配置方法写入文中,对于初入Hbase的小伙伴有一定帮助。
评论
点赞
8月11日打卡,今日份阅读分享《HDFS基础概念篇》,本文作者用最清晰明了的语言来描述知识点,本文详细讲解了HDFS的概念、三大组件及HDFS机制,非常适合新人入门阅读。
评论
点赞
8月10日打卡,今日份阅读分享《字节跳动10万节点HDFS集群多机房架构演进之路》,本文是字节跳动公司对当前HDFS集群的一种分析讲解,同时介绍了HDFS集群多机房架构的演进之路,并在文末发出邀请,希望各位精英并肩作战。
评论
点赞
8月9日打卡,今日份阅读分享《Presto在字节跳动的内部实践与优化》,本文介绍了字节跳动OLAP数据引擎平台Presto部署使用情况,同时也详细介绍了Presto在不同场景的优化与实践,推荐小伙伴们读一读。
评论
点赞
8月7日打卡,今日份阅读分享《Spark的Shuffle总结分析》,本文细致讲解了shuffle原理分析,分别从多个机制介绍了shuffle的原理,并且作者在文章中也详解了shuffle的各种参数,感兴趣的小伙伴可以看一看。
评论
点赞
8月6日打卡,今日份阅读分享《5小时推开Spark的大门》,本文带大家搭建Spark的开发环境,主要从Spark的安装和Scala环境的搭建两方面,同时也介绍了IDEA集成Scala插件,帮助同学们利用IDEA来开发Spark,本系列作品偏实战多一些,同学们一定要亲自操作。
评论
点赞
赞了这篇文章
8月3日打卡,今日份阅读分享《SparkSQL 在企业级数仓建设的优势》,本文介绍了企业级数仓构建需求和 数仓技术选择,指出企业级数仓的实际需求同时又论述SparkSQL 如何支撑企业级数仓,通过列举字节跳动公司EMR 产品在 Spark SQL 的优化实践进行进一步说明,在最后,作者还提出“**基于 Spark SQL 灵活构建数仓的方案将会变得越来越主流**”。建议小伙伴们去读一下。
展开
评论
点赞
8月2日打卡,今日份阅读分享《DolphinDB节点启动时的流计算自动订阅教程》,文章以实例介绍DolphinDB的系统启动流程且为单节点 single 模式部署流计算自动订阅提供帮助,本文主要解决基于 DolphinDB 流数据处理框架完成业务代码开发后,如何部署节点启动时的流计算自动订阅问题对于一些在DolphinDB自动订阅方面有困难的小伙伴极有帮助。
评论
点赞
8月1日打卡,今日份阅读分享《大数据Hadoop之——实时计算流计算引擎Flink(Flink环境部署)》,本文介绍了Flink的概念及工作原理,同时详细说明了Flink中各种核心组件的功能,并且也贴出Flink与其他 常用的实时计算框架的功能对比,在最后,作者还写下Flink的环境部署,有助于同学们构建Flink环境,推荐一手。
评论
点赞