
获得徽章 10
- 8月21日打卡,今日学习《博文|Apache Pulsar 在自研数据管道中的技术实践》,本文主要介绍借助 Apache Pulsar 作为数据同步工具,并落地实现增量数据同步的各种应用场景需求。进一步实现数据管道的平台化及可视化,并接入更丰富的数据库类型支持。评论点赞
- 8月18日打卡,今日学习《Apache Pulsar 技术系列 - Pulsar事务实现原理》,本文主要介绍Pulsar服务端事务线管的及消息确认的一些概念和原理评论点赞
- 8月17日打卡,今日学习《一文讲清HBase存储结构》,本文主要详解了HBase的存储结构,以及面向列的存储结构究竟有什么样的不同之处评论点赞
- 8月16日打卡,今日学习《入门Hbase,看这一篇就够了》,本文主要介绍了Hbase的特性,使用场景,Hbase架构,存储设计以及安装等。评论点赞
- 8月15日打卡,今日学习《带你入坑大数据(一) --- HDFS基础概念篇》,本文主要从HDFS的概念、Hadoop架构、HDFS的三大组件、HDFS机制、负载均衡等方面介绍了HDFS的基础知识。评论点赞
- 8月14日打卡,今日学习《字节跳动10万节点HDFS集群多机房架构演进之路》,本文主要介绍了在字节跳动业务的迅猛发展和业务场景的多样性给 HDFS 带来了很大的挑战下,字节跳动 HDFS 团队在机房感知相关的支持上做了专门的设计和实现等工作内容评论点赞
- 8月13日打卡,今日学习《Presto在字节跳动的内部实践与优化》,本文主要介绍了在字节内日查询量接近百万条的情况下,使用Presto主要支撑了Ad-hoc查询、BI可视化分析、近实时查询分析等场景。评论点赞
- 8月12日打卡,今日学习《Spark的Shuffle总结分析》,本文主要从shuffle原理和HashShuffle机制来总结分析了Spark中的Shuffle评论点赞
- 8月11日打卡,今日学习《5小时推开Spark的大门——02.搭建开发环境。》,本文主要介绍了Spark开发环境的搭建以及目录和主要内容的解析评论点赞
- 8月10日打卡,今日学习《SparkSQL 在企业级数仓建设的优势》,本文主要介绍了Spark 引擎因为自身强大的生态和方便的编程接口被广泛应用在数据处理场景下,Spark 提供的 Spark SQL 模块更是为使用 Spark 支撑企业数据仓库提供了一个良好的基础设施。评论点赞