获得徽章 1
- 8月18号打卡,今天学习了《Apache Pulsar 技术系列 - Pulsar事务实现原理》:Apache Pulsar 是一个多租户、高性能的服务间消息传输解决方案,支持多租户、低延时、读写分离、跨地域复制、快速扩容、灵活容错等特性。腾讯云MQ Oteam Pulsar工作组对 Pulsar 做了深入调研以及大量的性能和稳定性方面优化,目前已经在TDBank、腾讯云TDMQ落地上线。本篇将简单介绍Pulsar服务端消息确认的一些概念和原理展开评论点赞
- 8月16号打卡,今天学习了《一文讲清HBase存储结构》:Hbase 是一个分布式的、多版本、面向列的开源 KV 数据库。运行在 HDFS 的基础上,支持 PB 级别、百万列的数据存储。作为性能如此强大的KV数据库,HBase的存储结构究竟是怎样的呢?面向列的存储结构究竟有什么样的不同之处呢?本文会详细讲解这部分。评论点赞
- 8月15号打卡,今天学习了《入门Hbase,看这一篇就够了》:本文系统化的整理一番关于Hbase的知识点,之后在想到Hbase的时候,看着一篇就够了。评论点赞
- 8月13号,今天学习了《带你入坑大数据(一) --- HDFS基础概念篇》:本文介绍了HDFS的架构、三大组件和机制赞过评论1
- 8月12号打卡,今天学习了《字节跳动10万节点HDFS集群多机房架构演进之路》:字节跳动采用的是横跨多个机房的联邦大集群部署模式,即 HDFS 只有一个集群,这个集群有多个 nameservice,但是底层的 DN 是横跨 A/B/C 3 个机房的 ,由于社区版 HDFS 没有机房感知相关的支持,因此字节跳动 HDFS 团队在这个功能上做了专门的设计和实现,本文会介绍这部分的工作。展开赞过评论1
- 8月11号打卡,今天学习了《Presto在字节跳动的内部实践与优化》:本文介绍了字节跳动OLAP数据引擎平台Presto部署使用情况,以及在不同场景的优化与实践赞过评论1
- 8月10号打卡,今天学习了《Spark的Shuffle总结分析》:本文分析了Spark的Shuffle的原理,以及相关参数的设计评论点赞
- 8月9号打卡,今天学习了《5小时推开Spark的大门——02.搭建开发环境。》:本文主要介绍了Spark开发环境的安装,和IDEA集成Scala插件赞过评论1
- 8月7号打卡,今天学习了《SparkSQL 在企业级数仓建设的优势》:Spark 引擎因为自身强大的生态和方便的编程接口被广泛应用在数据处理场景下,Spark 提供的 Spark SQL 模块更是为使用 Spark 支撑企业数据仓库提供了一个良好的基础设施。评论点赞
- 8月6号打卡,今天学习了《DolphinDB节点启动时的流计算自动订阅教程》:本教程主要解决基于 DolphinDB 流数据处理框架完成业务代码开发后,如何部署节点启动时的流计算自动订阅问题。评论点赞