获得徽章 0
8月19日打卡,今日学习《你需要的不是实时数仓 | 你需要的是一款强大的OLAP数据库(下)》:本文给出了常用的一些OLAP引擎,它们各自有各自的特点。本文作者从多个角度来描述这些OLAP引擎的作用以及他的架构。非常便于新手小白的学习,文章浅显易懂。
评论
8月16日打卡,今日学习《K8s 长什么样子,一文道清它的整体架构》:本篇文章聚焦K8s的整体架构,给大家描绘出K8s的大致模样。文章语言通俗易懂,也便于小白理解,读了以后收获很多,非常乐意向大家推荐这篇优秀的文章。
评论
8月15日打卡,今日学习《一文搞懂 K8s 准入控制(Admission Controller)》:本篇主要介绍了 Kubernetes 中的 Admission Controller ,默认情况下有一些已经以插件形式与 kube-apiserver 编译到了一起,另外我们也可以通过自己编写动态准入控制器来完成相关的需求。
评论
8月14日打卡,今日学习《深度解析 Raft 分布式一致性协议》:本文是 Raft 实战系列理论内容的整合篇,结合 Raft 论文讲解 Raft 算法思路,并遵循 Raft 的模块化思想对难理解及容易误解的内容抽丝剥茧。算法方面讲解:选主机制、基于日志实现状态机机制、安全正确维护状态机机制;工程实现方面讲解:集群成员变更防脑裂策略、解决数据膨胀及快速恢复状态机策略、线性一致读性能优化策略等。
展开
评论
8月13日打卡,今日学习《分布式系列第一弹:分布式一致性》:互联网时代和环境下,为了快速需求响应和提高系统吞吐,往往进行微服务化改造,将复杂系统和数据进行拆分;这时候的一致性指分布式服务化系统之间的弱一致性,包括应用系统一致性和数据一致性。本文通过理论和实际方案的介绍,来学习分布式一致性相关内容。
评论
8月12日打卡,今日学习《Apache Pulsar 在自研数据管道中的技术实践》:在需要同步大量增量数据的场景下,本文采用了 Maxwell + Pulsar 的自研解决方案,Pulsar Key_Shared 订阅模式能否很好解决分布式消息消费过程中的顺序问题,在数据管道数据链路中增设过滤器,能保证消息不重不漏。
评论
8月11日打卡,今日学习《Apache Pulsar 技术系列 - Pulsar事务实现原理》:本篇简单介绍了Pulsar服务端消息确认的一些概念和原理,同时对事务的实现进行了一个详细的介绍,对于想要了解这部分知识的人来说非常有用。
评论
8月10日打卡,今日学习《一文讲清HBase存储结构》:Hbase 是一个分布式的、多版本、面向列的开源 KV 数据库。运行在 HDFS 的基础上,支持 PB 级别、百万列的数据存储。本文详细的讲述了HBase的存储结构究竟是怎样的、面向列的存储结构究竟有什么样的不同之处。
评论
8月8日打卡,今日学习《字节跳动10万节点HDFS集群多机房架构演进之路》:字节跳动 HDFS 的多机房架构在业界中是有自己独特的路线,这个中原因主要还是公司业务高速发展和机房建设方向在业界中也是独树一帜的,这些因素驱动 HDFS 进行自己独特迭代演进,从结果来看是达到预期。
评论
8月5日打卡,今日学习《Presto在字节跳动的内部实践与优化》:本文讲述了Presto在功能性、性能、稳定性以及可运维性方面的有优点,而后又讲述了其在不同场景下的优化与实践,提出了字节跳动的解决方案。文章讲述的较为生动,读了以后让人收获很大!
评论
8月3日打卡,今日学习《5小时推开Spark的大门——02.搭建开发环境》:这是一篇非常有用的教程,相当于手把手的教会一个小白进行Spark环境的搭建,对于初学者也是十分的友好,不会担心自己看不懂,一步一步的跟着教程来就行了。
评论
8月2日打卡,今日学习《SparkSQL 在企业级数仓建设的优势》:随着企业的业务发展越来越复杂,需要更加灵活、更加高效的数仓架构,在这样的业务驱动背景下,Hive 的局限变得越来越明显,而基于 Spark SQL 灵活构建数仓的方案将会变得越来越主流。所以企业在考虑数据仓库构建体系的时候,可以考虑如何基于 Spark SQL 构建自身数据体系,Spark 完善和开放的生态在未来必然会有更多优秀的服务围绕 Spark 形成强大的优势。
展开
评论
下一页
个人成就
文章被阅读 1,358
掘力值 96
收藏集
0
关注标签
0
加入于