获得徽章 10
- 8月23日打卡,今天打卡《Presto在字节跳动的内部实践与优化》:为了处理日益增长的Ad-hoc查询需求,在2020年,字节跳动数据平台引入Presto来支持该类场景。目前,整个Presto 集群规模在几万 core,支撑了每天约100万次的查询请求,覆盖了绝大部分的Ad-hoc查询场景以及部分BI查询分析场景评论点赞
- 8月22日打卡,今天打卡《博文|Apache Pulsar 在自研数据管道中的技术实践》:Shared 模式中,多个消费者可以连接到同一订阅主题。消息以轮询的方式分布在各个消费者之间,任何给定的消息仅传递给一个消费者。起初我们采用 Shared 模式,因为 Shared 模式具备分布式消费能力,消费速度快评论点赞
- 8月21日打卡,今天打卡《字节跳动10万节点HDFS集群多机房架构演进之路》:Client:访问 HDFS 的 client,主要通过 HDFS SDK 和 HDFS 进行交互,HDFS SDK 的实现比较重,很多 IO 处理逻辑都是在 SDK 实现,因此这里单独列为架构的一部分。评论点赞
- 8月20日打卡,今天打卡《带你入坑大数据(一) --- HDFS基础概念篇》:HDFS(Hadoop Distributed FileSystem),由3个模块组成:分布式存储HDFS,分布式计算MapReduce,资源调度框架Yarn,大量的文件可以分散存储在不同的服务器上面
单个文件比较大,单块磁盘放不下,可以切分成很多小的block块,分散存储在不同的服务器上面,各服务器通过网络连接,造成一个整体。展开评论点赞 - 8月15日打卡,今天打卡《Apache Pulsar 技术系列 - Pulsar事务实现原理》:我们在初始化PulsarClient时,如果设置了enableTransaction=true,则Client初始化时,还会额外初始化一个TransactionCoordinatorClient。评论点赞
- 8月13日打卡,今天打卡《分布式系列第一弹:分布式一致性!》:我认为重点在最后一个模块:高并发系统中一个常见的核心需求就是亿级的读需求,显然,关系型数据库并不是解决高并发读需求的最佳方案,互联网的经典做法就是使用缓存。常用缓存方式分为本地缓存和分布式缓存两种;如果对性能要求不是非常的高,优先使用分布式缓存;对于数据实时性和分布式一直性要求不高的可以使用本地缓存评论点赞
- 8月12日打卡,今天打卡《深度解析 Raft 分布式一致性协议》:本文介绍了可以将一个强一致性分布式系统当成一个整体,一旦某个客户端成功的执行了写操作,那么所有客户端都一定能读出刚刚写入的值。即使发生网络分区故障,或者少部分节点发生异常,整个集群依然能够像单机一样提供服务评论点赞
- 8月11日打卡,今天打卡《K8s 长什么样子,一文道清它的整体架构》:准入控制的过程分为两个阶段:第一阶段,运行变更准入控制器(Mutating Admission)。它可以修改被它接受的对象,这就引出了它的另一个作用,将相关资源作为请求处理的一部分进行变更;第二阶段,运行验证准入控制器(Validating Admission)。它只能进行验证,不能进行任何资源数据的修改操作;展开评论点赞
- 8月9日打卡,今天打卡《K8s 长什么样子,一文道清它的整体架构》:这个K8s,其实我很早就想了解了!当时在实习的时候,看到我们运维一顿操作K8s,什么docker,直接秀我一脸!K8s 具备完善的集群管理能力,包括多层次的安全防护和准入机制、多租户应用支撑能力、透明的服务注册和服务发现机制、内建负载均衡器、故障发现和自我修复能力、服务滚动升级和线上扩容、可扩展的资源自动调度机制、多粒度的资源配额管理能力。还提供完善的管理工具,涵盖开发、部署测试、运维监控等各个环节。展开赞过评论1
![[击掌]](http://lf-web-assets.juejin.cn/obj/juejin-web/xitu_juejin_web/img/jj_emoji_115.a7dbbf7.png)
![[爱心]](http://lf-web-assets.juejin.cn/obj/juejin-web/xitu_juejin_web/img/jj_emoji_106.ba42c9a.png)