首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
强子爱痒痒
掘友等级
大数据开发工程师
|
医渡云
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
最新
热门
Kylin--整体架构
模块规整、思路清晰。api模块就是api服务的,在这个逻辑,如果是查询就跳转到queryService模块,该模块内部又有sql解析模块、然后到物理执行计划产出,最后到hbase的执行产出,数据返回,服务端整合数据返回。 可插拔的组件方式,对于现在大数据技术迭代很频繁的年代,而…
Druid--索引解析
这里主要说一下druid关于bitmap和倒排索引的使用。 之前有一篇文章介绍了关于druid的存储原理。这里说一下druid在构建文件过程中对于索引的构建和存储。 在此我们举个简单的例子来演示如何使用Bitmap Index来加速数据库的多维查询性能。下图是一张典型的时序数据…
Druid--查询原理
druid的索引只有一个bitmap索引,主要是用这个实现了倒排。 druid的查询也是分为多种,比如chained,groupby等类型,每种查询类型都有自己的实现方式。 聚合查询使用的是堆外内存,增加了服务的稳定性。多以对于大量的聚合查询,如果historycal机器的pr…
Druid--index服务原理
向Druid中提交批数据处理请求。Druid中的批处理任务会从HDFS中获取原数据。 批任务会根据处理请求生成segment,并将生成的segments存到Deep Storage(HDFS)中。 Coordinator会定时从元数据存储DB中查新生成的segment信息。 C…
Druid--存储原理
Deep storage (S3 and HDFS)是作为Segment的永久备份,查询时同样不会涉及Deep storage。 Druid中的列主要分为3类:时间列,维度列,指标列。Druid在数据摄入和查询时都依赖时间列,这也是合理的,因为多维分析一般都带有时间维度。维度和…
Druid--整体概览
Apache Druid(正在孵化)是一个实时分析数据库,旨在对大型数据集进行快速切片和切块分析(“ OLAP ”查询)。Druid最常用作数据库,以支持对实时摄取,快速查询性能和高正常运行时间很重要的用例。因此,Druid通常用于为分析应用程序的datasource,或用作需…
Direct Buffer 和 MMAP 浅入浅出
TODO这个内容近期要补充上先补充上两个参考链接:https://www.cnblogs.com/huxiao-tee/p/4660352.htmlhttp://www.liuhaihua.cn/ar
java堆栈信息打印的使用--概述
JVM 的线程堆栈 dump 也称 core dump,内容为文本,主要包含当时 JVM 的线程堆栈,堆 dump 也称 heap dump,内容为二进制格式,主要包含当时 JVM 堆内存中的内容。由于各个操作系统、各个 JVM 实现不同,即使同一 JVM 实现,各个版本也有差…
java设计模式--抽象工厂模式
举个生活中常见的例子——组装电脑,我们在组装电脑的时候,通常需要选择一系列的配件,比如CPU、硬盘、内存、主板、电源、机箱等。为讨论使用简单点,只考虑选择CPU和主板的问题。 事实上,在选择CPU的时候,面临一系列的问题,比如品牌、型号、针脚数目、主频等问题,只有把这些问题都确…
JAVA设计模式--策略模式
策略模式属于对象的行为模式。其用意是针对一组算法,将每一个算法封装到具有共同接口的独立的类中,从而使得它们可以相互替换。策略模式使得算法可以在不影响到客户端的情况下发生变化。 策略模式是对算法的包装,是把使用算法的责任和算法本身分割开来,委派给不同的对象管理。策略模式通常把一个…
下一页
个人成就
文章被点赞
5
文章被阅读
19,333
掘力值
327
关注了
12
关注者
4
收藏集
2
关注标签
45
加入于
2019-09-30