首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
ThinkMar
更多收藏集
微信扫码分享
微信
新浪微博
QQ
10篇文章 · 0订阅
可能是最全的数据仓库全景科普和开发方法论!
导语 | 数据工程要做什么?怎样设计和开发一套好的数仓?一个经历了内容类业务(腾讯视频),面向企业的消费品业务(腾讯优码),社区电商类业务(内部孵化中)的数仓开发鹅和你聊聊数据工程的道与术。 到新业务
Hive 基础教程
Hive 由 Facebook 实现并开源,是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据映射为一张数据库表,并提供 HQL(Hive SQL)查询功能,底层数据是存储在 HDFS 上。Hive的本质是将 SQL 语句转换为 MapReduce 任务运行,使不熟悉…
基于 Flink CDC 实现海量数据的实时同步和转换
简介: 徐榜江在 5.21 Flink CDC Meetup 的分享。 点击查看直播回放 & 演讲PDF 一、Flink CDC 技术 CDC 是 Change Data Capture 的缩写,是一
什么是麒麟(kylin)?查数据贼快的哟
今天想跟大家一起入门一下kylin(麒麟)。 由于工作需要,前段时间对kylin简单入了个门,现在来写写笔记(我的文字或许能帮助到你入门kylin,至少看完这篇应该能知道kylin是干什么的)。 从官方我们可以看到对kylin的介绍:Apache Kylin™是一个开源的、分布…
腾讯看点基于 Flink 构建万亿数据量下的实时数仓及实时查询系统
本文介绍了腾讯看点基于 Flink 构建实时数仓以及实时数据查询系统,亚秒级的响应多维条件查询请求。
Apache Kylin 入门 1 - 基本概念
Apache Kylin 是一个开源的分布式分析引擎,提供 Hadoop/Spark 之上的 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由 eBay Inc. 开发并贡献至开源社区,它能在亚秒内查询巨大的 Hive 表。 与 BI 工具无缝整合: Kyl…
Kylin官方案例详细剖析及剪枝优化-OLAP商业环境实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。 Kylin官方案例是一个非常经典的案例,包含的技术细节通过深挖能呈现出更具价值的信息,如:数据仓库理论,…
一篇文章搞懂 Apache Kylin 的技术架构
Apache Kylin 4.x 版本的技术架构是怎样的?结合图文详解 Apache Kylin 4.x 版本的技术架构
【Kylin】初识
Apache Kylin, 一种 MOLAP 的数据分析引擎。 Kylin 提供多维数据分析(MOLAP)的秒级响
Apache Kylin 原理介绍与新架构分享(Kylin On Parquet)| 字节跳动技术沙龙
10月26日,字节跳动技术沙龙 | 大数据架构专场 在上海字节跳动总部圆满结束。我们邀请到字节跳动数据仓库架构负责人郭俊,Kyligence 大数据研发工程师陶加涛,字节跳动存储工程师徐明敏,阿里云高级技术专家白宸和大家进行分享交流。 以下是 Kyligence 大数据研发工…