首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
oceanuslion
更多收藏集
微信扫码分享
微信
新浪微博
QQ
20篇文章 · 0订阅
用Flink取代Spark Streaming!知乎实时数仓架构演进
“数据智能” (Data Intelligence) 有一个必须且基础的环节,就是数据仓库的建设,同时,数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务。从智能商业的角度来讲,数据的结果代表了用户的反馈,获取结果的及时性就显得尤为重要,快速的获取数据反馈能够帮助公司…
你需要的不是实时数仓 | 你需要的是一款强大的OLAP数据库(下)
在上一章节中,我们讲到实时数仓的建设,互联网大数据技术发展到今天,各个领域基本已经成熟,有各式各样的解决方案可以供我们选择。在实时数仓建设中,解决方案成熟,消息队列Kafka、Redis、Hbase鲜
浅析NewSQL数据库——TiDB
如今的数据库种类繁多,RDBMS(关系型数据库)、NoSQL(Not Only SQL)、NewSQL凭借己之长处,在数据库领域均有一席之地,可谓百家争鸣之势。先上一张DBEngines在2018年8月发布的数据库排名: 我们可以看到数据库份额之间的竞争还是十分激烈的。而本篇文…
如何使用HBase?大数据存储的两个实战场景
HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,适用于结构化的存储,底层依赖于Hadoop的HDFS,利用HBase技术可在廉价PCServer上搭建起大规模结构化存储集群。因此HBase被广泛使用在大数据存储的解决方案中。 - 列可以动态增加,并且列为空就不…
Spark 系列:『 Spark 』4. spark 之 RDD
要想学好 spark,怎么能不先搞清楚 RDD 的来龙去脉呢~~~
实时数据的可视化
通常来说,可视化的报表会以更高效率的方式将数据背后隐藏的信息传递给我们。通过一个简单的BarChart,我们就很容易对比某商品在第二季度中的销量差异;而通过一条简单的LineChart,则很容易看出员工平均工作时间在某个月份的分布。这些报表都或多或少与时间相关:随着时间的流逝,…
TiDB 的正确使用姿势
最近这几个月,特别是 TiDB RC1 发布后,越来越多的用户已经开始测试起来,也有很多朋友已经在生产环境中使用,我们这边也陆续的收到了很多用户的测试和使用反馈。非常感谢各位小伙伴和早期用户的厚爱,而且看了这么多场景后,也总结出了一些 TiDB 的使用实践 (其实 Spanne…
HBase 入门精要 -- 百闻不如一 Run
分三部分带你完成对 HBase 的百闻不如一 Run:数据模型概述、环境部署和基本操作
HBase 的 RowKey 设计
HBase 的 RowKey 设计
你需要的不是实时数仓 | 你需要的是一款合适且强大的OLAP数据库(上)
前言今年有个现象,实时数仓建设突然就被大家所关注。我个人在公众号也写过和转载过几篇关于实时数据仓库的文章和方案。但是对于实时数仓的狂热追求大可不必。首先,在技术上几乎没有难点,基于强大的开源中间件实现