首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
hive
订阅
用户5021838520209
更多收藏集
微信扫码分享
微信
新浪微博
QQ
7篇文章 · 0订阅
消息队列经典十连问
大家好呀,我是捡田螺的小男孩。金三银四即将来临,整理了十道十分经典的消息队列面试题,看完肯定对面试有帮助的,大家一起加油哈 什么是消息队列 消息队列的应用场景 消息队列如何解决消息丢失问题 消息
迄今为止最好用的Flink SQL教程:Flink SQL Cookbook on Zeppelin
对于初学者来说,学习 Flink 可能不是一件容易的事情。看文档是一种学习,更重要的是实践起来。但对于一个初学者来说要把一个 Flink SQL 跑起来还真不容易,要搭各种环境,真心累。很幸运的是,Flink 生态圈里有这样一款工具可以帮助你更有效率地学习 Flink:Zepp…
数据仓库-【面试题】
对于数据仓库的理解,数据仓库解决什么问题? 数据仓库可以理解为一个大的数据集合,它的功能是面向数据分析和决策支持; 数据仓库不生产数据,它所有的数据都是同步自业务系统,而众多业务系统数据会面临
数仓利器-Hive高频函数合集
前言数据准备数据集建表语句窗口函数row_number:使用频率★★★★★rank:使用频率★★★★dense_rank:使用频率★★★★rank/dense_rank/row_number对比fir
微信ClickHouse实时数仓的最佳实践
微信作为一款国民级应用,已经覆盖社交、支付、出行等人们生活的方方面面。海量多样化的业务形态,对数据分析提出了新的挑战。本文由浅入深,为大家揭晓微信在ClickHouse实时数仓实践中积累的经验及方法。
一个真实的数仓项目总结
背景 公司业务整合,指标管理混乱,数据不一致问题严重,另外指标的开发和迭代效率也比较低; 举措:进行集团指标认证,数据指标重新开发; 建设前 面临的问题 指标非常多,业务复杂,变化快; 人少,排期紧张
Hive优化实践
对于流行的分布式计算框架(如离线的MapReduce、流计算Storm、迭代内存计算Spark、流式计算Flink),“数据量大”从来都不是问题,因为理论上来说,都可以通过增加并发的节点数来解决。 但是如果数据倾斜或者分布不均匀了,那么就会是问题。此时不能简单地通过增加并发节点…