首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
妙言
掘友等级
小天才
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
11
文章 6
沸点 5
赞
11
返回
|
搜索文章
妙言
赞了这篇文章
木东居士的茶水间
7年前
关注
DataTalk:ODS层的数据需要做数据清洗吗?
本篇的主题是数据分层中的ODS的作用,关于数据分层可以参考本篇博客:如何优雅地设计数据分层 。 下面直接进入讨论的主题。 问题: ODS 有的公司说几乎不处理,有的说这一层...
1
评论
分享
妙言
赞了这篇文章
木东居士的茶水间
7年前
关注
DataTalk:是一个宽表好还是多个维表好?
本篇的主题是关于数据模型的规范化和反规范化的讨论,其实也是一种常见的维度建模的设计和业务使用便捷性的冲突。 问题: 在设计数据表的时候,是一个宽表好,还是多个维度表好? 回...
3
评论
分享
妙言
关注了
木东居士的茶水间
@小天才
妙言
关注了
Mark_Zoe
@小天才
妙言
赞了这篇文章
编程学习网
全栈工程师
·
4年前
关注
Hive 千亿级数据倾斜解决方案
数据倾斜问题剖析 数据倾斜是分布式系统不可避免的问题,任何分布式系统都有几率发生数据倾斜,但有些小伙伴在平时工作中感知不是很明显。这里要注意本篇文章的标题—“千亿级数据”,...
1
评论
分享
妙言
赞了这篇文章
爱Rap篮球写代码的蔡徐
复制粘贴工程师
·
5年前
关注
细品数据倾斜(建议收藏)
数据倾斜是大数据领域绕不开的拦路虎,当你所需处理的数据量到达了上亿甚至是千亿条的时候,数据倾斜将是横在你面前一道巨大的坎。 迈的过去,将会海阔天空!迈不过去,就要做好准备:...
9
评论
分享
妙言
关注了
霍云
@小天才
妙言
赞了这篇文章
霍云
数据开发 @字节跳动
·
5年前
关注
再谈Shuffle(Spark&MR)
Map的输出并不是简单的直接写到磁盘,先写到缓冲区,当缓冲区要spill磁盘的时候对缓冲区内容进行排序。 每个MapTask(计算一个split)都有一个环形缓冲区(默认1...
1
评论
分享
妙言
赞了这篇文章
liebao小奕
Java技术专家 @阿里巴巴
·
4年前
关注
熟悉这些Java排查工具就够了
平时的工作中当我们碰到疑难问题的处理时候,在解决问题的同时,有一些很好的工具起到了相当大的作用,在此将会记录下来几乎是最全Java服务端开发用到的工具分享给大家,希望看到此...
30
评论
分享
妙言
关注了
liebao小奕
@小天才
关注了
4
关注者
0
收藏集
2
关注标签
0
加入于
2021-07-11