首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
小初杂货铺
掘友等级
大数据开发
|
超级无敌优秀厉害富强民主文明和谐
划水、摸鱼
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
140
文章 131
沸点 9
赞
140
返回
|
搜索文章
最新
热门
Spark_数据倾斜简单总结
拖慢整个 Job 执行时间(其他已经完成的节点都在等这个还在做的节点)。 搞定 OOM 的根本原因等:一般都因为数据倾斜(某 Task 任务的数据量过大,GC 压力大,和 Kafka 不同在于 Kafka 的内存不经过 JVM,其基于 Linux 的 Page)。 Shuffl…
消息丢失问题记录
项目架构是数据实时数据写入到kafka中,sparkstreaming通过direct消费kafka并将offset保存至zookeeper中批处理时间间隔是1S,然后数据保存到HBase使用Spar
数仓项目中所遇问题及解决方法
分别对主流的流计算框架:Storm,Storm Trident,Spark Streaming,Google Cloud Dataflow,Flink做了对比。基于微批量的Spark Streaming和Storm Trident延迟比较高,从这点就不适合我们的场景。Sto…
排序算法再梳理
稳定:如果a原本在b前面,而a=b,排序之后a仍然在b的前面。 不稳定:如果a原本在b的前面,而a=b,排序之后 a 可能会出现在 b 的后面。 时间复杂度:对排序数据的总的操作次数。反映当n变化时,操作次数呈现什么规律的增长。 空间复杂度:是指算法在计算机内执行时所需存储空间…
Linux一点总结
打包之后的大文件 需要以 .tar 结尾. 通过 命令 对文件进行常规的编辑操作, 例如 定位 翻页 复制 粘贴 删除 ... ... . 在使用vi命令时, 注意 关闭中文输入法 在程序世界中, **()、[]、{}**使用率很高, 而且 都是成对出现的. vi中的文本缓冲区…
Hbase常见知识点
MyGitHubHomepageHbase常见知识点写入流程客户端发起写入数据请求,连接zk获取zk当中一张特殊表hbase:meta表的位置信息连接hbase:meta表所在的regionServe
个人成就
文章被点赞
7
文章被阅读
4,199
掘力值
150
关注了
27
关注者
2
收藏集
15
关注标签
33
加入于
2016-10-11