首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大数据开发
说出你的愿望吧
创建于2021-05-27
订阅专栏
大白话阐述大数据的相关知识
等 9 人订阅
共3篇文章
创建于2021-05-27
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
小白也能看懂的 Hive 调优
Hive 一个常用的大数据组件,影响它的性能的从来都不是因为数据量过大的问题,而是数据倾斜,冗余,Job 和 IO 过多,MapReduce 分配不合理···等
重新说明:Namenode的双缓冲机制和分段加锁原理
双缓冲机制和分段加锁。会有3个标志 isAutoSyncScheduled:判断是否在进行缓存交换 synctxid:这是线程进行磁盘刷写的事务id isSyncRunning:是否在进行写磁盘
从零开始 MapReduce
你将 get 到分布式计算引擎的核心思路,MapReduce 并行度解析,碍于篇幅不宜太长所以先这么多,之后会继续更新相关内容。