首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Hadoop
Redamancy_06
创建于2022-08-25
订阅专栏
这里是写一些关于hadoop的笔记
等 5 人订阅
共58篇文章
创建于2022-08-25
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Hadoop源码解析、MapTask & ReduceTask源码解析
开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第32天,点击查看活动详情 6.2 MapTask & ReduceTask源码解析 1)MapTask源码解析流程 =======
Hadoop源码解析、调度器任务执行(YarnChild)
开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第32天,点击查看活动详情 点击MRAppMaster.java 中的initAndStartAppMaster 方法中的appMa
Hadoop源码解析、YARN源码解析
开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第32天,点击查看活动详情 5.2 YARN源码解析 job.waitForCompletion submit() submitte
Hadoop源码解析、DataNode启动源码解析
开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第31天,点击查看活动详情 第三章 DataNode启动源码解析 3.1 DataNode工作机制 3.2 DataNode启动源码
Hadoop源码解析、向NN发送心跳
开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第31天,点击查看活动详情 点击register BPServiceActor.java ctrl + n 搜索NameNodeRp
Hadoop源码解析、NN处理DN的创建请求
开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第31天,点击查看活动详情 选中create,点击ctrl+h,找到实现类DistributedFileSystem.java,查找
Hadoop源码解析、NN启动资源检查
开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第30天,点击查看活动详情 2.6 NN启动资源检查 2.6.1 点击startCommonServices NameNode.ja
Hadoop源码解析、HDFS、YARN、MapReduce三者关系
开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第30天,点击查看活动详情 @[toc] 第一章 RPC通信原理解析 1.1 回顾 HDFS、YARN、MapReduce三者关系
大数据项目之电商数仓、用户行为数据采集模块、集群所有进程查看脚本、Hadoop安装、数据通道、环境准备、Web端查看SecondaryNameNode、项目经验
@[toc] 4. 用户行为数据采集模块 4.1 数据通道 4.2 环境准备 4.2.1 集群所有进程查看脚本 编写Hadoop集群常用脚本、Hadoop集群启停脚本、常用端口号说明、集群时间同步、时
大数据项目之电商数仓、用户行为日志、服务器和JDK准备、模拟数据
@[toc] 3. 用户行为日志 3.4 服务器和JDK准备 3.4.1 服务器准备 可以看我之前写的文章 VMware 安装 VMware 安装CentOS7配置环境、安装虚拟机、选择cd/dvd的
大数据项目之电商数仓、用户行为日志
@[toc] 3. 用户行为日志 3.1 用户行为日志概述 用户行为日志的内容,主要包括用户的各项行为信息以及行为所处的环境信息。收集这些信息的主要目的是优化产品和为各项分析统计指标提供数据支撑。
大数据项目之电商数仓、数据仓库概念、项目需求及架构设计
@[toc] 1.数据仓库概念 数据仓库( Data Warehouse ),是为企业制定决策,提供数据支持的。可以帮助企业,改进业务流程、提高产品质量等。 数据仓库的输入数据通常包括:业务数据、
Hadoop中的Yarn的Tool接口案例、Yarn 案例实操(四)
@[toc] 17. Yarn 案例实操 17.4 Yarn的Tool接口案例 17.4.1 回顾 期望可以动态传参,结果报错,误认为是第一个输入参数。 17.4.2 需求 自己写的程序也可以动态修改
Hadoop中的公平调度器案例、Yarn 案例实操(三)
@[toc] 17. Yarn 案例实操 17.3 公平调度器案例 17.3.1 需求 创建两个队列,分别是test和summer(以用户所属组命名)。期望实现以下效果:若用户提交任务时指定队列,则任
Hadoop中的容量调度器多队列提交案例、Yarn 案例实操(二)
17. Yarn 案例实操 17.2 容量调度器多队列提交案例 1)在生产环境怎么创建队列? (1)调度器默认就1个default队列,不能满足生产要求。 (2)按照框架:hive /spark/ f
Hadoop中的Yarn 生产环境核心参数配置案例、Yarn 案例实操(一)
@[toc] 17. Yarn 案例实操 注:调整下列参数之前尽量拍摄Linux快照,否则后续的案例,还需要重写准备集群。 将hadoop102、hadoop103、hadoop104全部拍摄快照 1
HadoopYarn常用命令、yarn application查看任务、yarn logs查看日志、yarn applicationattempt查看尝试运行的
@[toc] 16. Yarn资源调度器 16.5 Yarn常用命令 Yarn状态的查询,除了可以在hadoop103:8088页面查看外,还可以通过命令操作。常见的命令操作如下所示: 需求:执行Wo
Hadoop中Yarn资源调度器、Yarn工作机制、作业提交全过程、Yarn调度器和调度算法、先进先出调度器(FIFO)、容量调度器(Capacity Sche
@[toc] 16. Yarn资源调度器 思考: 1)如何管理集群资源? 2)如何给任务合理分配资源? Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而
Hadoop数据压缩、MR支持的压缩编码、压缩方式选择、压缩位置选择、压缩实操案例、Map输出端采用压缩、Reduce输出端采用压缩、Gzip压缩、Bzip2压
@[toc] 14. Hadoop数据压缩 14.1 概述 14.1.1 压缩的好处和坏处 压缩的优点:以减少磁盘IO、减少磁盘存储空间。 压缩的缺点:增加CPU开销。 14.1.2 压缩原则 (1)
Hadoop中的MapReduce框架原理、数据清洗(ETL)、MapReduce开发总结、常见错误及解决方案
13.7 数据清洗(ETL) “ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(Extract)、转换(Transform)、加载(Load)至目
下一页