大数据

大数据

大数据

大数据

暂无订阅共17篇文章创建于2025-07-14

Yarn在hadoop中的作用

一、hadoop Yarn是什么在古老的 Hadoop1.0 中，MapReduce 的 JobTracker 负责了太多的工作，包括资源调度，管理众多的 TaskTracker 等工作。这自然是不

9月前
154
点赞
评论

CDH安装部署标准规范文档

一集群设备信息：序号主机名称别名 IP地址 1 wg-bigdata-master1.arch.local wg-bigdata-master1.arch.local 172.21.216.9

9月前
46
点赞
评论

Flink job 手工重启操作步骤

1、进入机器172.16.224.55（新发展）、172.25.144.12 （太仓） 2、使用命令yarn application -list | grep wdd查看对应容器，如下图 3、ping

9月前
359
点赞
评论

一、定义一个高可靠、高吞吐量的分布式文件系统。对于HDFS而言，他具有数据切割、制作副本、分散存储数据的能力。相关概念 HDFS数据块 MapReduce基本原理通过 HDFS 我们解决了分布式

9月前
107
点赞
评论

大数据平台架构

大数据的思想：数据移动是一个高成本的动作，所以计算资源抽象成一个容器，将容器发布到各个节点上进行计算。

9月前
34
点赞
评论

MapReduce（初代计算引擎）

定义分布式离线并行计算框架对于MapReduce，官网上是这样给出的介绍：Hadoop MapReduce是用于轻松编写应用程序，以可靠，容错的方式在大型集群（数千个节点）的商用硬件上并行处理大量

9月前
62
点赞
评论

Storm 部署文档

Storm 部署文档 1 上传storm tar包到所有需要安装storm服务的IP节点上 2 解压包 tar -zxvf /opt/apache-storm-1.0.3.tar.gz 3 修改配置

9月前
61
点赞
评论

背景：随着存算项目正式迁移，需要平衡在线业务和大数据任务的资源使用。目前常态化yumc3在线业务已经每日定时扩容使用潮汐资源现状: 部分在线服务无法实现优雅下线, 故需要切流缩容目标：在合理

9月前
71
点赞
评论

大数据平台（Cloudera Distribution Hadoop）技术白皮书

概述 CDH,全称Cloudera's Distribution, including Apache Hadoop。由美国的Cloudera公司推出的大数据产品，CDH是基于稳定版本的Apache H

9月前
708
点赞
评论

OpenResty日常使用规范

版本号版本描述编著日期 V1.0 第一版 TechOps Team 2022.01.10 V1.1 更改部署版本为openresty-1.0.0.0-2 TechOps Team 2022.02

8月前
143
点赞
评论

Flink job 手工重启操作步骤

1、进入机器172.16.224.55（新发展）、172.25.144.12 （太仓） 2、使用命令yarn application -list | grep wdd查看对应容器，如下图 3、ping

9月前
52
点赞
评论

CDH-标准部署文档

目录键入章标题(第 1 级)1 键入章标题(第 2 级)2 键入章标题(第 3 级)3 键入章标题(第 1 级)4 键入章标题(第 2 级)5 方案概述本手册详细描述了 POCKETBI-QC 集

9月前
85
点赞
评论

Flink集群部署文档

一、概述与说明 1.1 概述背景：描述此文档的背景和要解决的技术问题技术定位：初级目标群体：使用Flink的应用开发用户技术应用场景：Standalone 是 Flink 的独立部署模式，它不

9月前
126
点赞
评论

一 .概述 Apache Kafka是一款开源的消息引擎系统，根据维基百科的定义，消息引擎系统是一组规范，业用这组规范在不同的系统之间传递语义准确的消息，实现松耦合的异步式数据传递。通俗来讲，就是系统

9月前
130
点赞
评论

hadoop生态 hadoop版本说明 hadoop生态 hadoop版本说明 hadoop生态 hadoop版本说明

9月前
41
点赞
评论

kibana7.6.2安装

兄弟们，直接上干活一、准备版本：7.6.2 kibana和es的版本要一致在centos7.6上使用rpm方式安装二、安装与配置安装kibana 配置yml文件启动Kibana 访问kib

9月前
66
点赞
评论

elasticsearch日常使用规范

概述 Elasticsearch 是分布式搜索和分析引擎，其核心是 Elastic Stack。Logstash 和 Beats 有助于收集、聚合和丰富的数据并将其存储在 Elasticsearch

9月前
196
点赞
评论