大数据

大数据

大数据

大数据相关内容，kafka，hive，zookeeper,spark,flink等

等 7 人订阅共103篇文章创建于2022-04-18

azkaban 提交任务不执行直接失败

本文已参与「新人创作礼」活动，一起开启掘金创作之路 azkaban 提交任务不执行直接失败 azkaban web 报错 ERROR [FlowTriggerScheduler] [Azkaban]

4年前
1.4k
2
评论

kafka消费不到远程bootstrap-server 数据

本文已参与「新人创作礼」活动，一起开启掘金创作之路 kafka消费不到远程bootstrap-server 数据

4年前
240
点赞
评论

centos7 做raid5

本文已参与「新人创作礼」活动，一起开启掘金创作之路准备安装 mdadm mdadm参数 -a 检测设备名称 -n 指定设备数量 -l 指定RAID等级 -C 创建 -v 显示过程 -f 模拟设备损

4年前
534
4
评论

Couldn‘t set up IO streams: java.lang.IllegalArgumentException: KrbException

本文已参与「新人创作礼」活动，一起开启掘金创作之路现象 datanode 运行一段时间后，先stale，最后dead 报错查看datanode日志：原因分析因为是在Hadoop集群下跑hive

4年前
666
点赞
评论

shell 获取hive建表语句并修改orc格式为textfile格式

本文已参与「新人创作礼」活动，一起开启掘金创作之路背景在hive中orc格式会自动将string类型的数据，hdfs文件加载成数据类型，就导致使用多表关联 jion on id = "11"时报错

4年前
338
点赞
评论

hbase 元数据修复

本文已参与「新人创作礼」活动，一起开启掘金创作之路 hbase 元数据修复问题 hbase fck 报错：解决有的region上线有问题用工具给触发上线了 Hbck异常定位和修复这有点东西

4年前
433
1
评论

ambari项目重部署以及问题——2018年（含）之前整理七

本文已参与「新人创作礼」活动，一起开启掘金创作之路 ambari项目重部署问题步骤一、先将所有服务停掉（在页面上操作就行）如果没有停止，执行以下操作补救二、执行删除脚本删除脚本参考三、重新

4年前
295
1
评论

ambari版本升级删除脚本 ——2018年（含）之前整理八

本文已参与「新人创作礼」活动，一起开启掘金创作之路背景本文是 ambari 完全卸载的然后更换ambari的删除脚本，测试环境需要把之前安装ambari卸载，安装高版本amabri 删除脚本

4年前
481
点赞
评论

spark submit --master yarn-client 问题 ——2018年（含）之前整理六

本文已参与「新人创作礼」活动，一起开启掘金创作之路背景 UAR（用户画像分析）系统从CDH 迁移到 HDP --master yarn-cluster 没有问题但是yarn -client 报错

4年前
432
点赞
评论

MYSQL 连接缓慢——2018年（含）之前整理五

本文已参与「新人创作礼」活动，一起开启掘金创作之路 MYSQL 连接缓慢问题原因出现该错误的原因： MySQL 数据库服务器没有配置 /etc/hosts，也没有DNS服务，导致mysqld线程

4年前
464
点赞
评论

CDH安装脚本（可用但不完善不适小白）——2018年（含）之前整理四

本文已参与「新人创作礼」活动，一起开启掘金创作之路 CDH安装脚本这个是很早之前写的，里面ip什么的细节需要调整，千万别直接用前提要下好CDH的包

4年前
168
点赞
评论

mongodb 副文本集搭建、启停脚本——2018年（含）之前整理三

本文已参与「新人创作礼」活动，一起开启掘金创作之路 mongodb mongodb 副文本集搭建脚本 mongodb 副文本集启动停止脚本

4年前
169
点赞
评论

ambari-agent 主机心跳丢失报错——2018年（含）之前整理二

本文已参与「新人创作礼」活动，一起开启掘金创作之路 ambari-agent 主机心跳丢失报错背景 amabri 安装后，ambari-agent包心跳丢失告警

4年前
415
点赞
评论

动态加载hive-jdbc 本地可以服务器有问题——2018年（含）之前整理一

动态加载hive-jdbc，由于hive-jdbc的版本一般不具有向下兼容性，所以当我们需要从不同hadoop集群取hive数据的时候，考虑动态去加载不同版本的hive-jdbc驱动。

4年前
615
点赞
评论

mysql mysqldump用于主主（主从）复制（不加锁，不影响业务）

本文已参与「新人创作礼」活动，一起开启掘金创作之路 mysqldump用于主主（主从）复制（不加锁，不影响业务）操作 1.备份主库数据 2.从库加载数据 3.从库修改log位置 4.启动slave

4年前
465
点赞
评论

NAMENODE双活ACTIVE，数据不能写入

org.apache.hadoop.hdfs.server.namenode.SafeModeException: Zero blocklocations for

4年前
213
点赞
评论

TezSession has already shutdown. No cluster diagnostics found.

本文已参与「新人创作礼」活动，一起开启掘金创作之路 TezSession has already shutdown. No cluster diagnostics found.

4年前
716
1
评论

原生spark-sql连接原生hive问题

java.io.FileNotFoundException: Filejava.lang.NoClassDefFoundError: org/apache/hadoop/hive/conf/HiveC

4年前
585
1
评论

pyspark 初始化报错

本文已参与「新人创作礼」活动，一起开启掘金创作之路 pyspark 初始化报错 pyspark TypeError: ‘JavaPackage‘ object is not callable 问题

4年前
480
1
评论

mysql双主+keepalived实现mysql高可用并为ambari 与hive 提供服务

本文已参与「新人创作礼」活动，一起开启掘金创作之路 mysql双主+keepalived实现mysql高可用并为ambari 与hive 提供服务 mysql双主同步初始状态 1、将主服务器要同步的

4年前
360
1
评论