首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大数据
jzy3711
创建于2022-04-18
订阅专栏
大数据相关内容,kafka,hive,zookeeper,spark,flink等
等 7 人订阅
共103篇文章
创建于2022-04-18
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
azkaban 提交任务不执行直接失败
本文已参与「新人创作礼」活动,一起开启掘金创作之路 azkaban 提交任务不执行直接失败 azkaban web 报错 ERROR [FlowTriggerScheduler] [Azkaban]
kafka消费不到远程bootstrap-server 数据
本文已参与「新人创作礼」活动,一起开启掘金创作之路 kafka消费不到远程bootstrap-server 数据
centos7 做raid5
本文已参与「新人创作礼」活动,一起开启掘金创作之路 准备 安装 mdadm mdadm参数 -a 检测设备名称 -n 指定设备数量 -l 指定RAID等级 -C 创建 -v 显示过程 -f 模拟设备损
Couldn‘t set up IO streams: java.lang.IllegalArgumentException: KrbException
本文已参与「新人创作礼」活动,一起开启掘金创作之路 现象 datanode 运行一段时间后,先stale,最后dead 报错 查看datanode日志: 原因分析 因为是在Hadoop集群下跑hive
shell 获取hive建表语句并修改orc格式为textfile格式
本文已参与「新人创作礼」活动,一起开启掘金创作之路 背景 在hive中orc格式会自动将string类型的数据,hdfs文件加载成数据类型,就导致使用多表关联 jion on id = "11"时报错
hbase 元数据修复
本文已参与「新人创作礼」活动,一起开启掘金创作之路 hbase 元数据修复 问题 hbase fck 报错: 解决 有的region上线有问题 用工具给触发上线了 Hbck异常定位和修复 这有点东西
ambari项目重部署以及问题——2018年(含)之前整理七
本文已参与「新人创作礼」活动,一起开启掘金创作之路 ambari项目重部署问题 步骤 一、先将所有服务停掉(在页面上操作就行) 如果没有停止,执行以下操作补救 二、执行删除脚本 删除脚本参考 三、重新
ambari版本升级删除脚本 ——2018年(含)之前整理八
本文已参与「新人创作礼」活动,一起开启掘金创作之路 背景 本文是 ambari 完全卸载的 然后更换ambari的 删除脚本,测试环境需要把之前安装ambari卸载,安装高版本amabri 删除脚本
spark submit --master yarn-client 问题 ——2018年(含)之前整理六
本文已参与「新人创作礼」活动,一起开启掘金创作之路 背景 UAR(用户画像分析)系统 从CDH 迁移到 HDP --master yarn-cluster 没有问题 但是yarn -client 报错
MYSQL 连接缓慢——2018年(含)之前整理五
本文已参与「新人创作礼」活动,一起开启掘金创作之路 MYSQL 连接缓慢 问题 原因 出现该错误的原因: MySQL 数据库服务器没有配置 /etc/hosts,也没有DNS服务,导致mysqld线程
CDH安装脚本(可用但不完善不适小白)——2018年(含)之前整理四
本文已参与「新人创作礼」活动,一起开启掘金创作之路 CDH安装脚本 这个是很早之前写的,里面ip什么的细节需要调整,千万别直接用 前提要下好CDH的包
mongodb 副文本集搭建、启停脚本——2018年(含)之前整理三
本文已参与「新人创作礼」活动,一起开启掘金创作之路 mongodb mongodb 副文本集搭建 脚本 mongodb 副文本集启动停止脚本
ambari-agent 主机心跳丢失报错——2018年(含)之前整理二
本文已参与「新人创作礼」活动,一起开启掘金创作之路 ambari-agent 主机心跳丢失报错 背景 amabri 安装后,ambari-agent包心跳丢失告警
动态加载hive-jdbc 本地可以 服务器有问题——2018年(含)之前整理一
动态加载hive-jdbc,由于hive-jdbc的版本一般不具有向下兼容性,所以当我们需要从不同hadoop集群取hive数据的时候,考虑动态去加载不同版本的hive-jdbc驱动。
mysql mysqldump用于主主(主从)复制(不加锁,不影响业务)
本文已参与「新人创作礼」活动,一起开启掘金创作之路 mysqldump用于主主(主从)复制(不加锁,不影响业务) 操作 1.备份主库数据 2.从库加载数据 3.从库修改log位置 4.启动slave
NAMENODE双活ACTIVE,数据不能写入
org.apache.hadoop.hdfs.server.namenode.SafeModeException: Zero blocklocations for
TezSession has already shutdown. No cluster diagnostics found.
本文已参与「新人创作礼」活动,一起开启掘金创作之路 TezSession has already shutdown. No cluster diagnostics found.
原生spark-sql连接原生hive问题
java.io.FileNotFoundException: Filejava.lang.NoClassDefFoundError: org/apache/hadoop/hive/conf/HiveC
pyspark 初始化报错
本文已参与「新人创作礼」活动,一起开启掘金创作之路 pyspark 初始化报错 pyspark TypeError: ‘JavaPackage‘ object is not callable 问题
mysql双主+keepalived实现mysql高可用并为ambari 与hive 提供服务
本文已参与「新人创作礼」活动,一起开启掘金创作之路 mysql双主+keepalived实现mysql高可用并为ambari 与hive 提供服务 mysql双主 同步初始状态 1、将主服务器要同步的
下一页