首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大虾饺
掘友等级
数据开发工程师
|
公司
大数据 后端
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
7
文章 7
沸点 0
赞
7
返回
|
搜索文章
最新
热门
spark streaming job hudi upsert 耗时比较久?有可能是commits的问题
问题描述 最近使用hudi 增量读的功能时,由于需要保留比较多的commits,因此设置比较的commits,假设spark steaming job 1分钟一个batch,保留一天增量读的commi
log4j 配置
<dependency> <groupId>org.apache.logging.log4j</groupId> <artifactId>log4j-api</artifactId> <v
hive on spark - 各种 jar 找不到的解决方法
1.问题描述 最近需要用hive,并且配置hive on spark,然后运行的时候各种各样的类找不到报错,例如 2. 方案解决 检测 spark-env配置 设置 ${spark_dir}/conf
spark-submit 提交有问题, 一直在accept状态
问题描述 spark-submit提交到yarn上面报错如下,显示连接不到8030,但是已经设置了yarn-site的参数 解决方案 查看spark-env.sh 是否被正常引用 查看yarn-sit
python 找不到类 No module named 'sqlalchemy.database'
python 使用 sqlalchemy.databases import mysql 找不到类 1.发现是SQLalchemy的版本比较高导致整个问题。降低版本就可以了
No ExecutorFactory found to execute the application.
flink 1.12.7 sql 报错 少了 这个jar包 flinksql 完整jar包Exception in thread "main" java.lang.IllegalStateExcept
flink状态管理-flink状态介绍
在flink中,状态叫做State,用来保存中间结果或者一些缓存数据,对于Flink中的很多DataStream算子来说,他们都需要依赖一定中间结果即状态来进行计算。例如去重操作,CEP检测操作,Ex
flink任务提交与执行5-Task的执行
在Execution.deploy()方法执行完后,TaskManager会接收到JobManager提交的TaskDesploymentDescriptor信息,完成Task的任务的构建并启动运行。
flink任务提交与执行4-ExecutionGraph的调度与执行
在创建和初始化SchedulerNG的过程中,会在SchedulerNG中同步创建ExecutionGraph对象,代码如下。 1.ExecutionGraph的核心概念 ExecutionJobVe
flink任务执行与提交3-JobGraph的提交和JobManager的初始化
1.JobGraph的提交整体流程 当JobGraph被提交到集群运行后,集群会通过Dispatcher组件接受提交的JobGraph对象,Dispatcher组件会通过JobManagerRunne
下一页
个人成就
文章被点赞
6
文章被阅读
16,268
掘力值
470
关注了
12
关注者
4
收藏集
0
关注标签
23
加入于
2020-11-09