首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
不想做条咸鱼
掘友等级
大数据开发工程师
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
8
文章 8
沸点 0
赞
8
返回
|
搜索文章
最新
热门
Spark-利用持久化分批处理大数据集
本文介绍了在资源不允许增大的情况下,如何利用spark的持久化机制来分批处理大数据集,核心理念是用时间换空间
Spark提交时依赖文件的设置方式
最近工作中遇到一个问题:某个spark任务在客户现场运行时好时坏,报错都是因为类找不到,经过排查,发现是客户集群有些机器的本地依赖不全。现将Spark提交时依赖文件的设置方式做个总结。
Spark日志查看技巧
程序报错查看日志时,很多人都是直接搜索Caused by或者Exception,这并不能对程序运行中的问题有全面的认识。本文总结了我查看程序日志的一些经验。
pyspark异构集群部署
首先介绍pyspark常规的提交命令,然后介绍在x86和arm这样的cpu异构集群上的部署方法,核心就是上传两类环境包,让容器根据所在机器的cpu架构,选择对应的依赖环境。
个人成就
文章被阅读
166
掘力值
55
关注了
1
关注者
1
收藏集
0
关注标签
3
加入于
2021-11-12