首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
摸鱼专家
掘友等级
高级摸鱼工程师
获得徽章 25
动态
文章
专栏
沸点
课程
收藏集
关注
作品
赞
754
文章 706
沸点 48
赞
754
返回
|
搜索文章
最新
热门
Kafka 大厂面试题
Kafka对于消息体的大小默认为单条最大值是1M但是在我们应用场景中,常常会出现一条消息大于1M,如果不对Kafka进行配置。则会出现生产者无法将消息推送到Kafka或消费者无法去消费Kafka里面的
看看掘友如何帮女神,定时发文章的🥱
不知不觉我已经通宵发文1890天了,在这煎熬的夜晚,我频频失眠,连做梦都想着啥时候有个定时发文章功能,好让我睡个好觉
Hive 大厂面试题
Hive的架构 Hive元数据默认存储在derby数据库,不支持多客户端访问,所以将元数据存储在MySQl,支持多客户端访问。 2 Hive和e和数据库比较,Hive 和数据库除了拥有类似的查询语言,
Spark Streaming 大厂面试题
Spark Streaming第一次运行不丢失数据 kafka参数 auto.offset.reset 参数设置成earliest 从最初始偏移量开始消费数据
Spark 之 算子调优(二)
算子调优四:filter与coalesce的配合使用 在Spark任务中我们经常会使用filter算子完成RDD中数据的过滤,在任务初始阶段,
Spark 之 算子调优(一)
、算子调优一:mapPartitions 普通的map算子对RDD中的每一个元素进行操作,而mapPartitions算子对RDD中每一个分区进行操作。如果是普通的map算子,假设一个partit
Spark 之 JVM调优
对于JVM调优,首先应该明确,full gc/minor gc,都会导致JVM的工作线程停止工作,即stop the world。 JVM调优一:降低cache操作的内存占比 1. 静态内存管理机
Spark 之 Shuffle调优
Shuffle调优一:调节map端缓冲区大小 在Spark任务运行过程中,如果shuffle的map端处理的数据量比较大,但是map端缓冲的大小是固定的,可能会出现map端缓冲数据频繁spill溢
Spark 常规性能调优 之 并行度调节、广播大变量、Kryo序列化
常规性能调优四:并行度调节 Spark作业中的并行度指各个stage的task的数量。 如果并行度设置不合理而导致并行度过低,会导致资源的极大浪费
Spark 常规性能调优 之 RDD优化、调节本地化等待时长
宝我今天跟文了,跟的想你的文,常规性能调优二:RDD优化 RDD复用 在对RDD进行算子时,要避免相同的算子和计算逻辑之下对RDD进行重复的计算 对上图中的RDD计算架构进
下一页
个人成就
优秀创作者
文章被点赞
7,840
文章被阅读
468,329
掘力值
14,500
关注了
34
关注者
414
收藏集
0
关注标签
3
加入于
2020-10-14