首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大数据面试专属专栏
大数据欧老师
创建于2024-01-18
订阅专栏
专注于大数据面试知识分享
等 1 人订阅
共8篇文章
创建于2024-01-18
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
大数据工程师面试题 - Spark 基础调优(一)
原则一:避免创建重复的RDD 通常来说,我们在开发一个Spark作业时,首先是基于某个数据源(比如Hive表或HDFS文件)创建一个初始的RDD;接着对这个RDD执行某个算子操作,然后得到下一个RDD
# 大数据工程师面试 - JVM GC
CMS 垃圾收集器是什么? CMS(Concurrent Mark-Sweep,即并发标记清扫)是一种用于Java的垃圾收集技术,主要处理堆内存中老年代的垃圾回收。CMS垃圾收集器的主要特性 并发性:
大数据工程师面试-Druid 和 Clickhouse
在线分析处理(OLAP)在大数据环境中极为重要,它可以帮助我们快速查询和执行多维分析。今天,我们将讨论两种在OLAP场景中得到广泛应用的大数据技术—Druid和ClickHouse,并进行比较。 Dr
大数据工程师面试-Flink窗口运算及其应用场景深入理解
在处理流数据时,窗口运算是一项关键技能。特别是在Flink这种实时计算平台上,理解和合理使用窗口运算对于数据处理的效率和精准度至关重要。 1. Flink窗口运算的理解 Flink提供了丰富的窗口运算
大数据工程师面试 Flink 知识点 - 时间语义
Flink提供了三种时间语义,以满足不同计算场景的需求:处理时间,事件时间和注入时间。打开查看常见面试题!
Flink 常见面试题:JobManager 和 TaskManager
Flink 常见面试题:JobManager 和 TaskManager,包括 JobManager高可用等。
实时大数据面试题 - 流处理、批处理和微批处理
1. 数据处理模型:流处理、批处理和微批处理 我们首先来认识一些基本的数据处理模型。在大数据世界中,你会遇到流处理、批处理和微批处理这三种模型。 流处理是一种实时的数据处理方式,数据一生成就立即被处理
大数据开发高频面试题:Spark与MapReduce解析
一、Spark vs MapReduce 数据处理方式:Spark基于内存处理数据,可以将计算的中间结果保存到内存中反复利用,提高了处理效率。相比之下,MapReduce基于磁盘处理数据,将中间结果保