首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大数据
保持时刻反思与复盘
创建于2024-06-25
订阅专栏
收集大数据相关的资料
等 1 人订阅
共59篇文章
创建于2024-06-25
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
大数据面试题之Kafka(3)
Kafka支持什么语义,怎么实现ExactlyOnce? Kafka的消费者和消费者组有什么区别?为什么需要消费者组? Kafka producer的写入数据过程? Kafka producer
大数据面试题之Kafka(2)
Kafka的工作原理? Kafka怎么保证数据不丢失,不重复? Kafka分区策略 Kafka如何尽可能保证数据可靠性? Kafka数据丢失怎么处理? Kafka如何保证全局有序? 生产者
大数据面试题之Kafka(1)
目录 介绍下Kafka,Kafka的作用?Kafka的组件?适用场景? Kafka作为消息队列,它可解决什么样的问题? 说下Kafka架构 说下Kafka的特点,优缺点 Kafka相比于其它消息组
大数据面试题之Flume
介绍下Flume Flume架构 Flume有哪些Source 说下Flume事务机制 介绍下Flume采集数据的原理?底层实现? Flume如何保证数据的可靠性 Flume传输数据时如何
大数据面试题之Hive(3)
Hive的函数:UDF、UDAF、UDTF的区别? UDF是怎么在Hive里执行的 row_number,rank,dense_rank的区别 Hive count(distinct)有几个reduc
大数据面试题之Hive(2)
Hive的join操作原理,leftjoin、right join、inner join、outer join的异同? Hive如何优化join操作 Hive的mapjoin Hive语句的运行机制,
大数据面试题之Hive(1)
说下为什么要使用Hive?Hive的优缺点?Hive的作用是什么? 说下Hive是什么?跟数据仓库区别? Hive架构 Hive内部表和外部表的区别? 为什么内部表的删除,就会将数据全部删除,而外部表
大数据面试题之MapReduce(3)
reduce任务什么时候开始? MapReduce的reduce使用的是什么排序? MapReduce怎么确定MapTask的数量? Map数量由什么决定 MapReduce的map进程和reduce
大数据面试题之MapReduce(2)
shuffle为什么要排序? 说一下map是怎么到reduce的? 说一下你了解的用哪几种shuffle机制? MapReduce的数据处理过程 mapjoin的原理(实现)?应用场景? reduce
大数据面试题之MapReduce(1)
介绍下MapReduce MapReduce优缺点 MapReduce架构 MapReduce工作原理 MapReduce哪个阶段最费时间 MapReduce中的Combine是干嘛的?有什么好外?
Mac M3 Pro 部署Flink-1.16.3
以上是mac硬件配置 1、下载安装包 官网:Downloads | Apache Flink 网盘: Flink 安装包 https://pan.baidu.com/s/1IN62_T5JUrnYUy
Mac M3 Pro 部署Trino-server-449
1、下载安装包 官方:trino-server-449 CLI 网盘: server https://pan.baidu.com/s/16IH-H39iF8Fb-Vd14f7JPA?pwd=3vjp
Mac M3 Pro 部署Spark-2.3.2 On Hive-3.1.3
目录 1、下载安装包 2、解压安装 3、修改配置 4、将spark的jars上传到hdfs 5、mysql中创建hive库 6、hive初始化数据库 7、启动Spark 8、启动HIVE 9、检
Mac M3 Pro 安装 Zookeeper-3.4.6
1、下载安装包 官方下载地址:https://archive.apache.org/dist/zookeeper/ 网盘下载地址:https://pan.baidu.com/s/1j6iy5b
Mac M3 Pro安装Hadoop-3.3.6
1、下载Hadoop安装包 可以到官方网站下载,也可以使用网盘下载 官网下载地址:Hadoop官网下载地址 网盘地址:https://pan.baidu.com/s/1p4BXq2mvby2B76lm
大数据面试题之Zookeeper面试题
1、介绍下Zookeeper是什么? 2、Zookeeper有什么作用?优缺点?有什么应用场景? 3、Zookeeper的选举策略,leader和follower的区别? 4、介绍下Zookeeper
大数据面试题之YARN
1、介绍下YARN 2、YARN有几个模块 3、YARN工作机制 4、YARN有什么优势,能解决什么问题? 5、YARN容错机制 6、YARN高可用 7、YARN调度器 8、YARN中Contai
大数据面试题之HDFS
目录 HDFS文件写入和读取流程 HDFS组成架构 介绍下HDFS,说下HDFS优缺点,以及使用场景 HDFS作用 HDFS的容错机制 HDFS的存储机制 HDFS的副本机制 HDFS的常见数据格
大数据面试之Hadoop
目录 介绍下Hadoop Hadoop的特点 说下Hadoop生态圈组件及其作用 Hadoop主要分哪几个部分?他们有什么作用? Hadoop 1.x,2x,3.x的区别 Hadoop集群工作时启