首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
神相
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
25
文章 25
沸点 0
赞
25
返回
|
搜索文章
神相
1年前
关注
大数据面试题之Presto[Trino](2)
描述Presto中的Connector是什么? 在Presto中,Connector是连接Presto查询引擎与外部数据存储系统的桥梁。它是一个插件化的组件,允许Pres...
0
评论
分享
神相
1年前
关注
大数据面试题之Presto[Trino](1)
什么是Presto,它主要用于解决什么问题? Presto是一款高性能、分布式的SQL查询引擎,专为大规模数据分析而设计。它最初由Facebook开发,并于2013年开源。...
0
评论
分享
神相
关注了
白哥学前端
神相
1年前
关注
大数据面试题之数据库(3)
数据库有必要建索引吗? 数据库建立索引是非常必要的,但是否为每个表或每个列创建索引则需根据实际情况权衡。索引的存在可以带来诸多好处,同时也伴随着一些成本。以下是建立索引的主...
0
评论
分享
神相
1年前
关注
大数据面试题之数据库(2)
数据库中存储引擎MylSAM与InnoDB的区别 1、事务处理: MyISAM:不支持事务处理,这意味着在MyISAM表上的操作无法进行回滚、提交等事务管理操作。 Inno...
0
评论
分享
神相
1年前
关注
大数据面试题之数据库(1)
数据库中的事务是什么,MySQL中是怎么实现的 数据库中的事务(Transaction)是一种机制,它将一组数据库操作封装成一个逻辑工作单元,确保这组操作要么全部成功执行...
0
评论
分享
神相
1年前
关注
大数据面试题之数仓(2)
维度表和事实表的区别? 什么是ER模型? OLAP、OLTP解释(区别)三范式是什么,举些例子 维度设计过程,事实设计过程 维度设计中有整合和拆分,有哪些方法,并详...
0
评论
分享
神相
1年前
关注
大数据面试题之数仓(1)
目录 介绍下数据仓库 数仓的基本原理 数仓架构 数据仓库分层(层级划分),每层做什么?分层的好处? 数据分层是根据什么? 数仓分层的原则与思路 知道数仓建模常用模型吗?...
0
评论
分享
神相
1年前
关注
大数据面试题之Flink(4)
Flink广播流 Apache Flink 中的广播流(Broadcast State)是一种特殊类型的状态管理机制,它允许将一个流中的数据广播到所有并行实例上的所有或者部...
0
评论
分享
神相
1年前
关注
大数据面试题之Flink(3)
如何确定Flink任务的合理并行度? 1. 理解任务特性和需求 任务类型:CPU密集型任务可能需要较高的并行度来充分利用计算资源,而I/O密集型任务可能需要较低的并行度以...
0
评论
分享
神相
1年前
关注
大数据面试题之Flink(2)
Flink中Checkpoint超时原因 在 Apache Flink 中,Checkpoint 超时是一个常见的问题,它可能由多种因素导致,以下是一些主要的原因及其排查...
0
评论
分享
神相
1年前
关注
大数据面试题之Flink(1)
Flink架构 Apache Flink 是一个开源的流处理和批处理框架,设计用于高吞吐、低延迟、状态管理和容错的分布式计算。Flink 的架构设计使其能够高效地处理无界...
0
评论
分享
神相
1年前
关注
大数据面试题之Spark(7)
Spark实现wordcount 在Spark中实现Word Count是一个经典的入门级示例,展示了如何处理和统计文本文件中的单词数量。下面分别给出使用Scala、Pyt...
0
评论
分享
神相
1年前
关注
大数据面试题之Spark(6)
Spark输出文件的个数,如何合并小文件? 在Apache Spark中,输出文件的个数通常由RDD(弹性分布式数据集)或DataFrame/Dataset在进行保存操作(...
0
评论
分享
神相
1年前
关注
大数据面试题之Spark(5)
Spark SQL与DataFrame的使用? Spark SQL 是 Apache Spark 中的一个重要模块,它允许用户使用 SQL 查询或者 DataFrame A...
0
评论
分享
神相
1年前
关注
大数据面试题之Spark(4)
Executor内存分配? 在Apache Spark中,Executor的内存分配是通过一系列配置参数来控制的,旨在优化资源利用和提高执行效率。以下是对Executor内...
0
评论
分享
神相
1年前
关注
大数据面试题之Spark(3)
Spark的哪些算子会有shuffle过程? 在Apache Spark中,以下是一些常见的会导致shuffle过程的算子: 1、reduceByKey: 这个算子会对RD...
0
评论
分享
神相
1年前
关注
大数据面试题之Spark(2)
介绍下Spark Shuffle及其优缺点 Spark Shuffle是Spark中用于处理数据在Map和Reduce阶段之间交换和重组的关键机制。它通常发生在数据需要在不...
0
评论
分享
神相
1年前
关注
大数据面试题之Spark(1)
Spark的任务执行流程 Apache Spark 的任务执行流程主要分为以下几个阶段: 初始化与作业提交 创建SparkContext:Spark应用程序启动时,首先创建...
0
评论
分享
神相
1年前
关注
大数据面试题之HBase(3)
HBase的预分区 HBase的预分区(Pre-Splitting)是一种优化手段,用于在创建表时提前规划好表的分区结构,以减少数据写入过程中自动分区(Region Spl...
0
评论
分享
下一页
个人成就
文章被点赞
35
文章被阅读
13,968
掘力值
609
关注了
1
关注者
7
收藏集
1
关注标签
3
加入于
2020-03-19