首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
user4665733593458
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
16
文章 16
沸点 0
赞
16
返回
|
搜索文章
赞
文章( 16 )
沸点( 0 )
Spark 大厂面试题
Kryo序列化 Kryo序列化比Java序列化更快更紧凑,但Spark默认的序列化是Java序列化并不是Spark序列化,因为Spark并不支持所有序列化类型,而且每次使用都必须进行注册。注册只针对于
Spark 大厂面试题
Spark解决什么问题 二 Spark为什么会有自己的资源调度器 三 Spark运行模式 四 Spark常用端口号 五 Spark提交作业参数 六 Spark的transformation算子
数仓面试高频考点--解决hive小文件过多问题
每执行一次 insert 时hive中至少产生一个文件,因为 insert 导入时至少会有一个MapTask。 像有的业务需要每10分钟就要把数据同步到 hive 中,这样产生的文件就会很多。 对 hive 来说,在进行查询时,每个小文件都会当成一个块,启动一个Map任务来完成…
手撕这十道HiveSQL题还不能吊打面试官,却能保你不被吊打【推荐收藏】
新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点。 2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习。CREATE TABLE test_sql.INSERT INTO TABLE test_sql.t...
大数据面试杀招——Hive高频考点,就怕你都会!
上一篇文章介绍了3道常见的SQL笔试题,反响还算是不错。于是乎,接下来的几天,菌哥将每天为大家分享一些关于大数据面试的杀招,祝小伙伴们都能早日找到合适的工作~ 面试官往往一上来就一个“灵魂三连问”,很多没有提前准备好的小伙伴基本回答得都磕磕绊绊,效果不是很好。下面贴出菌哥的回答…
都说数仓是面向主题建设的,那数仓的主题和主题域又应该怎么划分呢?
数仓在建设过程中,对数据的组织管理上,不仅仅要进行横向的分层,也需要根据业务情况进行纵向的主题域划分。为保证整个数仓体系的生命力,数据域需要抽象提炼,长期维护及更新,但不要轻易变动。
关注了
5
关注者
0
收藏集
0
关注标签
4
加入于
2021-08-27