稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
hive
订阅
avatar
二十年小飞侠
更多收藏集

微信扫码分享

微信
新浪微博
QQ

3篇文章 · 0订阅
  • 数仓面试高频考点--解决hive小文件过多问题
    每执行一次 insert 时hive中至少产生一个文件,因为 insert 导入时至少会有一个MapTask。 像有的业务需要每10分钟就要把数据同步到 hive 中,这样产生的文件就会很多。 对 hive 来说,在进行查询时,每个小文件都会当成一个块,启动一个Map任务来完成…
    • 五分钟学大数据
    • 4年前
    • 1.2k
    • 6
    • 评论
    大数据
  • 数仓利器-Hive高频函数合集
    前言数据准备数据集建表语句窗口函数row_number:使用频率★★★★★rank:使用频率★★★★dense_rank:使用频率★★★★rank/dense_rank/row_number对比fir
    • 进击吧大数据
    • 4年前
    • 2.8k
    • 9
    • 1
    大数据
  • 大数据培训hive数仓存储格式详解
    Hive简介 Hive 是基于 Hadoop 的一个数据仓库工具,用来进行数据提取、转化、加载。 这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。 hive 数据仓库工具能将结
    • IT小尚
    • 3年前
    • 201
    • 点赞
    • 评论
    Apache Hive