稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
spark
订阅
avatar
undefined在掘金36409
更多收藏集

微信扫码分享

微信
新浪微博
QQ

2篇文章 · 0订阅
  • Structured Streaming入门
    在 Spark 2.0 中,有一些内置的 sources 。 以文件流的形式读取目录中写入的文件。支持的文件格式为 text , csv , json , parquet 。文件必须以 atomically (原子方式)放置在给定的目录中 来自 Kafka 的 Poll 数据。…
    • fengye
    • 7年前
    • 1.4k
    • 1
    • 评论
    Spark
  • Spark 程序设计
    优点: 顺序读写能够大幅提高磁盘IO性能,不会产生过多小文件,降低文件缓存占用内存空间大小,提高内存使用率。 缺点:多了一次粗粒度的排序。 在spark安装目录下运行:jar cv0f spark-libs.jar -C jars/ . 创建RDD:val rdd = sc. …
    • 清风云悦
    • 6年前
    • 520
    • 点赞
    • 评论
    Spark