稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
spark
订阅
avatar
恍兮惚兮 创作等级LV.3
更多收藏集

微信扫码分享

微信
新浪微博
QQ

2篇文章 · 0订阅
  • 什么是 RDD ?
    Spark 中最基本的数据抽象是 RDD。 RDD:弹性分布式数据集 (Resilient Distributed DataSet)。 这三个特性分别为:分区,不可变,并行操作。 每一个 RDD 包含的数据被存储在系统的不同节点上。逻辑上我们可以将 RDD 理解成一个大的数组,…
    • stonezhu
    • 6年前
    • 3.1k
    • 3
    • 评论
    Spark
  • Spark 从零到开发(七)Spark SQL和DataFrame
    方式一和方式二最大的区别在哪呢,通俗点说就是获取字段类型的手段不同。 方式一通过java反射,但是要有javabean当字段模版。 方式二通过手动编码设置line的split对象的每个数据段的类型,不用创建javabean。
    • PlayInJava
    • 7年前
    • 721
    • 1
    • 评论