首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
spark
小乔不流水
创建于2021-05-11
订阅专栏
spark的一些官方翻译 帮助一些不想看英文的初学者
暂无订阅
共11篇文章
创建于2021-05-11
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Structured Streaming(2) -- 模型设计思想
结构化串流的关键思想是将实时数据流视为不断追加的表。这就产生了一个新的流处理模型,它非常类似于批处理模型.您将把流式计算表示为静态表上的标准批处理查询,而 Spark 将其作为无界输入表上的增量查询运
Structured Streaming(1) -- 概览和示例
1、概览 结构化流是一个构建在 Spark SQL 引擎上的可伸缩和容错的流处理引擎。您可以像对静态数据表示批处理计算一样表示流计算。Spark SQL 引擎将负责以增量方式持续运行它,并在流数据继续
Spark Streaming自定义接收器
Spark Streaming 可以接收来自任意数据源的流数据,这些数据源超出了它内置支持的数据源(也就是说,超出了 Kafka、 Kinesis、文件、套接字等)。这要求开发人员实现一个接收器,该接
Spark SQL Guide--数据源
数据源 Spark SQL支持通过DataFrame接口在各种数据源上运行。数据帧可以使用关系转换进行操作,也可以用来创建临时视图。将数据帧注册为临时视图允许对其数据运行SQL查询。本节介绍使用Spa
Spark SQL Guide--Getting Started
Getting Started Starting Point: SparkSession Spark中所有功能的入口点都是SparkSession类。要创建基本的SparkSession,只需使用Sp
Spark RDD Guide--弹性分布式数据集(RDDs)
弹性分布式数据集(RDDs) Spark 围绕着弹性分布式数据集(RDD)的概念展开,RDD 是一个可以并行操作的容错元素集合。创建 rdd 有两种方法: 在驱动程序中并行化现有的集合,或者在外部存储
Spark RDD Guide--概览和初始化
Overview 在高层次上,每个 Spark 应用程序都由一个驱动程序组成,该驱动程序运行用户的主函数并在集群上执行各种并行操作。 Spark 提供的主要抽象是弹性分布式数据集(RDD) ,它是跨集
Spark-Spark Streaming(4)-- 部署、监控
1、部署应用程序 本节讨论部署 Spark Streaming 应用程序的步骤。 1.1、要求 要运行 Spark Streaming 应用程序,您需要具备以下功能。 Cluster with a c
Spark-Spark Streaming(3)-- 缓存、检查点、广播变量
1、Caching / Persistence 缓存/持久化 与 RDDs 类似,DStreams 也允许开发人员将流的数据保存在内存中。也就是说,在 DStream 上使用 persist ()方法
Spark-Spark Streaming(2)-- 输入、转换、输出
上一节我们通过简单的一个案列认识了SparkStreaming,接下来,我们将超越简单的示例,详细介绍 Spark Streaming 的基本知识。 1、链接 与 Spark 类似,Spark Str
Spark-Spark Streaming(1)-- 入门案例
如果觉得不错,请给博主点个赞呗!!! 谢谢 如果觉得不错,请给博主点个赞呗!!! 谢谢 如果觉得不错,请给博主点个赞呗!!! 谢谢 1、概览 Spark Streaming 是核心 Spa