首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
Scala-Spark
订阅
__andy__
更多收藏集
微信扫码分享
微信
新浪微博
QQ
20篇文章 · 0订阅
[译] 响应式 Web 应用(四)
基于多线程的 web 服务器依赖于多个线程池来为传入的请求分配可用的 CPU 资源,但是这种机制对于开发人员是不可见的,这样可以让开发人员在开发时可以将这些多线程看作是只有一个主线程在工作。可以说,将处理多线程的复杂性隐藏起来,将其抽象成只有一个主线程,在一开始可能会显得比较简…
《Node.js设计模式》使用流进行编码
本系列文章为《Node.js Design Patterns Second Edition》的原文翻译和读书笔记,在GitHub连载更新,同步翻译版链接。 Streams是Node.js最重要的组件和模式之一。 社区中有一句格言“Stream all the things(St…
Spark 函数详解系列之 RDD 基本转换
RDD:弹性分布式数据集,是一种特殊集合 ‚ 支持多种来源 ‚ 有容错机制 ‚ 可以被缓存 ‚ 支持并行操作,一个 RDD 代表一个分区里的数据集 RDD 有两种操作算子: Transformation(转换):Transformation 属于延迟计算,当一个 RDD 转换成一 个 RDD 时并没有立即进行转换,仅仅是记住了数据集的逻辑操作 Ation(执行):触发 Spark 作业的运行,真正触发转换算子的计算
Spark 常用函数讲解 --Action 操作
RDD:弹性分布式数据集,是一种特殊集合 ‚ 支持多种来源 ‚ 有容错机制 ‚ 可以被缓存 ‚ 支持并行操作,一个 RDD 代表一个分区里的数据集 RDD 有两种操作算子: Transformation(转换):Transformation 属于延迟计算,当一个 RDD 转换成另一个 RDD 时并没有立即进行转换,仅仅是记住 了数据集的逻辑操作 Ation(执行):触发 Spark 作业的运行,真正触发转换算子的计算
用 Apache Spark 做大数据处理 - 第五部分:Spark 机器学习数据流水线
在这篇文章中,我们 Spark 的其它机器学习 API,名为 Spark ML,如果要用数据流水线来开发大数据应用程序的话,这个是推荐的解决方案。
Spark 踩坑记:共享变量
如果我们想在节点之间共享一份变量,比如一份公共的配置项,该怎么办呢?Spark 为我们提供了两种特定的共享变量,来完成节点间变量的共享。 本文首先简单的介绍 spark 以及 spark streaming 中累加器和广播变量的使用方式,然后重点介绍一下如何更新广播变量。
Spark 以及 spark streaming 核心原理及实践
作者在接触 spark 以及 spark streaming 之后,对 spark 技术的使用的经验积累以及心得体会,在此分享给大家。本文依次从 spark 生态,原理,基本概念,spark streaming 原理及实践,还有 spark 调优以及环境搭建等方面进行介绍,希望对大家有所帮助。
Spark 常用函数讲解之键值 RDD 转换
RDD:弹性分布式数据集,是一种特殊集合 ‚ 支持多种来源 ‚ 有容错机制 ‚ 可以被缓存 ‚ 支持并行操作,一个 RDD 代表一个分区里的数据集 RDD 有两种操作算子: Transformation(转换):Transformation 属于延迟计算,当一个 RDD 转换成另一个 RDD 时并没有立即进行转换,仅仅是记住 了数据集的逻辑操作 Ation(执行):触发 Spark 作业的运行,真正触发转换算子的计算
距离全方位掌握 Apache spark 2.0 你就差最后两步
经过前面两篇对于 Spark 概念和核心结构的介绍,让我们继续深入了解 Spark:) 本篇讲述了 Spark Streaming 和机器学习,大数据中 Spark 到底做了啥,快来看看吧!
Kafka 结合 SparkStreaming 开发
Kafka 结合 SparkStreaming 开发