首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
Spark
订阅
鬼魅巨蟹
更多收藏集
微信扫码分享
微信
新浪微博
QQ
10篇文章 · 0订阅
利用已有的大数据技术,如何构建机器学习平台
人脑具备不断积累经验的能力,依赖经验我们便具备了分析处理的能力,比如我们要去菜场挑一个西瓜,别人或者自己的经验告诉我们色泽青绿、根蒂蜷缩、纹路清晰、敲声浑响的西瓜比较好吃。
Spark 系列:『 Spark 』1. spark 简介
things you need know before you touch Spark and before you decide to use spark in your next project.
Spark 机器学习 · 实时机器学习
模型随着接收的新消息,不断更新自己;而不是像离线训练一次次重新训练。
Spark 系列:『 Spark 』4. spark 之 RDD
要想学好 spark,怎么能不先搞清楚 RDD 的来龙去脉呢~~~
Spark 函数详解系列之 RDD 基本转换
RDD:弹性分布式数据集,是一种特殊集合 ‚ 支持多种来源 ‚ 有容错机制 ‚ 可以被缓存 ‚ 支持并行操作,一个 RDD 代表一个分区里的数据集 RDD 有两种操作算子: Transformation(转换):Transformation 属于延迟计算,当一个 RDD 转换成一 个 RDD 时并没有立即进行转换,仅仅是记住了数据集的逻辑操作 Ation(执行):触发 Spark 作业的运行,真正触发转换算子的计算
大数据资源整理
scala、spark 使用过程中,各种测试用例以及相关资料整理
spark入门笔记
用户编写的Spark程序,通过一个有main方法的类执行,完成一个计算任务的处理。它是由一个Driver程序和一组运行于Spark集群上的Executor组成 弹性分布式数据集。RDD是Spark的核心数据结构,可以通过一系列算子进行操作。当RDD遇到Action算子时,将之前…
Spark 快速入门教程
该入门教程搭配了在线环境,可以直接在线体验 spark。Apache Spark 是一个新兴的大数据处理通用引擎,提供了分布式的内存抽象。本教程从核心组件、体系结构、安装部署方面做了介绍。
Spark 架构
不久前我在 StackOverflow 上回答了一系列关于 Apache Spark 架构相关的问题。这似乎是由于网上缺乏好的 Spark 整体架构的文章。甚至是官网指导中也没有很多详细的介绍,当然也缺少好的架构图。“Learning Spark” 这本书和官方资料中也一样没有。
【Spark 教程】核心概念 RDD
RDD 全称叫做弹性分布式数据集 (Resilient Distributed Datasets),它是一种分布式的内存抽象,表示一个只读的记录分区的集合,它只能通过其他 RDD 转换而创建。本文通过编程模型和应用举例给大家简要介绍下 Spark 核心概念 RDD。