首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
用户5039274360767
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
4
文章 4
沸点 0
赞
4
返回
|
搜索文章
赞
文章( 4 )
沸点( 0 )
入门Hbase,看这一篇就够了
团队内部要分享HBase的知识,之前研究了一段时间,知识比较零散,这一次就系统化的整理一番,之后在想到Hbase的时候,看着一篇就够了。 Hbase是一种NoSQL数据库,这意味着它不像传统的RDBMS数据库那样支持SQL作为查询语言。Hbase是一种分布式存储的数据库,技术上…
RDD之创建、并行度与分区
本文介绍Spark-RDD的两种创建方式(内存与文件),如何决定RDD的并行度,并补充了二者的分区规则
Spark学习之Spark RDD算子
这里,从源码的角度总结一下Spark RDD算子的用法。 源码中有一个 sc.clean() 函数,它的所用是去除闭包中不能序列话的外部引用变量。Scala支持闭包,闭包会把它对外的引用(闭包里面引用了闭包外面的对像)保存到自己内部,这个闭包就可以被单独使用了,而不用担心它脱离…
Hello Spark! | Spark,从入门到精通
Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架,是专为大规模数据处理而设计的快速通用的大数据处理引擎及轻量级的大数据处理统一平台。 当我们在谈 Spark 的时候可能是指一个 Spark 应用程序,替代 Ma…
关注了
3
关注者
0
收藏集
2
关注标签
0
加入于
2021-09-16