首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
MOBIN1419
掘友等级
大数据工程师
专注Hadoop、Spark,热爱开源!2016,韩语得学好!!!
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
15
文章 15
沸点 0
赞
15
返回
|
搜索文章
最新
热门
HBase 二级索引的设计 (案例讲解)
最近做的一个项目涉及到了多条件的组合查询,数据存储用的是 HBase,恰恰 HBase 对于这种场景的查询特别不给力,一般 HBase 的查询都是通过 RowKey(要把多条件组合查询的字段都拼接在 RowKey 中显然不太可能),或者全表扫描再结合过滤器筛选出目标数据 (太低效),所以通过设计 HBase 的二级索引来解决这个问题
Spark 常用函数讲解 --Action 操作
RDD:弹性分布式数据集,是一种特殊集合 ‚ 支持多种来源 ‚ 有容错机制 ‚ 可以被缓存 ‚ 支持并行操作,一个 RDD 代表一个分区里的数据集 RDD 有两种操作算子: Transformation(转换):Transformation 属于延迟计算,当一个 RDD 转换成另一个 RDD 时并没有立即进行转换,仅仅是记住 了数据集的逻辑操作 Ation(执行):触发 Spark 作业的运行,真正触发转换算子的计算
Spark 常用函数讲解之键值 RDD 转换
RDD:弹性分布式数据集,是一种特殊集合 ‚ 支持多种来源 ‚ 有容错机制 ‚ 可以被缓存 ‚ 支持并行操作,一个 RDD 代表一个分区里的数据集 RDD 有两种操作算子: Transformation(转换):Transformation 属于延迟计算,当一个 RDD 转换成另一个 RDD 时并没有立即进行转换,仅仅是记住 了数据集的逻辑操作 Ation(执行):触发 Spark 作业的运行,真正触发转换算子的计算
Spark 函数详解系列之 RDD 基本转换
RDD:弹性分布式数据集,是一种特殊集合 ‚ 支持多种来源 ‚ 有容错机制 ‚ 可以被缓存 ‚ 支持并行操作,一个 RDD 代表一个分区里的数据集 RDD 有两种操作算子: Transformation(转换):Transformation 属于延迟计算,当一个 RDD 转换成一 个 RDD 时并没有立即进行转换,仅仅是记住了数据集的逻辑操作 Ation(执行):触发 Spark 作业的运行,真正触发转换算子的计算
Spark Streaming-- 实战篇
prak Streaming 属于 Saprk API 的扩展,支持实时数据流(live data streams)的可扩展,高吞吐(hight-throughput) 容错(fault-tolerant)的流处理。可以接受来自 KafKa,Flume,ZeroMQ Kinesis Twitter 或 TCP 套接字的数据源,处理的结果数据可以存储到文件系统 数据库 现场 dashboards 等。
深度剖析 JDK 动态代理机制
相比于静态代理,动态代理避免了开发人员编写各个繁锁的静态代理类,只需简单地指定一组接口及目标类对象就能动态的获得代理对象。
Hive 集成 HBase 详解
Hive 提供了与 HBase 的集成,使得能够在 HBase 表上使用 HQL 语句进行查询 插入操作以及进行 Join 和 Union 等复杂查询
个人成就
文章被点赞
440
文章被阅读
24,696
掘力值
1,005
关注了
0
关注者
66
收藏集
0
关注标签
6
加入于
2016-02-09