首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
落叶飞逝的恋
掘友等级
攻城狮
Java、大数据
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发HBase架构原理(第二十五篇)
一、Region概念 Region可以翻译为区域,在HBase里面,一个表中的数据,会按照行被横向划分为多个Region。 每个Region,是按照存储的RowKey的最小...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发HBase Java Api操作(第二十四篇)
一、HBase的增删改查操作 命令 解释 put 添加数据、修改数据 get 查看数据 count 查看表中数据总条数 scan 扫描表中的数据 delete/delete...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发HBase初体验(第二十三篇)
一、HBase介绍 HBase是一个开源的NoSQL数据库,参考的Google的Big Table建模,用Java语言实现的,运行于HDFS文件系统上,为Hadoop提供类...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发Hive数据存储格式(第二十二篇)
hive没有专门的数据存储格式,默认keyi直接加载文本文件TextFile,还支持SequenceFile、RCFile等。https://cwiki.apache.or...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发Hive数据压缩格式(第二十一篇)
一、常见的数据压缩格式 前面的hive默认使用的TextFile格式的数据,这种格式的数据,在存储层面占用的空间比较大,影响存储能力,也影响计算效率,所以为了提高Hive中...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发Hive高级函数(第二十篇)
持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第7天,点击查看活动详情 一、Hive函数的基本操作 与MySQL一样,hive也是一个主要做统计的工...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发Hive综合案例(第十九篇)
持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第6天,点击查看活动详情 一、综合案例 1.1、需求描述 Flume按天把数据采集到HDFS中对应的目...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发Hive中数据库的操作(第十八篇)
Hive中常见的数据库相关操作: 1、创建数据库 2、查看表信息 3、查看表结构 4、查看表的创建信息 5、修改表名 6、加载数据 7、查询加载的数据 8、表增加字段 9、...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发使用Hive(第十七篇)
一、Hive的使用方式 1.1、命令行方式hive方式 针对命令行这种方式,其实还有两种使用第一个是使用bin目录下的hive命令,这个是从hive一开始就支持的使用方式后...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发快速入门Hive(第十六篇)
一、什么是Hive Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取、转化、加载,可以简称为ETL。 Hive 定义了简单的类S...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发Flume自定义组件(第十五篇)
一、自定义组件 source、channel、sink以及Source Interceptors,Channel Selectors、Sink Processors针对这些...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发Flume高级组件(第十四篇)
一、Flume的高级组件 Source Interceptors:Source可以指定一个或者多个拦截器按先后顺序依次对采集到的数据进行处理 Channel Selecto...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发快速入门Flume(第十三篇)
一、什么是Flume Flume是一个高可用、高可靠,分布式的海量日志采集、聚合和传输的系统,能够有效的收集、聚合、移动大量的日志数据。通俗来讲:Flume是一个很靠谱、很...
1
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发Yarn实战(第十二篇)
一、Yarn信息 从Hadoop2开始,官方把资源管理单独剥离出来,主要是为了考虑后期作为一个公共的资源管理平台,任何满足规则的计算引擎都可以在它上面执行。所以Yarn可以...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发MapReduce性能优化(第十一篇)
一、小文件处理 Hadoop的HDFS和MapReduce都是针对大数据文件来设计的,在小文件的处理上不但效率低下,而且十分消耗内存资源。针对HDFS而言,每一个小文件在n...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发Hadoop序列化(第十篇)
我报名参加金石计划1期挑战——瓜分10万奖池,这是我的第n篇文章,点击查看活动详情 一、Shuffle过程详解 Shuffle是一个网络拷贝的过程,是指通过网络把数据从ma...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发深入MapReduce(第九篇)
一、MapReduce任务日志查看 想要查看MapReduce程序执行过程中产生的日志信息怎么办? 1.1、开启Yarn日志聚合功能 需要开启YARN的日志聚合功能,把散落...
0
评论
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发MapReduce(第八篇)
一、MapReduce介绍 1.1、MapReduce计算思想 举个例子,要统计扑克牌的黑桃个数,最直接的办法是一张一张检查然后进行统计。利用MapReduce的计算方法,...
3
2
分享
落叶飞逝的恋
攻城狮
·
2年前
关注
大数据开发DataNode与HDFS高级特性(第七篇)
一、SecondaryNameNode SecondaryNameNode主要负责定期的把edits文件中的内容合并到fsimage中。这个合并操作称为checkpoint...
0
评论
分享
落叶飞逝的恋
攻城狮
·
3年前
关注
大数据开发初识NameNode(第六篇)
一、NameNode介绍 1.1、HDFS支持主从结构 主节点称为:NameNode,因为主节点上运行的有NameNode进程。NameNode支持多个,目前配置1个 从节...
0
评论
分享
下一页
个人成就
文章被点赞
7
文章被阅读
16,476
掘力值
843
关注了
2
关注者
11
收藏集
2
关注标签
2
加入于
2016-01-07