首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
mlx
掘友等级
CS
学问之道无他,求其放心而已矣
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
Comuputational Thinking
作者:Jeannette M. Winh 作者:Peter J. Denning, Matti Tedre, Pat Yongpradit
MapReduce job 配置参数
启用 shrot-circuit local read,将 dfs.client.read.shortcircuit 设为 true。 设置属性 hadoop.security.authentication 为 kerberos,启用 Kerberos 认证。默认值 simpl…
数据序列化格式选择几个特征
Splittability(分割性):能分割,从而并行处理。文件格式包含同步标记至关重要; Apache Avro 是一个独立于编程语言的数据序列化系统。 Avro 通常用 JSON 来写,数据通常采用二进制格式编码,还有高级语言 Avro IDL。
HDFS 笔记
HDFS 块大小--128MB,与面向单一磁盘的文件系统不同,HDFS 中小于一个块大小的文件不会占据整个块的空间。 浪费 namenode 的内存。 使用 CombineFileInputFormat。 NameNode 启动时,首先进入安全模式(首次启动除外),只有访问文件…
个人成就
文章被阅读
3,081
掘力值
47
关注了
0
关注者
0
收藏集
1
关注标签
15
加入于
2019-04-29