首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
wizard13014
更多收藏集
微信扫码分享
微信
新浪微博
QQ
16篇文章 · 0订阅
Docker-Compose搭建Hadoop集群
持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第2天,点击查看活动详情 一、前言 在许多大数据实验中,需要使用到hdfs集群,但是创建按照教程一步步配置虚拟机并搭建一个可用的集群
兄弟,用大白话告诉你小白都能看懂的Hadoop架构原理
Hadoop是目前大数据领域最主流的一套技术体系,包含了多种技术。 包括HDFS(分布式文件系统),YARN(分布式资源调度系统),MapReduce(分布式计算系统),等等。 有些朋友可能听说过Hadoop,但是却不太清楚他到底是个什么东西,这篇文章就用大白话给各位阐述一下。…
数据引擎查询原理及应用
数据查询引擎是大数据处理架构的核心组件之一,通常是面向数据应用层的直接接口。
不同的瑞士军刀:对比 Spark 和 MapReduce
作为一个开源的数据处理框架,Spark 是如何做到如此迅速地处理数据的呢?秘密就在于它是运行在集群的内存上的,而且不受限于 MapReduce 的二阶段范式。这大大加快了重复访问同一数据的速度。
一篇文看懂 Hadoop:风雨十年,未来何去何从
我们很荣幸能够见证 Hadoop 十年从无到有,再到称王。感动于技术的日新月异时,希望通过这篇内容深入解读 Hadoop 的昨天、今天和明天,憧憬下一个十年。
饿了么推荐系统:从 0 到 1
饿了么推荐系统:从 0 到 1
Pythonの数据分析练手(一)
最近拿到本《Python for Data Analysis》,就用Jupyter Notebook来跑了一遍里面的例子,现在想把他做个记录,以后翻翻看也好(PS:早上翘课被点名了,欲哭无泪)
Hive 数据仓库系列分析汇总
一个分享大数据技术的优秀博客
hadoop 学习之路
在大数据时代,要想个性化实现业务的需求,还是得操纵各类的大数据软件,如:hadoop、hive、spark 等。笔者(阿里封神)混迹 Hadoop 圈子多年,经历了云梯 1、ODPS 等项目,目前 base 在 E-Mapreduce。在这,笔者尽可能梳理下 hadoop 的学习之路。
使用 Docker 搭建本地 Hadoop 集群
利用 docker 在本机搭建虚拟 hadoop 集群