首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据技术栈
订阅
thewayma123
更多收藏集
微信扫码分享
微信
新浪微博
QQ
6篇文章 · 0订阅
快速搞懂湖仓一体发展历程:错过它,你将失去下一个大数据风口!
本文介绍了数据湖仓一体架构的发展历程和优势。从OLAP数据库及其限制出发,阐述了第一代数据仓库、基于Hive的数据仓库、MPP架构和其他计算引擎、数据湖、数据湖表格式以及数据湖仓的出现和发展。最后总结
大数据-80 Spark 从 MapReduce 到 Spark:大数据处理引擎的三代演进全景解析
Spark 是继 MapReduce 和 Hive 之后的新一代大数据处理引擎,凭借内存计算、DAG 执行引擎、统一的生态系统和卓越的兼容性,成为当前主流的大数据分析平台。
2025大数据常用架构体系
✅ 二、新趋势与推荐组件(按层次) 1. 数据采集层 ✅ Apache Kafka:事实标准,超高吞吐,生态成熟。 🔄 Apache Pulsar:分布式特性好、支持多租户,但生态不如 Kafka 成
入门Hadoop存储与计算:实现单词统计的分布式文件处理系统
入门Hadoop存储与计算:实现单词统计的分布式文件处理系统 引言 在当今数字化时代,数据量呈爆炸式增长,传统的数据处理和存储技术已经难以应对这种规模的数据 企业和研究机构迫切需要一种高效、可扩展且可
Hadoop的工作原理是什么?如何搭建一套分布式文件系统?
Hadoop是什么?它是如何工作的?为什么 Hadoop可以成为全球最流行的大数据处理框架之一?如何基于 Hadoop搭建一套简单的分布式文件系统?
StreamPark 构建指南(mac 版)
StreamPark 项目构建指南 一、环境准备 1.1 环境要求 JDK: 1.8+ Maven: 3.6+ Node.js: 14+ 1.2 环境验证命令 二、获取源码 三、构建过程 3.1 初始