首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据技术栈
订阅
thewayma123
更多收藏集
微信扫码分享
微信
新浪微博
QQ
4篇文章 · 0订阅
2025大数据常用架构体系
✅ 二、新趋势与推荐组件(按层次) 1. 数据采集层 ✅ Apache Kafka:事实标准,超高吞吐,生态成熟。 🔄 Apache Pulsar:分布式特性好、支持多租户,但生态不如 Kafka 成
入门Hadoop存储与计算:实现单词统计的分布式文件处理系统
入门Hadoop存储与计算:实现单词统计的分布式文件处理系统 引言 在当今数字化时代,数据量呈爆炸式增长,传统的数据处理和存储技术已经难以应对这种规模的数据 企业和研究机构迫切需要一种高效、可扩展且可
Hadoop的工作原理是什么?如何搭建一套分布式文件系统?
Hadoop是什么?它是如何工作的?为什么 Hadoop可以成为全球最流行的大数据处理框架之一?如何基于 Hadoop搭建一套简单的分布式文件系统?
StreamPark 构建指南(mac 版)
StreamPark 项目构建指南 一、环境准备 1.1 环境要求 JDK: 1.8+ Maven: 3.6+ Node.js: 14+ 1.2 环境验证命令 二、获取源码 三、构建过程 3.1 初始