首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
用户3398530186343
掘友等级
获得徽章 1
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
最新
热门
HDFS 高可用和高扩展机制分析| 青训营笔记
这是我参与「第四届青训营」笔记创作活动的第9天 元数据服务高可用需求 故障类型:硬件/软件/人为 灾难:数据中心级别不可用,比如机房断电,机房空调停机,机房间网络故障或者拥塞 服务可用性的衡量指标 M
HDFS 原理与应用 | 青训营笔记
这是我参与「第四届青训营」笔记创作活动的的第8天 HDFS原理与应用 HDFS原理 HDFS(Hadoop Distributed File System)是一个分布式文件系统,是谷歌的GFS山寨版本
Presto 架构原理与优化简介 | 青训营笔记
这是我参与「第四届青训营」笔记创作活动的的第7天。 大数据与OLAP的演变 信息交换:通信和网络宽带的大幅增长 信息存储:计算机存储量的大幅增长 信息处理:整理、转换、分析数据的能力大幅增长 Hado
大数据 Shuffle 原理与实践 | 青训营笔记
这是我参与「第四届青训营」笔记创作活动的的第6天。 Shuffle概述 shuffle的作用就是把map阶段和reduce阶段连接起来,充当一个桥梁的作用。 shuffle只能产生[k,v]类型的Pa
Spark 原理与实践 | 青训营笔记
这是我参与「第四届青训营」笔记创作活动的第5天。 大数据处理引擎Spark介绍 Spark生态和特点 统一引擎,支持多种分布式场景 多语言支持 可读写丰富数据源 丰富灵活的API算子 SparkCor
流计算中的Window计算 | 青训营笔记
这是我参与「第四届青训营」笔记创作活动的第4天 一、概述 1. 流式计算vs批式计算 特性 批式计算 流式计算 数据存储 HDFS、Hive Kafka、Pulsar 数据时效性 天级别 分钟级别 准
Exactly Once 语义在 Flink 中的实现 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第3天 大数据定义 大数据的定义:高速 (Velocity) 涌现的大量 (Volume) 的多样化 (Variety) 数据。这一定义还表明大数据具有 3V
流/批/OLAP 一体的 Flink 引擎介绍 | 青训营笔记
流/批/OLAP 一体的 Flink 引擎介绍 | 青训营笔记 这是我参与「第四届青训营 」笔记创作活动的第2天 大数据 大数据(Big Data):指无法在一定时间内用常规软件工具对其进行获取、存储
SQL Optimizer 解析|青训营笔记
SQL Optimizer 解析|青训营笔记 这是我参与「第四届青训营」笔记创作活动的的第1天。 SQL Optimizer是什么 SQL Optimizer是SQL查询优化器 SQL 查询优化的目的
个人成就
文章被阅读
2,599
掘力值
205
关注了
1
关注者
0
收藏集
0
关注标签
5
加入于
2022-06-29