首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大数据
cfzAlmighty
创建于2022-07-27
订阅专栏
字节跳动青训营大数据基础班笔记
暂无订阅
共15篇文章
创建于2022-07-27
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
大数据可视化理论(2) | 青训营笔记
第二十节课「大数据可视化理论与案例分析」的内容主要包含 4 个方面:定义、原理、案例、学习。这篇文章主要介绍可视化设计(包括认知与知觉、可视化编码、格式塔理论)、交互和动画。
大数据处理引擎Spark介绍 | 青训营笔记
第六节课「大数据 Shuffle 原理与实践」的内容主要包含 4 个方面:Push Shuffle。这篇文章包括 Shuffle 概述、Shuffle 算子、Shuffle 过程的内容。
大数据可视化理论(1) | 青训营笔记
这篇文章为大数据可视化理论的介绍,包括什么是可视化、什么是数据可视化、数据可视化作用、数据可视化基本流程、数据与数据集分类、属性分类。
用户数据分析理论 | 青训营笔记
第十九节课「用户数据分析理论与最佳实践」的内容主要包含 4 个方面。这篇文章主要介绍为什么做数据分析、数据分析的各个环节和数据分析的流程。
Presto 的重要机制 | 青训营笔记
第七节课「Presto 架构原理与优化介绍」的内容主要包含 4 个方面。这篇文章为 Presto 的重要机制介绍,包括多租户资源管理、多租户任务调度、内存计算和多数据源联邦查询。
Presto 基础原理和概念 | 青训营笔记
第七节课「Presto 架构原理与优化介绍」的内容主要包含 4 个方面:概述、Presto 基础原理和概念、Presto 基础原理和概念、性能优化实战。这篇文章包括概述、Presto 基础原理和概念。
SparkCore和SparkSQL | 青训营笔记
第五节课「Spark 原理与实践」的内容主要包含 4 个方面,这篇文章为 Spark Core 和 Spark SQL 的介绍。
大数据处理引擎Spark介绍 | 青训营笔记
这篇文章为大数据处理引擎Spark介绍,包括 Spark 的特点、Spark 生态组件、Spark 运行架构和工作原理和 Spark 目前支持的集群管理器。
Flink 整体架构 | 青训营笔记
这篇文章为 Flink 整体架构的相关内容,包括 Flink 的分层架构、Flink 的总体架构和 Flink 如何做到流批一体。
Flink 概述 | 青训营笔记
这篇文章主要介绍 Flink 概述的相关内容,包括流式计算引擎的发展历史、主要的流式计算引擎能力对比和 Flink 开源生态。
流计算中的 Window 计算(2) | 青训营笔记
第四节课「流计算中的 Window 计算」:这篇文章主要介绍Window的分类、迟到数据处理、增量计算和全量计算、EMIT触发。
常见的查询优化器——CBO | 青训营笔记
这篇文章为常见的查询优化器 Cost-based Optimizer (CBO) 的介绍,包括概念、统计信息和执行计划枚举。
常见的查询优化器——RBO | 青训营笔记
第一节课「SQL Optimizer 解析」常见的查询优化器——这篇文章主要介绍常见的查询优化器 Rule-based Optimizer (RBO) 。
流计算中的 Window 计算 | 青训营笔记
第四节课「流计算中的 Window 计算」的内容主要包含 4 个方面:概述、Watermark、Window、案例分析。这篇文章为概述和 Watermark 的相关内容。
大数据体系和 SQL | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第1天。这篇文章为大数据体系和 SQL 的相关内容,包括大数据体系和SQL的处理流程。