首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
笔记
小叶要努力
创建于2022-07-31
订阅专栏
青训营笔记
暂无订阅
共36篇文章
创建于2022-07-31
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
用户数据分析理论与最佳实践(进阶篇1)| 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第21天 一、本课堂重点内容 概述 下半节课程主要分为四个方面: 介绍机器学习概览 介绍特征工程 介绍聚类算法 介绍聚类画像分析 二、详细知识点介绍: 机器
用户数据分析理论与最佳实践 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第20天 本节课程分为两个部分,分别讲述数据分析偏基础的概览和进阶的机器学习的应用。 一、本课堂重点内容 二、详细知识点介绍: 用户数据分析简介 为什么要做
数据中心建设实践思路与企业实践 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第19天 一、本课堂重点内容 课程目录 二、详细知识点介绍: 1. 企业数据架构 计算/存储引擎:Flink、Spark、ClickHouse、Doris、
深入理解 K8S 资源管理和调度 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第18天 一、本课堂重点内容 前情提问: 1.如何部署你的WordPress应用(Mysql)? 登录服务器,安装各种依赖,然后手动、脚本启动?自己编译,打
走进 Yarn 资源管理和调度 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第17天 一、本课堂重点内容 二、详细知识点介绍: 01.Yarn概述 1.1 初识调度系统 场景描述 首先考虑如下虚拟场景,如何进行调度在保障就餐公平性的
浅谈分布式一致性协议 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第16天 一、本课堂重点内容 分布式系统 一致性与共识算法 从Raft入手 实现细节以及未来 二、详细知识点介绍 01.分布式系统面临的挑战 分布式系统位于
LSMT 存储引擎浅析 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第15天 一、本课堂重点内容 LSMT与存储引擎介绍 LMST存储引擎的优势与实现 LSMT模型理论分析 LSMT存储引擎调优案例与展望 课程目录 二、详细
Parquet 与 ORC:高性能列式存储 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第14天 学习目标 课程目录 01.列存vs行存 1.1 两种数据查询分析场景:OLTP vs OLAP 1.2 OLAP:列式存储格式(列存) 特点: ·
从 Kafka 到 Pulsar:数据流演进之路(2) | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第13天 03.Pulsa详解 3.1 Pulsar架构介绍 3.1.1 Pulsar Proxy 3.1.2 Pulsar Broker Pulsar B
从 Kafka 到 Pulsar:数据流演进之路(1) | 青训营笔记
01.消息队列概述 1.1消息队列应用场景 MQ消息队列 EventBridge实践总线 Data Platform流数据平台 1.1.1 MQ消息通道 优势:异步解耦(下游无需关注上游)、削峰填谷(
数据湖三剑客:Delta Lake、Hudi 与 Iceberg 详解 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第11天 01.发展历史 Hadoop->Hive->湖仓一体 数据湖+数据仓库 什么是数据湖? 数据相关概念比较新,一直处在演进当中 一开始是HDFS,裸
深入浅出 HBase 实战 | 青训营
这是我参与「第四届青训营 」笔记创作活动的的第10天 内容回顾 HBase基于HDFS实现存储计算分离架构的分布式表格存储服务 01.使用场景 1.1 HBase是什么? HBase是一个开源的NoS
HDFS 高可用和高扩展机制分析 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第9天 1.2.1 HDFS NameNode高可用架构 组件介绍 ActiveNamenode:主节点,提供服务,生产日志 StandbyNamenode
HDFS 原理与应用 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第8天 一、HDFS基本介绍 haddop技术体系 HDFS功能特性 分布式:受GFS启发,用Java实现的开源系统,没有实现完整的POSIX文件系统语义
Presto 架构原理与优化介绍 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第7天 01.Presto概述 Hadoop:基于廉价机器的存算分离的大规模分布式处理系统(cpu性能好的进行计算,差的进行存储) 1.谷歌在2003、20
大数据 Shuffle 原理与实践 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的的第6天 01.Mapper|shuffle|Reduce 三个阶段 ·Map阶段,是在单机上进行的针对一小块数据的计算过程,简单来说呢,就是按照给定的方法进