字节青训营

字节青训营

字节青训营

字节青训营学习--大数据、go

等 2 人订阅共23篇文章创建于2022-05-08

【年终总结】2022这一年，大学毕业、面试、读研

「回顾2022，展望2023，我正在参与2022年终总结征文大赛活动」 2022是大学生活的最后一年，四年前的九月份步入大学，今年的六月彻底的离开本科学校，虽然毕业是今年的一大事，但是从这一年来看，真

3年前
2.0k
25
10

【年终总结】2022这一年，大学毕业、面试、读研

普通双非计算机类专业学生的四年大学经历

持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第14天，点击查看活动详情今天是10月24日，1024节，突然想总结一下自己这普通而又平凡的大学生活，回顾一下自己大学四年作为双

3年前
306
38
1

流计算中的Window计算 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第16天流式与批式计算 1.流式计算 VS 批式计算大数据的计算模式主要有：批量计算(batch computing) 流式计算(stream comp

3年前
285
10
评论

分布式爬虫系统实现 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第15天系统架构 redis：存储URL Flink：流式计算管理url 爬虫系统：网页爬取 Zookeeper：监控爬虫状态存储MYSQL和HBase：

3年前
365
9
评论

用户行为数据分析--机器学习 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第14天机器学习概览 1.为什么要机器学习人工智能时代已经到来：个性化推荐、机器翻译、人脸识别...... 大数据成为热议的内容:数据多、产生快、形式杂、

3年前
439
8
评论

行为数据分析理论和实践 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第13天行为数据分析什么是用户行为分析？用户行为可以用5W2H来总结： Who(谁)、What(做了什么行为)、When(什么时间)、Where(在哪里

3年前
136
8
评论

Presto架构原理及优化 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第12天大数据与OLAP系统的演进什么是大数据大数据!=大规模的数据量? 关于大数据这里我们参考马丁·希尔伯特的总结:大数据基实是在2000年后，因为信

3年前
112
8
评论

K8S资源管理和调度

这是我参与「第四届青训营」笔记创作活动的第11天 Kuberbetes 1.Kubernetes是什么？特点:便携，可扩展，开源目的:管理容器应用和服务作用:声明式配置和自动化 2.Kuber

3年前
239
8
评论

yarn资源管理与调度 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第10天 yarn概述 1.调度系统演进调度系统解决的问题用有限资源解决有限资源无法满足的需求时就需要调度; 调度系统主要解决资源请求和可用资源间的映射(

3年前
252
8
评论

数据湖 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第9天数据湖发展历史第一阶段---Hadoop 数据湖最开始的概念——分布式存储HDFS使用目录来区分不同的数据集 /douyin /20220623/2

3年前
90
6
评论

LSMT存储引擎 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第8天 LSMT存储引擎介绍 1 LSMT历史 LSMT 是 Log-Structured Merge-Tree的缩写，由Patrick O ‘Neil et

3年前
146
6
评论

高性能列式存储 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第7天所有的大数据作业简单来说都可以简化从存储服务读取数据计算引擎解析和计算数据结果呈现 “如何高效从存储读取所需的数据”是决定大数据计算作业性能的关

3年前
332
5
评论

从Kafka到Pulsar | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第6天消息队列 1.消息队列应用场景 MQ消息通道异步解耦削峰填谷高可用发布订阅 EventBridge数据总线事件源:将云服务、自定义应用、Sa

3年前
317
6
评论

Spark原理与实践 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第5天大数据处理引擎Spark介绍 1.大数据处理技术栈数据-Volume Variety Velocity 存储-HDFS Kafka HBase 计算

3年前
85
4
评论

HBase实战 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第4天适用场景 1.什么是HBase HBase是一个开源的NoSQL分布式数据库，是Apache软件基金会顶级项目之一。参考Google BigTabl

3年前
158
4
评论

HDFS原理与应用 | 青训营笔记

这是我参与「第四届青训营」笔记创作活动的第3天 HDFS基本介绍 1.hadoop 技术体系 2.分布式文件系统大容量更多的机器和存储介质高可靠多个副本提高容错能力低成本不需要高端软件来

3年前
115
4
评论

FIink引擎|青训营笔记

这是我参与「第四届青训营」笔记创作活动的第2天 Flink概述 Flink诞生背景 1.大数据 Big Data：指在一定时间内无法用常规软件工具对其进行获取、存储、管理和处理的数据集合具有价值化

3年前
122
4
评论

SQL查询优化器|青训营笔记

这是我参与「第四届青训营」笔记创作活动的第1天大数据体系结构和SQL 在分析引擎部分中，Spark、Flink等框架使用的是同样的SQL----“one SQL rules big data al

3年前
106
4
评论

数据结构与算法 | 青训营笔记

这是我参与「第三届青训营 -后端场」笔记创作活动的的第5篇笔记经典排序算法插入排序插入排序的主要想法是，每一次将一个待排序的元素插入到前方已经排序好的序列中，直到插入所有元素。尽管其平均时间复杂

3年前
115
4
评论

Git 的正确使用姿势与最佳实践 | 青训营笔记

Git基本使用方式 git init 初始化 tree .git 关于git bash 不支持tree命令，cmd命令行支持tree命令 https://www.cnblogs.com/snowdre

3年前
164
3
评论