首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
字节青训营
孤独的红心
创建于2022-05-08
订阅专栏
字节青训营学习--大数据、go
等 2 人订阅
共23篇文章
创建于2022-05-08
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
【年终总结】2022这一年,大学毕业、面试、读研
「回顾2022,展望2023,我正在参与2022年终总结征文大赛活动」 2022是大学生活的最后一年,四年前的九月份步入大学,今年的六月彻底的离开本科学校,虽然毕业是今年的一大事,但是从这一年来看,真
普通双非计算机类专业学生的四年大学经历
持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第14天,点击查看活动详情 今天是10月24日,1024节,突然想总结一下自己这普通而又平凡的大学生活,回顾一下自己大学四年作为双
流计算中的Window计算 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第16天 流式与批式计算 1.流式计算 VS 批式计算 大数据的计算模式主要有: 批量计算(batch computing) 流式计算(stream comp
分布式爬虫系统实现 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第15天 系统架构 redis:存储URL Flink:流式计算管理url 爬虫系统:网页爬取 Zookeeper:监控爬虫状态 存储MYSQL和HBase:
用户行为数据分析--机器学习 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第14天 机器学习概览 1.为什么要机器学习 人工智能时代已经到来:个性化推荐、机器翻译、人脸识别...... 大数据成为热议的内容:数据多、产生快、形式杂、
行为数据分析理论和实践 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第13天 行为数据分析 什么是用户行为分析? 用户行为可以用5W2H来总结: Who(谁)、What(做了什么行为)、When(什么时间)、Where(在哪里
Presto架构原理及优化 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第12天 大数据与OLAP系统的演进 什么是大数据 大数据!=大规模的数据量? 关于大数据这里我们参考马丁·希尔伯特的总结:大数据基实是在2000年后,因为信
K8S资源管理和调度
这是我参与「第四届青训营 」笔记创作活动的第11天 Kuberbetes 1.Kubernetes是什么? 特点:便携,可扩展,开源 目的:管理容器应用和服务 作用:声明式配置和自动化 2.Kuber
yarn资源管理与调度 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第10天 yarn概述 1.调度系统演进 调度系统解决的问题 用有限资源解决有限资源无法满足的需求时就需要调度; 调度系统主要解决资源请求和可用资源间的映射(
数据湖 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第9天 数据湖发展历史 第一阶段---Hadoop 数据湖最开始的概念——分布式存储HDFS使用目录来区分不同的数据集 /douyin /20220623/2
LSMT存储引擎 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第8天 LSMT存储引擎介绍 1 LSMT历史 LSMT 是 Log-Structured Merge-Tree的缩写,由Patrick O ‘Neil et
高性能列式存储 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第7天 所有的大数据作业简单来说都可以简化 从存储服务读取数据 计算引擎解析和计算数据 结果呈现 “如何高效从存储读取所需的数据”是决定大数据计算作业性能的关
从Kafka到Pulsar | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第6天 消息队列 1.消息队列应用场景 MQ消息通道 异步解耦 削峰填谷 高可用 发布订阅 EventBridge数据总线 事件源:将云服务、自定义应用、Sa
Spark原理与实践 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第5天 大数据处理引擎Spark介绍 1.大数据处理技术栈 数据-Volume Variety Velocity 存储-HDFS Kafka HBase 计算
HBase实战 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第4天 适用场景 1.什么是HBase HBase是一个开源的NoSQL分布式数据库,是Apache软件基金会顶级项目之一。 参考Google BigTabl
HDFS原理与应用 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第3天 HDFS基本介绍 1.hadoop 技术体系 2.分布式文件系统 大容量 更多的机器和存储介质 高可靠 多个副本提高容错能力 低成本 不需要高端软件来
FIink引擎|青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第2天 Flink概述 Flink诞生背景 1.大数据 Big Data:指在一定时间内无法用常规软件工具对其进行获取、存储、管理和处理的数据集合 具有价值化
SQL查询优化器|青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第1天 大数据体系结构和SQL 在分析引擎部分中,Spark、Flink等框架使用的是同样的SQL----“one SQL rules big data al
数据结构与算法 | 青训营笔记
这是我参与「第三届青训营 -后端场」笔记创作活动的的第5篇笔记 经典排序算法 插入排序 插入排序的主要想法是,每一次将一个待排序的元素插入到前方已经排序好的序列中,直到插入所有元素。尽管其平均时间复杂
Git 的正确使用姿势与最佳实践 | 青训营笔记
Git基本使用方式 git init 初始化 tree .git 关于git bash 不支持tree命令,cmd命令行支持tree命令 https://www.cnblogs.com/snowdre
下一页