首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
李哥技术笔记
掘友等级
大数据开发工程师
获得徽章 2
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
Hadoop集群搭建 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第17天 1. Hadoop 1.1 Hadoop是什么 Hadoop是一个由apache基金会所开发的分布式系统基础架构 主要解决海量数据存储和计算问题 广
实时数据中心建设思路与企业实践 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第16天 1. 企业数据架构 开发工具套件:做数据开发操作、大数据生产、数据资产管理等 数据治理:关注数据生产结果是否符合预期、数据权限管理、数据生命周期管理
行为数据分析理论与最佳实践 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第15天 1. 机器学习概览 1.1 为什么要机器学习? 人工智能时代已经到来 个性化推荐 机器翻译 人脸识别 等等 大数据成为热议内容 数据多 产生快 形式
大数据可视化理论与案例分析 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第14天 1. 定义 1.1 什么是可视化? Visualization is any technique for creating images, disa
深入理解K8S资源调度和管理 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第13天 容器和虚拟机的区别 容器是多个应该用共享一套操作系统 虚拟机是在一套操作系统上虚拟多个机器,每个机器有一套自己的操作系统 1.1 Kubernete
走进YARN资源管理与调度 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第12天 1. YARN概述 1.1 调度系统的演进(背景) IT到DT时代的变革,注重数据价值 数据计算方式的变革,注重计算效率 企业对外服务需数以万计的硬
深入浅出HBase实战(二) | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第11天 3. 大数据支撑 HBase针对海量数据场景的设计优化 水平扩展能力 负载均衡策略 故障恢复机制 3.1 HBase在大数据生态的定位 对TB、PB
Kafka到Pulsar数据流演进之路(二) | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第10天 3. Pulsar详解 3.1 Pulsar架构介绍 3.1.1 Pulsar Proxy Pulsar客户端连接集群的两种方式: Pulsar C
Parquet与ORC高性能列式存储 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第9天 1. 列存 vs 行村 1.1 数据格式层概述 计算层:各种计算引擎 数据格式层:定义了存储层文件内部的组织形式 存储层:承载数据的持久化存储 1.2
数据湖三剑客(二) | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第8天 主要介绍三个目前主流的数据湖:Iceberg、Hudi、Delta Lake。 3 各有所长 3.1 IceBerg工作重点 用户体验: Schema
下一页
个人成就
文章被阅读
1,746
掘力值
180
关注了
3
关注者
1
收藏集
0
关注标签
2
加入于
2021-12-26