首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
小阿磊
掘友等级
伪DRE工程师
|
鞍山路
这个人很懒
获得徽章 8
动态
文章
专栏
沸点
收藏集
关注
作品
赞
37
文章 14
沸点 23
赞
37
返回
|
搜索文章
最新
热门
k近邻(KNN)算法
KNN(K-NearestNeighbor);即K近邻算法是数据挖掘分类技术中最简单的方法之一。所谓K近邻就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻近值来代表。 假设特征空间有8
关联规则挖掘
关联规则挖掘可以让我们从数据集中发现项与项(item 与 item)之间的关系,它在我们的生活中有很多应用场景。 “购物篮分析”就是一个常见的场景,这个场景可以从消费者交易记录中发掘商品与商品之间的关
leetcode练习
我正在参加「掘金·启航计划」 删除排序数组中的重复项 给你一个 升序排列 的数组 nums ,请你 原地 删除重复出现的元素,使每个元素 只出现一次 ,返回删除后数组的新长度。元素的 相对顺序 应该保
走进 Yarn 资源管理和调度 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第17天。 课程回顾 资源和调度主要解决大规模集群中资源管理和任务调度相关问题; 本模块主要讲解两个系统: 主要针对离线业务场景: Hadoop YARN 主
浅谈分布式一致性协议 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第16天。 概述 了解了很多分布式系统的架构以及基本原理 为什么要分布式系统,在快速发展中对分布式提出的要求,从hdfs的namenode开始引出一个设计KV
LSMT 存储引擎浅析 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第15天。 上节了解了数据如何在文件层面组织起来的。 在文件之上的单存储层面这些数据文件又是如何存储的? 课程目录 介绍 LSMT 与存储引擎 分析 LSMT
Parquet 与 ORC:高性能列式存储 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第14天。 大数据生态 Hive 元数据管理 Hudi Iceberg 等 狭义‘数据湖’ 所有的数据集作业可以简化为 从存储服务读取数据 计算引擎解析和计算
从 Kafka 到 Pulsar:数据流演进之路 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第13天。 本节课程内容: 1.消息队列概述,消息队列在各个领域扮演的角色 2.kafka详解,kafka架构解析以及未来演进方向 3.Pulsar详解,Pu
数据湖三剑客详解 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第12天。 课程回顾: HDFS-分布式存储系统: HDFS通过将文件分块存储大文件,HDFS的组件有NameNode和DataNode,分别负责提供元数据和
深入浅出 HBase 实战 | 青训营笔记
这是我参与「第四届青训营 」笔记创作活动的第11天。 这节课程主要分为四个方面: 介绍 HBase 的适用场景和数据模型,设计理念 分析 HBase 的整体架构和模块设计 针对大数据场景 HBase
下一页
个人成就
文章被点赞
11
文章被阅读
3,475
掘力值
236
关注了
14
关注者
3
收藏集
0
关注标签
2
加入于
2022-06-29