首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Natasha_
掘友等级
大数据开发
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
47
文章 47
沸点 0
赞
47
返回
|
搜索文章
Natasha_
关注了
MobileDeveloper
大数据开发
Natasha_
赞了这篇文章
MobileDeveloper
大龄程序员
·
2年前
关注
Why | 为什么需要虚拟内存?
冯-诺依曼老爷子告诉过我们,算术逻辑单元和控制器单元组成的 CPU 负责进行运算以及程序流程的控制。运算所需要的指令和数据由 内存 来提供。 那么,如果让你作为操作系统的顶...
31
6
分享
Natasha_
大数据开发
·
3年前
关注
使用Datax将数据从Mysql导到Elasticsearch7.x的填坑过程和使用记录
前提:业务需要将Tidb(Mysql内核)中8亿多条数据从Mysql导到Elasticsearch7中。 一开始我首先想到,“那就使用久负盛名的ELK来做数据迁移呀!”。L...
6
1
分享
Natasha_
大数据开发
·
3年前
关注
编译Flink1.11保姆级教程及解决遇到的坑
一. flink-runtime-web 其中,一直编译失败的是flink-runtime-web模块,故先cd flink-runtime-web进行单独编译。 坑2:编...
1
1
分享
Natasha_
大数据开发
·
3年前
关注
(一)Spark RDD的基础概念
1. MapReduce和Spark的对比 MapReduce是一种计算模型,将大型数据分解成很多单个任务在集群中并行执行,然后将计算结果合并起来得到最终的结果。具体关于M...
3
2
分享
Natasha_
赞了这篇文章
乔二爷
公众号「乔二爷」
·
5年前
关注
Spark 的核心概念 RDD
RDD(Resilient Distributed Dataset) 叫着 弹性分布式数据集 ,是Spark 中最基本的抽象,它代表一个不可变、可分区、里面元素可以并行计算...
6
1
分享
Natasha_
赞了这篇文章
皮皮鲁的科技星球
4年前
关注
从Hadoop到Spark、Flink,大数据处理框架十年激荡发展史!
当前这个数据时代,各领域各业务场景时时刻刻都有大量的数据产生,如何理解大数据,对这些数据进行有效的处理成为很多企业和研究机构所面临的问题。本文将从大数据的基础特性开始,进而...
8
评论
分享
Natasha_
关注了标签
Spark
大数据开发
Natasha_
大数据开发
·
3年前
关注
(四)Hive 数据查询详解
1. 数据准备 2. 单表查询 Hive 支持使用 GROUP BY 进行分组聚合操作。 如果是字符串,则按照字典序排序。 使用 sort by 时只会在每个 Reduce...
1
评论
分享
Natasha_
大数据开发
·
3年前
关注
(三)Hive的视图,分区表,分桶表,索引
1. 视图 Hive 中的视图和 RDBMS 中视图的概念一致,都是一组数据的逻辑表示,本质上就是一条 SELECT 语句的结果集。 视图是纯粹的逻辑对象,没有关联的存储,...
1
评论
分享
Natasha_
赞了这篇文章
58沈剑_架构师之路
架构师 @58
·
4年前
关注
数据库索引,到底是什么做的?
近期写数据库,不少朋友留言问MySQL索引底层的实现,今天简单聊一聊,少讲“是怎么样”,更多说说“为什么设计成这样”。 问题1. 数据库为什么要设计索引? 以便快速找到一本...
131
7
分享
Natasha_
大数据开发
·
3年前
关注
(二)Hive的数据类型,常用 DDL操作,常用DML 操作
1. 数据类型 Hive的ARRAY和MAP与java中的Array和Map类似,而STRUCT与C语言中的Struct类似,它封装了一个命名字段集合,复杂数据类型允许任意...
1
评论
分享
Natasha_
大数据开发
·
3年前
关注
(一)Hive的基本概念
1. 简介 Hive 是一个构建在 Hadoop 之上的数据仓库,它可以将结构化的数据文件映射成表,并提供类 SQL 查询功能,用于查询的 SQL 语句会被转化为 MapR...
2
评论
分享
Natasha_
赞了这篇文章
大数据技术与数仓
大数据开发工程师
·
3年前
关注
实时数仓|基于Flink1.11的SQL构建实时数仓探索实践
实时数仓主要是为了解决传统数仓数据时效性低的问题,实时数仓通常会用在实时的OLAP分析、实时的数据看板、业务指标实时监控等场景。虽然关于实时数仓的架构及技术选型与传统的离线...
3
1
分享
Natasha_
关注了
heibaiying
大数据开发
Natasha_
关注了标签
Apache Hive
大数据开发
Natasha_
大数据开发
·
3年前
关注
(三)Elasticsearch的基本操作
1. 索引的操作 2. 文档的操作...
1
评论
分享
下一页
个人成就
文章被点赞
77
文章被阅读
34,492
掘力值
971
关注了
6
关注者
32
收藏集
1
关注标签
22
加入于
2020-11-02