首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大数据
努力学习的max
创建于2024-08-22
订阅专栏
大数据相关技术
暂无订阅
共5篇文章
创建于2024-08-22
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
数据库、数据源、数据存储引擎、数据查询引擎、数据处理引擎
数据源(Data Source)和数据库(Database)是在数据管理领域中常见的两个概念,它们具有一些区别和联系。以下是关于数据源和数据库的简要介绍和区别
Hadoop和Spark
数据存储 HDFS 分布式文件系统,但是一般不会将数据存储到文件系统中 HBase 基于HDFS的分布式NOSQL数据库 二、通用计算 MapReduce 面向批处理的分布式计算框架
指标、维度、分析模型、数据仓库之间的关联关系
指标 我们具体要分析的对象;分析的数据;比如“销售收入”、“销售毛利”、“采购成本” 定义:指标是用于显示、表示或指示某个现象或过程状态或表现的标志、标准或者变量
物化视图的使用场景
物化视图使用场景 视图表 构建在若干张真实的基础表纸上,由一些数据的关联/聚合的SQL语句组织起来的虚拟表,所谓的虚拟表是因为本身是不存储任何数据的,在数据库中也只是类似一个象征性的符号
大数据集群
集群就是将多台网络之间能够互联互通的服务器,通过软件手段给串联起来,形成这么一个逻辑整体,来解决单台服务器因为资源受限而带来的算力不足,或者单点故障的问题。