首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
数仓
订阅
用户9435295674453
更多收藏集
微信扫码分享
微信
新浪微博
QQ
7篇文章 · 0订阅
DataX 全系列之一 —— DataX 安装和使用
1 前言 Datax3.0 是异构数据源离线同步工具,支持多种类数据源,能够支撑较为复杂的业务场景。本文主要描述其的安装和多种使用方式。 2 工具的安装和部署 2.1 安装 jdk 1.8
【大数据】Hive 分区和分桶的区别及示例讲解
一、概述 在大数据处理过程中,Hive是一种非常常用的数据仓库工具。Hive分区和分桶是优化Hive性能的两种方式,它们的区别如下: 1)分区概述 Hive分区是把数据按照某个属性分成不同的数据子集。
数据库分区与分桶:实现高性能存储
1.背景介绍 数据库是现代信息系统中不可或缺的组件,它负责存储和管理数据,以及提供数据查询和修改的接口。随着数据量的不断增加,数据库的性能和存储能力成为了系统性能和可靠性的关键因素。为了解决这些问题,
【大数据】大数据 Hadoop 管理工具 Apache Ambari(HDP)
一、概述 Apache Ambari 是 Hortonworks 贡献给Apache开源社区的顶级项目,它是一个基于web的工具,用于安装、配置、管理和监视 Hadoop 集群。 Ambari 目前已
大数据学习笔记1:数仓、数据湖、数据中台
商业智能(Business Intelligence)诞生在上个世纪 90 年代,它是将企业已有的数据转化为知识,帮助企业做出经营分析决策。
数仓
一、数仓是什么 根据维基百科的定义,数仓是用于报告和数据分析的系统,是来自一个或多个不同源的集成数据的中央存储库,它将当前和历史数据存储在一起。 数仓具备以下几大特性: 主题导向:通常需要按业务含义归
数仓架构发展史
时代的变迁,生死的轮回,历史长河滔滔,没有什么是永恒的,只有变化才是不变的,技术亦是如此,当你选择互联网的那一刻,你就相当于乘坐了一个滚滚向前的时代列车,开往未知的方向,不论什么样的技术架构只有放在当前的时代背景下,才是有意义的,人生亦是如此。 时间就是一把尺子,它能衡量奋斗者…