首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
Quinlan65
更多收藏集
微信扫码分享
微信
新浪微博
QQ
8篇文章 · 0订阅
DataX 全系列之零 —— 初识 DataX
1.基本介绍 DataX是一种异构数据源离线同步工具,实现了包括关系型数据库(如Mysql)、HDFS、Hive、Hbase、FTP、ElasticSearch等各种异构数据源之间稳定高效的数据同
DataX 全系列之一 —— DataX 安装和使用
1 前言 Datax3.0 是异构数据源离线同步工具,支持多种类数据源,能够支撑较为复杂的业务场景。本文主要描述其的安装和多种使用方式。 2 工具的安装和部署 2.1 安装 jdk 1.8
DataX 全系列之三 —— DataX 源码运行流程分析
1 程序入口类Engine 任务执行的入口类为Engine Engine类内部的entry方法主要功能是: 解析命令行参数-mode, -jobid ,-job ,分别获取执行模式,jobid
DataX全系列之二 —— DataX 总体架构和原理
1.DataX的整体架构 主要分为三个部分,Reader,FrameWork,Writer 1.1 Reader 读数据库内容的插件,一个 job 会根据 json 配置文件调用 对应数据源的
DataX 全系列之四 —— DataX 核心数据结构
1. JobContainer 1.1 基本介绍 JobContainer 的 job 实例运行在 jobContainer 容器中,它是所有任务的 master,负责初始化、拆分、调度、运行、回
DataX 全系列之五 —— DataX-web 介绍和使用
Datax 的使用过程中,我们会发现,不管是利用 java 调用以及 python 命令启动的方式,我们都无法进行任务的管理,并且每次执行任务前,我们 都需要编辑 Json 配置文件,这是比较繁琐的,
hive(1) : 基础入门就这么简单
本次采用的 hive版本为3.1.2 , mysql 为8.0.20 . 一、Hive 基本概念 1.1 什么是 Hive 1.1.1 简介
[翻译] HDFS架构
原文链接, 版本: 3.3.6 简介 HDFS(Hadoop Distributed File System)是一个分布式文件系统, 期望可以运行在廉价机器上。它与现有的分布式系统有很多相似之处, 然