首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
橙子猿
掘友等级
大数据开发
公众号:橙子猿 ----落地生根,长成参天大树
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1.1K
文章 967
沸点 91
赞
1.1K
返回
|
搜索文章
最新
热门
canal介绍、原理、部署、使用
简介 canal [kə'næl],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费早期阿里巴巴
flume自定义拦截器
简单需求: 向文件中定时新增日期数据,采集该文件, 通过自定义source拦截器给日期数据加上自己姓名作为前缀,输出到控制台。 分析: 需求很简单
hive使用udf
在使用hive时难免会碰到hive的函数解决不了的操作,这时我们就可以开发UDF函数去解决复杂的问题。 udf函数分类: UDF : User-Defined Function (用户自定义函数)一进
zookeeper集群安装
我这里是有3台服务器,分别hostname为node01、node02、node03。 三台机器已经配置好了ssh。 zookeeper使用的是cdh5的zookeeper包,没有使用原生
mongodb复制集windows server部署
安装完成后我们需要启动三个mongod的服务来做为复制集的三个节点,我们可以直接打开cmd,使用mongod来根据不同的配置启动服务。例如:参考如下四张图,由于我安装的磁盘足够存放mongodb的数据
hive使用split、cancat、collect_set、sort_array的一些示例及注意事项
废话不多说,我们直接使用一个使用例子来进行说明他们的功能 例如:将periodical_code表中的p_year、p_year_stage两个字段连接成json字符串,然后分组收集到array里
HBase分布式数据库概念与实操
Client是操作HBase集群的入口,对于管理类的操作,如表的增、删、改操纵,Client通过RPC与HMaster通信完成,对于表数据的读写操作,Client通过RPC与RegionServer
搭建学习使用的大数据集群环境:windows使用vmware安装三台虚拟机,配置好网络环境
安装三台linux服务器 1. 安装VMWare VMWare虚拟机软件是一个“虚拟PC”软件,它使你可以在一台机器上同时运行多个Windows、
flink保证Exactly Once的方式、原理
满足三点,可以保证端到端的Exactly Once 开启checkpoint source支持数据重发 sink端幂等性写入、事务性写入。我们常使用事务性写入 分布式快照机制(checkpoint)
flume自定义拦截器练习
向文件中定时新增日期数据,采集该文件, 通过自定义source拦截器给日期数据加上自己姓名作为前缀,输出到控制台。 分析: 需求很简单,主要在于练习flume自定义拦截器的流程,我们需要使
下一页
个人成就
文章被点赞
974
文章被阅读
58,553
掘力值
2,112
关注了
74
关注者
44
收藏集
0
关注标签
3
加入于
2022-03-29