flume - 用户5281451610857的收藏集 - 掘金

flume

用户5281451610857

更多收藏集

13篇文章 · 0订阅

Flume跨机器采集日志，并按照时间天数切割，下发到HDFS

需求A服务器需做的事情B服务器需做的事情操作步骤1、启动B服务器上的flume此图中的红框标志B服务器启动flume成功2、启动A服务器上的flume此图中的红框标志A服务器启动flume成功查看HD

总要回家
5年前
732
1
评论

聊聊自学大数据flume中容易被人忽略的细节

前言：老刘不敢保证说的有多好，但绝对是非常良心地讲述自学大数据开发路上的一些经历和感悟，保证会讲述一些不同于别人技术博客的细节。01自学Flume的细节老刘现在想写点有自己特色的

大数据老刘
5年前
599
3
评论

Flume 是怎么保障可靠性的？

Apache Flume 是怎么保障可靠性的？Apache Flume中的负载均衡和故障转移又是怎么一回事？

Shockang
4年前
828
1
评论

基于阿里云实现游戏数据运营(附Demo)

2、进入多维分析报表的IDE工作台：3、可以看到，左侧的字段属性区，会自动加载物理表的对应字段（默认加载comment描述）：4、具体分析操作，比较简单，按需双击、拖拽需要分析的字段，点击查询即可看到

云栖技术精粹
8年前
248
点赞
评论

大数据如何将MySQL数据实时同步至hive仓库-架构设计

今天想和大家讨论下大数据在接入业务数据这一部分的设计，我指的业务数据是存在MySQL或者其它关系型数据库的数据，下面直接进入正题吧。一次性全量拉取：逻辑上基本采用select * from table的形式，在hive中一般表现为一个分区，也有可能是非分区表的形式。一次性增…

爱斯基摩人
6年前
4.9k
7
2

Flume+Kafka双剑合璧玩转大数据平台日志采集

大数据平台每天会产生大量的日志，处理这些日志需要特定的日志系统。具有高可扩展性。即：当数据量增加时，可以通过增加节点进行水平扩展。数据采集模块：负责从各节点上实时采集数据，建议选用Flume-NG来实现。数据接入模块：由于采集数据的速度和数据处理的速度不一定同步，因此添加…

Java菜分享
7年前
1.4k
3
评论

Flume+Kafka+Storm+Redis构建大数据实时处理系统

前面给出的那篇文章是基于MapReduce的离线数据分析案例，其通过对网站产生的用户访问日志进行处理并分析出该网站在某天的PV、UV等数据。对应上面的图示，其走的就是离线处理的数据处理方式，而这里即将要介绍的是另外一条路线的数据处理方式，即基于Storm的在线处理。在下面给出…

DBA实践
7年前
950
1
评论

Flume+Kafka+Storm+Redis构建大数据实时处理系统：实时统计网站PV、UV+展示

这篇文章主要讲了基于Storm的在线处理，通过对网站产生的用户访问日志进行处理并分析出该网站在某天的PV、UV等数据。

九章算法
7年前
531
1
评论

flume采集MongoDB数据到Kafka中

由于flume对数据库的支持欠缺，flume的source组件中，没有组件适用于连接关系型数据库或非关系型数据库。对于关系型数据库（RDB），github中开源插件flume-ng-sql-source被广泛用于对接RDB。但是对于非关系型数据库，不同的非关系型数据库之间都有…

猫坚果NutCat
5年前
487
1
评论

Flume 在有赞大数据的实践

Flume 是一个分布式的高可靠，可扩展的数据采集服务。 Flume 在有赞的大数据业务中一直扮演着一个稳定可靠的日志数据“搬运工” 的角色。本文主要讲一下有赞大数据部门在 Flume 的应用实践，同时也穿插着我们对 Flume 的一些理解。认识 Flume 对事件投递的可靠…

有赞技术
7年前
2.9k
14
1