首页
AI Coding
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
王知无
掘友等级
ლ(′◉❥◉`ლ)
|
Alibaba.com
大数据
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
121
文章 120
沸点 1
赞
121
返回
|
搜索文章
赞
文章( 120 )
沸点( 1 )
Apache-Flink深度解析-DataStream-Connectors之Kafka
Apache Kafka是一个分布式发布-订阅消息传递系统。 它最初由LinkedIn公司开发,LinkedIn于2010年贡献给了Apache基金会并成为顶级开源项目。Kafka用于构建实时数据管道和流式应用程序。它具有水平扩展性、容错性、极快的速度,目前也得到了广泛的应用。…
Apache-Flink深度解析-State
本系列文章来自云栖社区,对Flink的解析兼具广度和深度,适合对Flink有一定研究的同学学习。 实际问题 在流计算场景中,数据会源源不断的流入Apache Flink系统,每条数据进入Apache Flink系统都会触发计算。如果我们想进行一个Count聚合计算,那么每次触发…
Blink开源,Spark3.0,谁才是未来大数据领域最闪亮的星?
2018和2019年是大数据领域蓬勃发展的两年,自2019年伊始,实时流计算技术开始步入普通开发者视线,各大公司都在不遗余力地试用新的流计算框架,实时流计算引擎Spark Streaming、Kafka Streaming、Beam和Flink持续火爆。 最近Spark社区,来…
[大数据之Spark]——快速入门
为了良好的阅读下面的文档,最好是结合实际的练习。首先需要下载spark,然后安装hdfs,可以下载任意版本的hdfs。 Spark Shell提供给用户一个简单的学习API的方式 以及 快速分析数据的工具。在shell中,既可以使用scala(运行在java虚拟机,因此可以使用…
Flink从入门到精通系列文章
戳更多文章:1-Flink入门2-本地环境搭建&构建第一个Flink应用3-DataSetAPI4-DataSteamAPI5-集群部署6-分布式缓存7-重启策略8-Flink中的窗口9-Flink中
Apache-Flink深度解析-概述
Apache Flink 的命脉 "命脉" 即生命与血脉,常喻极为重要的事物。系列的首篇,首篇的首段不聊Apache Flink的历史,不聊Apache Flink的架构,不聊Apache Flink的功能特性,我们用一句话聊聊什么是 Apache Flink 的命脉?我的答案…
15-Flink实战项目之实时热销排行
某个图书网站,希望看到双十一秒杀期间实时的热销排行榜单。我们可以将“实时热门商品”翻译成程序员更好理解的需求:每隔5秒钟输出最近一小时内点击量最多的前 N 个商品/图书. 可见,我们每过1秒向Kafka的topn这个topic随机发送一本书的名字用来模拟购买行为。
Flink-Kafka-Connector Flink结合Kafka实战
关于kafka,我们会有专题文章介绍,这里简单介绍几个必须知道的概念。 顾名思义,生产者就是生产消息的组件,它的主要工作就是源源不断地生产出消息,然后发送给消息队列。生产者可以向消息队列发送各种类型的消息,如狭义的字符串消息,也可以发送二进制消息。生产者是消息队列的数据源,只有…
Flink从入门到放弃-入门篇
Flink从入门到放弃-入门篇
8-Flink中的窗口
如果size<interval,那么这种窗口将会丢失数据。比如每5秒钟,统计过去3秒的通过路口汽车的数据,将会漏掉2秒钟的数据。 假如我们需要统计每一分钟中用户购买的商品的总数,需要将用户的行为事件按每一分钟进行切分,这种切分被成为翻滚时间窗口(Tumbling Time Wi…
下一页
个人成就
优秀创作者
文章被点赞
697
文章被阅读
270,249
掘力值
6,141
关注了
0
关注者
536
收藏集
2
关注标签
9
加入于
2019-02-10