首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
saberbin
掘友等级
获得徽章 6
动态
文章
专栏
沸点
收藏集
关注
作品
赞
4
文章 4
沸点 0
赞
4
返回
|
搜索文章
saberbin
1年前
关注
浅析大数据计算框架的SQL底层原理
常见的一些大数据计算框架,例如Hive、spark SQL、flink SQL都是将SQL转换为对应框架的计算结构执行作业的,此文汇总一下各个框架的底层对于SQL的转换的架...
0
评论
分享
saberbin
1年前
关注
spark工程化项目-Java
spark_demo spark工程,依据Java项目常见三层架构模式,分为: controller:控制层 service:服务层 dao:持久层 application...
0
评论
分享
saberbin
1年前
关注
Spark checkpoint保存与读取
所谓的检查点(checkpoint)其实就是通过将 RDD 中间结果写入磁盘由于血缘依赖过长会造成容错成本过高,这样就不如在中间阶段做检查点容错,如果检查点之后有节点出现问...
0
评论
分享
saberbin
1年前
关注
python中的引用、浅拷贝与深拷贝
0. 前言 虽然python中有“引用”这一术语,实际上这是不准确的,python中不存在对左/右值的绑定操作,故不存在左值引用和右值引用。(详细的内容参考对比 C++ 和...
0
评论
分享
saberbin
1年前
关注
python安装与环境配置
1. 编译型语言与解释型语言 首先要知道,python是解释型语言,而不是编译型语言(编译型语言最典型的就是C语言了)。 这两者有什么区别呢? 1. 编译型语言 编译型语言...
0
评论
分享
saberbin
1年前
关注
pygame+numpy实现康威生命游戏
康威生命游戏(Conway's Game of Life)是一种零玩家游戏,属于元胞自动机的一种。它由数学家约翰·康威(John Horton Conway)在1970年发...
1
评论
分享
saberbin
1年前
关注
SparkStreaming[java]案例-用户广告点击
概述 本案例是基于用户广告点击数据的统计,一共有3个小的需求。 实现黑名单统计、地区城市广告点击量的统计以及最近一小时的广告点击量统计等需求...
0
评论
分享
saberbin
1年前
关注
SparkStreaming[java api]简易教程以及JavaDemo
Spark Streaming 用于流式数据的处理。 Spark Streaming 支持的数据输入源很多,例如: Kafka、Flume、 Twitter、 ZeroMQ...
0
评论
分享
saberbin
1年前
关注
SparkSQL[java]读取不带表头的txt文件
spark SQL读取不带表头的txt文件时,批量创建dataframe的表信息,可以通过此方法批量创建带表信息的dataframe以及创建dataset对象。...
1
评论
分享
saberbin
1年前
关注
sparkSQL[java api]spark Java版本相关的api
spark sql概述 Spark SQL 是 Spark 用于结构化数据(structured data)处理的 Spark 模块。...
0
评论
分享
saberbin
1年前
关注
Flink实时去重——外部数据库实现
flink常见的实时去重方案: 状态后端、HyperLogLog 、布隆过滤器(BloomFilter)、BitMap 基于、外部数据库(redis以及MySQL等)。re...
0
评论
分享
saberbin
1年前
关注
Flink实时去重——BitMap实现
flink常见的实时去重方案:、状态后端、HyperLogLog 、布隆过滤器(BloomFilter)、BitMap 、外部数据库(mysql、redis等),本文是基于...
0
评论
分享
saberbin
1年前
关注
Flink实时去重——布隆过滤器(BloomFilter)实现
flink常见的实时去重方案: 状态后端、HyperLogLog 、布隆过滤器(BloomFilter)、BitMap、外部数据库(redis、mysql)等。本篇是布隆过...
0
评论
分享
saberbin
1年前
关注
Flink实时去重——状态后端实现
flink常见的实时去重方案:状态后端、HyperLogLog 、布隆过滤器(BloomFilter)、BitMap 、外部数据库(readis、mysql等)...
0
评论
分享
saberbin
关注了
华仔聊技术
saberbin
1年前
关注
flink多数据类型从Kafka同步到动态HDFS目录
上文中只是处理了JSON数据,参考:https://juejin.cn/post/7321315460926767144 实际使用场景常见的数据除了json之外还有csv等...
0
评论
分享
saberbin
1年前
关注
flink消费Kafka写入hdfs动态目录
从其他工具同步MySQL的数据到Kafka中,通过flink消费Kafka的数据写入hdfs目录。hdfs目录需要根据具体数据动态生成,需要重写BucketAssigner...
0
评论
分享
saberbin
1年前
关注
Spoon02-同步csv到HDFS
利用spoon将本地的csv文件上传到HDFS中。 准备工作 确保本地账户有权限访问HDFS的目录:本地账户为Windows,Hadoop在wsl上,这里wsl上新建一个与...
0
评论
分享
saberbin
1年前
关注
Spoon01-同步csv到数据库
ETL工具Spoon同步本地数据到数据库教程。 准备工作 MySQL数据库 这里以MySQL数据库为例。这里创建测试表 Spoon spoon界面: 我找的这个版本是8.2...
0
评论
分享
下一页
个人成就
文章被点赞
59
文章被阅读
32,698
掘力值
996
关注了
13
关注者
71
收藏集
4
关注标签
16
加入于
2019-09-28