首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Apache Griffin
zhyy
创建于2021-06-22
订阅专栏
本专栏意在介绍ebay开源的Apache Griffin数据质量监控框架,从概述到实战一应俱全,借此能够入门griffin
等 6 人订阅
共7篇文章
创建于2021-06-22
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Apache Griffin+Flink+Kafka数据质量监控实践
一. 组件及版本 本文用的组件包括以下几个,是参考了官方案例,版本可以参考github以及里面的pom文件。本文假定以下环境均已安装好。 JDK (1.8) MySQL(version 5.6) Ha
Apache Griffin调试过程bug记录
1、数据库报错 Table 'quartz.DATACONNECTOR' doesn't exist 这个问题要具体看具体分析,不过大概率是因为要插入的字段太长,超出数据库限制长度造成JPA创建表失败
五. Apache Griffin UI界面化操作
1. Apache Griffin 用户界面操作 Apache Griffin 是一种开源数据质量解决方案,适用于流式或批处理数据上下文中任何规模的分布式数据系统。 而且他还提供了基于Angular的
四.Apache Griffin基于Hive batch批数据的质量监控实战
数据集 此案例适用于基于hive,HDFS等批数据作为数据源进行数据质量监控。 假设我们有一个数据集(demo_src),按小时划分,我们想知道每个小时的数据是什么样的。 为简单起见,假设两个数据集都
三. Apache Griffin基于Spark Streaming流数据质量监控实战
数据集 假设我们在不同的 kafka 主题(源、目标)中有两个流数据集,我们需要根据源数据集知道目标数据集的数据质量如何。 为简单起见,假设两个主题的数据都是 json 字符串,如下所示 环境准备 为
二. Apache Griffin快速入门
Apache Griffin 入门指南 数据质量模块是大数据平台中必不可少的一个功能组件,Apache Griffin(以下简称Griffin)是一个开源的大数据数据质量解决方案,它支持批处理和流模式
一. Apache Griffin概述
Apache Griffin概述 Apache Griffin 是一个建立在 Apache Hadoop 和 Apache Spark 之上的数据质量服务平台 (DQSP)。 它提供了一个全面的框架来