首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
数据分析
订阅
用户84040587371
更多收藏集
微信扫码分享
微信
新浪微博
QQ
8篇文章 · 0订阅
“数据治理那点事”系列之一:那些年我们一起踩过的坑
大数据时代,数据成为社会和组织的宝贵资产,像工业时代的石油和电力一样驱动万物,然而如果石油的杂质太多,电流的电压不稳,数据的价值岂不是大打折扣,甚至根本不可用不敢用,因此,数据治理是大数据时代我们用好海量数据的必然选择。 但大家都知道,数据治理是一项长期而繁杂的工作,可以说是大…
融合趋势下基于 Flink Kylin Hudi 湖仓一体的大数据生态体系
本文由 T3 出行大数据平台负责人杨华和资深大数据平台开发工程师王祥虎介绍 Flink、Kylin 和 Hudi 湖仓一体的大数据生态体系以及在 T3 的相关应用场景
什么是麒麟(kylin)?查数据贼快的哟
今天想跟大家一起入门一下kylin(麒麟)。 由于工作需要,前段时间对kylin简单入了个门,现在来写写笔记(我的文字或许能帮助到你入门kylin,至少看完这篇应该能知道kylin是干什么的)。 从官方我们可以看到对kylin的介绍:Apache Kylin™是一个开源的、分布…
「数据治理那点事」系列之三:不忘初心方得始终,数据质量管理要稳住!
本文是数据治理系列文章的第三篇,主要讲数据治理中的重要工作:数据质量管理。 我将从数据质量管理的目标,质量问题产生的根源,讲到如何评估数据质量,如何贯彻数据质量管理流程,最后从取与舍两个角度谈谈我对质量问题的一些个人观点。 数据质量管理主要解决「数据质量现状如何,谁来改进,如何…
「数据治理那点事」系列之二:手握数据「户口本」,数据治理肯定稳!
如果我说:元数据(Meta Data),就是描述数据的数据。没有技术背景加持的路人粉看到这句「绕口令」,内心可能会浮现这样的想法: 简单点,其实元数据相当于数据的户口本。 户口本是什么?它除了包含个人姓名、年龄、性别、身份证号码等各种基本描述信息外,还有这个人和家人的血缘关系,…
「数据治理那点事」系列之四 | 书同文车同轨:数据治理之数据标准管理
根据全国信息技术标准化技术委员会大数据标准工作组制定的大数据标准体系,大数据的标准体系框架共由七个类别的标准组成,分别为:**基础标准、数据标准、技术标准、平台和工具标准、管理标准、安全和隐私标准、行业应用标准。**本文主要阐述其中的第二个类别:数据标准。 数据标准这个词,最早…
数据服务基础能力之元数据管理
定义上说,元数据(Metadata)即描述数据的数据,但是在实际使用的时候,还是存在很多细分的概念,从本质上看元数据,介于系统和业务中间,提供双方都能明白的语义和逻辑,可以更加高效的支撑数据的业务价值