首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
数仓
订阅
美音java大数据
更多收藏集
微信扫码分享
微信
新浪微博
QQ
12篇文章 · 0订阅
火山引擎DataLeap联合DataFun发布《数据治理知识地图》
近期,火山引擎DataLeap和技术社区DataFun联合发布《数据治理知识地图专业版V1》(以下简称“地图”),地图将数据治理的领域、流程、技术、工具等内容进行系统化整理和分类,为从业者提供全面的学
火山引擎 DataLeap:揭秘字节跳动业务背后的分布式数据治理思路
经过十多年的发展, 数据治理在传统行业以及新兴互联网公司都已经产生落地实践。字节跳动也在探索一种分布式的数据治理方式。
SparkSQL 在企业级数仓建设的优势
Spark 引擎因为自身强大的生态和方便的编程接口被广泛应用在数据处理场景下,Spark 提供的 Spark SQL 模块更是为使用 Spark 支撑企业数据仓库提供了一个良好的基础设施。
火山引擎 DataLeap 的 Data Catalog 系统公有云实践
本篇内容源自于火山引擎大数据研发治理套件 DataLeap 中的 Data Catalog 功能模块的实践,主要介绍 Data Catalog 在公有云部署和发布中遇到挑战及解决方案。
火山引擎流批数据质量解决方案和最佳实践
本文将介绍火山引擎数据质量平台是如何弥合大数据场景下数据质量校验与计算消耗资源大、校验计算时间长的冲突,并介绍数据质量平台是如何用一套架构框架来满足流批方面的数据质量监控。
治理效率提升77%!揭秘基于DataLeap实时健康分的最佳实践
背景 某企业实时数仓团队通过数据收集、整合、计算和存储构建实时数据仓库,为企业提供快速、准确、可靠的实时数据分析和决策支持。目前该实时数仓团队已运行了上万的实时任务,依赖的组件繁多(例如:Flink、
AB 实验为何值得信赖?
如今流量增长乏力,如何进行科学增长营销?如何降低试错成本?如何设计进行AB实验?AB实验为何值得信赖?
阿里巴巴电商搜索推荐实时数仓演进之路
1. 业务背景 阿里巴巴电商搜索推荐实时数据仓库承载了阿里巴巴集团淘宝、淘宝特价版、饿了么等多个电商业务的实时数仓场景,提供了包括实时大屏、实时报表、实时算法训练、实时A/B实验看板等多种数据应用支持。 我们认为数据处于阿里巴巴搜索推荐的大脑位置,这体现在算法迭代、产品运营和老…
实时数仓|基于Flink1.11的SQL构建实时数仓探索实践
实时数仓主要是为了解决传统数仓数据时效性低的问题,实时数仓通常会用在实时的OLAP分析、实时的数据看板、业务指标实时监控等场景。虽然关于实时数仓的架构及技术选型与传统的离线数仓会存在差异,但是关于数仓建设的基本方法论是一致的。本文会分享基于Flink SQL从0到1搭建一个实时…
快手实时数仓保障体系研发实践
快手实时计算数据团队技术专家李天朔在 Flink Forward Asia 2021 实时数仓专场的演讲。