首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
庄小焱
掘友等级
软件工程师
|
宇宙第一大厂
我是庄小焱,某大厂Java高级工程师、PMP项目管理专家、系统架构设计师(高级)、CSDN博文专家。博主在支付交易领域,信贷金融领域、机器学习模型算法领域深耕,我在博客中分享业务、技术、产品相关知识。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
132
文章 132
沸点 0
赞
132
返回
|
搜索文章
最新
热门
【离线数仓项目】——离线大数据系统设计
本文详细介绍了离线大数据系统的设计背景、实时系统与离线系统的对比、离线大数据系统的作用以及技术设计等内容。离线大数据系统适用于数据量大、计算复杂且对实时性要求不高的场景,可满足企业数据分析等
大数据治理域——计算管理
本文主要探讨了大数据治理域中的计算管理问题,特别是系统优化和任务优化两个方面。文章首先指出MaxCompute集群任务众多,资源消耗巨大,因此需要优化计算资源以提高性能和任务产出时间。文章介绍了
大数据治理域——数据挖掘
本文主要介绍了阿里巴巴在大数据治理域中的数据挖掘设计。随着数据量的爆炸式增长,阿里巴巴从使用传统的商业挖掘软件,发展到构建自己的机器学习算法平台,以应对海量数据的挖掘需求。文章概述了数据挖掘的重
大数据治理域——数据服务
本文详细介绍了阿里数据服务架构的演进历程,从DWSOA到OneService的四个阶段,每个阶段都有其独特特点及面临的问题。同时,文章还探讨了技术架构、数据服务最佳实践等多方面内容,包括性能优化
大数据治理域——实时数据开发
本文深入探讨了大数据治理域中的实时数据开发,重点介绍了流式数据处理的核心价值、特点、技术挑战、典型能力和应用场景。同时,详细阐述了流式技术架构,包括数据采集、处理、存储和服务等环节,并针对大促场
大数据治理域——数据应用设计
本文主要探讨了阿里巴巴数据应用的实践与发展,包括生意参谋在电商领域的应用以及阿里巴巴内部数据产品平台的建设。生意参谋通过数据驱动帮助商家优化运营,如周黑鸭利用其预测销量减少商品过期问题,烟花烫通
大数据治理域——数据质量管理
本文系统阐述了数据质量在数据治理中的重要性。随着企业数字化转型,数据成为核心资产,数据质量直接影响业务决策、运营和合规。数据质量问题常见于准确性、一致性、完整性、及时性、唯一性和可解释性方面。
大数据治理域——数据存储与成本管理
本文主要探讨了数据存储与成本管理的多种策略。介绍了数据压缩技术,如MaxCompute的archive压缩方法,通过RAID file形式存储数据,可有效节省空间,但恢复时间较长,适用于冷备与日
大数据治理域——元数据管理
本文主要介绍了元数据管理在数据治理领域的重要性。元数据分为技术元数据、业务元数据、操作元数据和管理元数据,其价值体现在数据资产管理、提升数据可理解性、支撑数据血缘分析、辅助数据质量治理、实现数据
大数据治理域——事实表设计
摘要 本文详细介绍了数据治理域中的事实表设计。首先阐述了事实表的基本概念,包括其定义、粒度、关键特征、结构组成以及分类。接着通过订单事实表结构的例子,生动展示了事实表的实际应用。事实表是存储业务过程或
下一页
个人成就
文章被点赞
224
文章被阅读
41,964
掘力值
1,692
关注了
2
关注者
54
收藏集
1
关注标签
0
加入于
2022-04-19