首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大数据技术
庄小焱
创建于2025-01-21
订阅专栏
对海量、多样化数据进行采集、存储、管理、分析和应用的一系列技术手段。它能够从大量复杂的数据中提取有价值的信息,帮助企业或组织更好地理解市场趋势、用户行为等,从而做出更科学的决策。
等 5 人订阅
共17篇文章
创建于2025-01-21
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
大数据治理域——数据应用设计
本文主要探讨了阿里巴巴数据应用的实践与发展,包括生意参谋在电商领域的应用以及阿里巴巴内部数据产品平台的建设。生意参谋通过数据驱动帮助商家优化运营,如周黑鸭利用其预测销量减少商品过期问题,烟花烫通
大数据治理域——数据质量管理
本文系统阐述了数据质量在数据治理中的重要性。随着企业数字化转型,数据成为核心资产,数据质量直接影响业务决策、运营和合规。数据质量问题常见于准确性、一致性、完整性、及时性、唯一性和可解释性方面。
大数据治理域——数据存储与成本管理
本文主要探讨了数据存储与成本管理的多种策略。介绍了数据压缩技术,如MaxCompute的archive压缩方法,通过RAID file形式存储数据,可有效节省空间,但恢复时间较长,适用于冷备与日
大数据治理域——元数据管理
本文主要介绍了元数据管理在数据治理领域的重要性。元数据分为技术元数据、业务元数据、操作元数据和管理元数据,其价值体现在数据资产管理、提升数据可理解性、支撑数据血缘分析、辅助数据质量治理、实现数据
数据治理域——事实表设计
摘要 本文详细介绍了数据治理域中的事实表设计。首先阐述了事实表的基本概念,包括其定义、粒度、关键特征、结构组成以及分类。接着通过订单事实表结构的例子,生动展示了事实表的实际应用。事实表是存储业务过程或
数据治理域——维度表设计
本文主要介绍了数据治理域中维度表设计的相关内容。首先阐述了维度在数据仓库建模中的重要性,它是事实 - 维度模型的核心组成部分,用于支持业务数据的多维分析。接着详细讲解了确定维度属性的步骤,
数据治理域——数据建模设计
数据建模设计是数据治理体系中的关键组成,承载着数据标准化、资产化与高质量使用的核心目标。本文从治理视角出发,深入探讨数据建模在保障企业数据一致性、复用性和共享性方面的重要作用。
数据治理域——数据同步设计
本文主要介绍了数据同步的多种方式,包括直连同步、数据文件同步和数据库日志解析同步。每种方式都有其适用场景、技术特点、优缺点以及适用的数据类型和实时性要求。
数据治理域——日志数据采集设计
本文主要介绍了Web页面端日志采集的设计。首先阐述了页面浏览日志采集,包括客户端日志采集的实现方式、采集内容及技术亮点。最后探讨了日志采集的挑战与解决方案,以及日志采集前置到用户终端的相关问题。
数据治理域——数据治理体系建设
本文主要介绍了数据治理系统的建设。数据治理对企业至关重要,其动因包括应对数据爆炸增长、提升内部管理效率、支撑复杂业务需求、加强风险防控与合规管理以及实现数字化转型战略。其核心目的是提升数据质量、
Elasticsearch——Elasticsearch技术实践
介绍了ES在腾讯的应用实践。ES 是实时的分布式搜索分析引擎,广泛应用于搜索服务、日志分析和时序分析等领域。腾讯在公有云、专有云和内部云上均部署了 ES,满足不同客户的需求。并提出优化设计方案。
Elasticsearch——Elasticsearch性能优化实战
介绍了 Elasticsearch 性能优化的实战方法,从硬件配置优化、索引优化设置、查询方面优化、数据结构优化以及集群架构设计等五个方面进行了详细阐述,旨在帮助读者提升 ES的性能表现。
Elasticsearch——Elasticsearch聚合实战
介绍了Elasticsearch中的聚合查询功能。聚合查询包含桶聚合、指标聚合和管道聚合三种方式。并介绍了责任链模式、FilterChain、Average bucket聚合等。
Elasticsearch——Elasticsearch查询实战
主要介绍了Elasticsearch查询实战,包括模糊匹配的编辑距离概念以及具体的查询示例。还涉及了DSL查询中的复合查询、Match类型查询、Term查询等多种查询方式,并提供了相关的官方文档。
Elasticsearch——Elasticsearch实现原理解析
本文深入解析了Elasticsearch的实现原理,首先介绍了其整体结构,包括集群模式下的节点、分片和副本,以及底层的Lucene索引文件。
Elasticsearch——Elasticsearch索引与索引模版实战
本文主要介绍了 Elasticsearch 中索引与索引模板的实战操作。首先讲解了索引管理,包括禁止自动创建索引、索引的格式、创建索引示例、修改索引示例、打开/关闭索引示例、删除索引、查看索引等。
Elasticsearch——Elasticsearch基本原理
介绍了 Elasticsearch(ES)的基本原理,包括其特点、基础概念、Elastic Stack 组件、容器下载与部署以及查询和聚合查询的相关内容。通过具体示例展示了如何使用 ES实战操作。