稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
  • 全部
  • 后端
  • 前端
  • AI编程
  • Claude
  • GitHub
  • 开源
  • 架构
  • 数据库
  • Git
  • 展开
  • 全部
  • 后端
  • 前端
  • AI编程
  • Claude
  • GitHub
  • 开源
  • 架构
  • 数据库
  • Git
  • API
  • 低代码
  • 人工智能
  • Linux
  • Trae
  • 大数据
  • 暂无数据
    • 推荐
    • 最新
  • Apache Hudi权威指南——维护与优化 Hudi 表
    就像我们会定期打理房子以保持最佳状态一样,维护 Apache Hudi 表对一个运转良好的数据湖仓至关重要。正如房子需要定期整理、清理与重置,才能保持通透易找,表也必须周期性地审视与组织,才能保持高效
    • 数据智能老司机
    • 108
    • 点赞
    大数据 数据分析 架构
    Apache Hudi权威指南——维护与优化 Hudi 表
  • Apache Hudi权威指南——通过index提高效率
    湖仓系统必须能够在分布式存储之上、面对复杂且常常不可预测的变更模式时,仍然同时保持写入效率与查询性能,去管理 PB 级数据集。这类系统运行规模巨大,需要同时支持分析型与事务型混合负载。为满足这些要求,
    • 数据智能老司机
    • 194
    • 点赞
    大数据 数据分析 架构
    Apache Hudi权威指南——通过index提高效率
  • 构建 Medallion 架构——数据架构的演进
    构建稳健的数据架构是数据管理中最具挑战性的环节之一。 从数据采集、转换、分发到最终消费,整条处理流程会因多种因素而显著不同:包括治理方式、所用工具、组织的风险画像、规模与成熟度、用例需求,以及性能、灵
    • 数据智能老司机
    • 87
    • 1
    大数据 数据分析 架构
    构建 Medallion 架构——数据架构的演进
  • 构建 Medallion 架构——深入解读Medallion架构
    在第 1 章中,我们回顾了 Spark 与 Delta Lake 的演进,并引介了 Medallion 架构。这一设计模式帮助在现代湖仓(lakehouse)中以逻辑方式组织数据:通过 Bronze
    • 数据智能老司机
    • 54
    • 2
    大数据 架构 数据分析
    构建 Medallion 架构——深入解读Medallion架构
  • Hive 中的“分布键”之思:从数据组织到查询优化的系统解析
    Hive 是如何组织和优化数据分布的? 本文将系统梳理 Hive 在数据物理组织和查询优化层面上,与分布键相似的机制,并结合一个基金申赎分析系统的实战案例,说明如何逐步优化 Hive 查询性能。
    • Alamo_WU
    • 39
    • 1
    大数据
  • 构建 Medallion 架构——构建 Bronze 层
    在你已经搭建好数据平台基础之后——无论是 Microsoft Fabric 还是 Azure Databricks——就可以开始构建 Bronze 层了。Bronze 层是所有原始数据(raw dat
    • 数据智能老司机
    • 42
    • 1
    大数据 数据分析 架构
    构建 Medallion 架构——构建 Bronze 层
  • 在 Databricks 上的 Unity Catalog 数据治理——Unity Catalog 的内部机制
    2021 年,当 Nexa Boutique(下称 Nexa)的数据架构师在为公司评估数据治理战略时,Databricks 发布了 Unity Catalog。这是一套原生于 Databricks 平
    • 数据智能老司机
    • 102
    • 点赞
    大数据 架构
    在 Databricks 上的 Unity Catalog 数据治理——Unity Catalog 的内部机制
  • Snowflake Cortex AI:面向生成式 AI 应用的解决方案——理解 Snowflake Cortex
    引言(Introduction) 人工智能(AI)与机器学习(ML)的迅猛发展为企业利用数据驱动洞察创造了新机遇。但把 AI 融入既有企业工作流常常面临重大挑战:基础设施复杂度高、数据安全顾虑多、且需
    • 数据智能老司机
    • 99
    • 点赞
    数据分析 大数据 架构
    Snowflake Cortex AI:面向生成式 AI 应用的解决方案——理解 Snowflake Cortex
  • 在 Databricks 上的 Unity Catalog 数据治理——身份识别与管理
    在面向客户的岗位上,一个好处是能出差、去不同的城市。如果你和 Karthik 一样,喜欢旅行、住舒适的酒店,那么想象一下:去一座新城市开会,住进一家设施现代的酒店。从订房到退房,中间都有哪些步骤? 第
    • 数据智能老司机
    • 83
    • 点赞
    大数据 架构
    在 Databricks 上的 Unity Catalog 数据治理——身份识别与管理
  • 构建 Medallion 架构——构建 Silver 层
    在第 5 章中,我们基于 Oceanic Airlines 的参考架构,探讨了 Medallion 架构中 Bronze 层的基础设计与搭建。我们审视了部署与配置,并通过大量代码片段与示例加深理解。你
    • 数据智能老司机
    • 40
    • 点赞
    大数据 数据分析 架构
    构建 Medallion 架构——构建 Silver 层
  • 数据工程设计模式——冷热数据存储
    引言 在过去十年里,个人、企业与机构产生的数据量激增,这给“超大规模数据”的管理带来了挑战。产生海量数据的企业需要为正在生成的数据寻找合适的管理方案,还要识别数据的访问模式,区分“高频访问数据”和“低
    • 数据智能老司机
    • 107
    • 点赞
    大数据 架构 设计模式
    数据工程设计模式——冷热数据存储
  • Snowflake Cortex AI:面向生成式 AI 应用的解决方案——机器学习函数概览
    引言(Introduction) 在深入探讨 Cortex 的生成式 AI(Generative AI)能力之前,先了解其原生机器学习(ML)函数是有价值的,这将为理解平台的高级分析能力打下坚实基础。
    • 数据智能老司机
    • 58
    • 1
    数据分析 大数据 架构
    Snowflake Cortex AI:面向生成式 AI 应用的解决方案——机器学习函数概览
  • 智能问数 Agent 如何确保 SQL 生成 100% 准确?
    在企业推进数据民主化的进程中,智能问数被寄予厚望——业务人员只需用自然语言提问,Agent 便能自动返回准确、可解释的数据洞察。
    • Aloudata大应科技
    • 183
    • 1
    数据可视化 数据分析 大数据
  • TiDB 底层存储结构 LSM 树原理介绍
    随着数据量的增大,传统关系型数据库越来越不能满足对于海量数据存储的需求。对于分布式关系型数据库,我们了解其底层存储结构是非常重要的。
    • 京东云开发者
    • 16k
    • 27
    数据库 大数据 TiDB
    TiDB 底层存储结构 LSM 树原理介绍
  • Snowflake Cortex AI:面向生成式 AI 应用的解决方案——Snowflake 生态中的 AI/ML 入门
    引言(Introduction) 本章将介绍 Snowflake 生态中的人工智能(AI)与机器学习(ML)。内容涵盖核心 AI 概念、AI 与生成式 AI(Generative AI)的影响与工作原
    • 数据智能老司机
    • 44
    • 点赞
    大数据 数据分析 架构
    Snowflake Cortex AI:面向生成式 AI 应用的解决方案——Snowflake 生态中的 AI/ML 入门
  • 数据工程设计模式——实时摄取与处理
    引言(Introduction) 本章将深入解析实时(real-time)模式,并让读者熟悉如何用该模式构建解决方案。内容涵盖实时模式可解决的用例;同时讨论如何使用开源技术设计实时系统,并通过示例应用
    • 数据智能老司机
    • 53
    • 1
    大数据 架构 设计模式
    数据工程设计模式——实时摄取与处理
  • 产品动态 | Kafka Linking 迁移工具上线、Table Topic发布、Azure开服
    01 社区影响力 AutoMQ GitHub Star 正式突破 7,000!🌟 为什么越来越多的企业和开发者选择 AutoMQ? **100% Kafka API 兼容:**平滑迁移,无供应商锁定,
    • AutoMQ
    • 135
    • 1
    云原生 大数据 云计算
    产品动态 | Kafka Linking 迁移工具上线、Table Topic发布、Azure开服
  • API 与 SDK 之间的区别
    很多人在软件开发中经常会分不清 SDK 与 API ,今天就来浅谈一下两者之间的区别。 直白地说,SDK 包含了 API ,是一套完整的,能完成更多功能的工具包,无论你想获取什么样的信息,
    • eoLinker
    • 17k
    • 63
    大数据
  • SeaTunnel & SeaTunnel Web部署
    SeaTunnel & SeaTunnel Web部署 我这边已经配置成功就没有那些不成功的截图了,可以参考一下几点逐步确认: 1. 确认下`$SEATUNNEL_HOME/lib`目录下有没有`d
    • lshua
    • 6.7k
    • 1
    大数据 Apache
  • 数据工程设计模式——数据基础
    引言(Introduction) 本章将帮助读者理解数据工程师用来表示与组织数据的各类数据类型与机制。我们将以电商应用为例,进一步讲解数据基础。同时,读者还将接触数据建模(data modeling)
    • 数据智能老司机
    • 56
    • 点赞
    大数据 设计模式 架构
    数据工程设计模式——数据基础
  • 上午好!
    点亮在社区的每一天

    推荐话题 换一换

    #挑战每日一条沸点#
    #挑战每日一条沸点#

    21.1m

    #TRAE SOLO#
    #TRAE SOLO#

    4.6k

    #金石焕新程#

    6.6m

    #每日快讯#

    9.4m

    #MCP 怎么玩#

    851k

    #每天一个知识点#

    43.9m

    #工作中做得最正确的一件事#
    #工作中做得最正确的一件事#

    382k

    #新人报道#

    36.6m

    #掘金一周#

    1.1m

    #金石计划征文活动#
    #金石计划征文活动#

    37.2m

    查看更多
    • 用户协议
    • 营业执照
    • 隐私政策
    • 关于我们
    • 使用指南
    • 友情链接
    • 更多开发工具文章
    • 举报邮箱: feedback@xitu.io
    • 座机电话: 010-83434395
    • 京ICP备:18012699号-3
    • 京ICP证:京B2-20191272
    • police 京公网安备11010802026719号
    • ©2025 稀土掘金