首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
后端
前端
AI编程
Claude
GitHub
开源
架构
数据库
Git
展开
全部
后端
前端
AI编程
Claude
GitHub
开源
架构
数据库
Git
API
低代码
Trae
人工智能
Linux
大数据
暂无数据
推荐
最新
Apache Hudi权威指南——维护与优化 Hudi 表
就像我们会定期打理房子以保持最佳状态一样,维护 Apache Hudi 表对一个运转良好的数据湖仓至关重要。正如房子需要定期整理、清理与重置,才能保持通透易找,表也必须周期性地审视与组织,才能保持高效
Apache Hudi权威指南——通过index提高效率
湖仓系统必须能够在分布式存储之上、面对复杂且常常不可预测的变更模式时,仍然同时保持写入效率与查询性能,去管理 PB 级数据集。这类系统运行规模巨大,需要同时支持分析型与事务型混合负载。为满足这些要求,
构建 Medallion 架构——数据架构的演进
构建稳健的数据架构是数据管理中最具挑战性的环节之一。 从数据采集、转换、分发到最终消费,整条处理流程会因多种因素而显著不同:包括治理方式、所用工具、组织的风险画像、规模与成熟度、用例需求,以及性能、灵
构建 Medallion 架构——深入解读Medallion架构
在第 1 章中,我们回顾了 Spark 与 Delta Lake 的演进,并引介了 Medallion 架构。这一设计模式帮助在现代湖仓(lakehouse)中以逻辑方式组织数据:通过 Bronze
Hive 中的“分布键”之思:从数据组织到查询优化的系统解析
Hive 是如何组织和优化数据分布的? 本文将系统梳理 Hive 在数据物理组织和查询优化层面上,与分布键相似的机制,并结合一个基金申赎分析系统的实战案例,说明如何逐步优化 Hive 查询性能。
构建 Medallion 架构——构建 Bronze 层
在你已经搭建好数据平台基础之后——无论是 Microsoft Fabric 还是 Azure Databricks——就可以开始构建 Bronze 层了。Bronze 层是所有原始数据(raw dat
在 Databricks 上的 Unity Catalog 数据治理——Unity Catalog 的内部机制
2021 年,当 Nexa Boutique(下称 Nexa)的数据架构师在为公司评估数据治理战略时,Databricks 发布了 Unity Catalog。这是一套原生于 Databricks 平
Snowflake Cortex AI:面向生成式 AI 应用的解决方案——理解 Snowflake Cortex
引言(Introduction) 人工智能(AI)与机器学习(ML)的迅猛发展为企业利用数据驱动洞察创造了新机遇。但把 AI 融入既有企业工作流常常面临重大挑战:基础设施复杂度高、数据安全顾虑多、且需
在 Databricks 上的 Unity Catalog 数据治理——身份识别与管理
在面向客户的岗位上,一个好处是能出差、去不同的城市。如果你和 Karthik 一样,喜欢旅行、住舒适的酒店,那么想象一下:去一座新城市开会,住进一家设施现代的酒店。从订房到退房,中间都有哪些步骤? 第
构建 Medallion 架构——构建 Silver 层
在第 5 章中,我们基于 Oceanic Airlines 的参考架构,探讨了 Medallion 架构中 Bronze 层的基础设计与搭建。我们审视了部署与配置,并通过大量代码片段与示例加深理解。你
数据工程设计模式——冷热数据存储
引言 在过去十年里,个人、企业与机构产生的数据量激增,这给“超大规模数据”的管理带来了挑战。产生海量数据的企业需要为正在生成的数据寻找合适的管理方案,还要识别数据的访问模式,区分“高频访问数据”和“低
Snowflake Cortex AI:面向生成式 AI 应用的解决方案——机器学习函数概览
引言(Introduction) 在深入探讨 Cortex 的生成式 AI(Generative AI)能力之前,先了解其原生机器学习(ML)函数是有价值的,这将为理解平台的高级分析能力打下坚实基础。
智能问数 Agent 如何确保 SQL 生成 100% 准确?
在企业推进数据民主化的进程中,智能问数被寄予厚望——业务人员只需用自然语言提问,Agent 便能自动返回准确、可解释的数据洞察。
TiDB 底层存储结构 LSM 树原理介绍
随着数据量的增大,传统关系型数据库越来越不能满足对于海量数据存储的需求。对于分布式关系型数据库,我们了解其底层存储结构是非常重要的。
Snowflake Cortex AI:面向生成式 AI 应用的解决方案——Snowflake 生态中的 AI/ML 入门
引言(Introduction) 本章将介绍 Snowflake 生态中的人工智能(AI)与机器学习(ML)。内容涵盖核心 AI 概念、AI 与生成式 AI(Generative AI)的影响与工作原
数据工程设计模式——实时摄取与处理
引言(Introduction) 本章将深入解析实时(real-time)模式,并让读者熟悉如何用该模式构建解决方案。内容涵盖实时模式可解决的用例;同时讨论如何使用开源技术设计实时系统,并通过示例应用
产品动态 | Kafka Linking 迁移工具上线、Table Topic发布、Azure开服
01 社区影响力 AutoMQ GitHub Star 正式突破 7,000!🌟 为什么越来越多的企业和开发者选择 AutoMQ? **100% Kafka API 兼容:**平滑迁移,无供应商锁定,
API 与 SDK 之间的区别
很多人在软件开发中经常会分不清 SDK 与 API ,今天就来浅谈一下两者之间的区别。 直白地说,SDK 包含了 API ,是一套完整的,能完成更多功能的工具包,无论你想获取什么样的信息,
SeaTunnel & SeaTunnel Web部署
SeaTunnel & SeaTunnel Web部署 我这边已经配置成功就没有那些不成功的截图了,可以参考一下几点逐步确认: 1. 确认下`$SEATUNNEL_HOME/lib`目录下有没有`d
数据工程设计模式——数据基础
引言(Introduction) 本章将帮助读者理解数据工程师用来表示与组织数据的各类数据类型与机制。我们将以电商应用为例,进一步讲解数据基础。同时,读者还将接触数据建模(data modeling)