数据

数据相关

等 70 人订阅共377篇文章创建于2023-05-27

Elastic 向量搜索实战指南——向量与嵌入简介

在本章中，我们将深入探索嵌入（embeddings）或向量的奇妙世界，以及它们在多个领域中的广泛应用。我们将介绍“嵌入”这一概念，它能够对复杂数据进行有效表示，从而使强大的机器学习（ML）模型能够分析

1年前
178
点赞
评论

Elastic 向量搜索实战指南——向量与嵌入简介

数据工程设计模式——数据工程设计模式简介

设计模式在软件工程领域已经非常成熟，但在数据工程领域则是近年来才逐渐受到关注。因此，在这里我需要向你简单介绍一下设计模式，并解释它在数据工程中的含义。什么是设计模式？你可能会惊讶于自己日常生活中有

1年前
110
点赞
评论

数据工程设计模式——数据工程设计模式简介

使用Python和PyTorch的生成式AI——NLP 2.0：使用变换器（Transformers）生成文本

上一章帮助我们建立了对NLP概念的基础理解，如文本表示和语言建模，以及基于RNN的架构来执行生成任务。在本章中，我们将建立在这些概念的基础上，并介绍一些增强功能，这些功能促成了当前最先进的变换器架构的

1年前
180
点赞
评论

使用Python和PyTorch的生成式AI——NLP 2.0：使用变换器（Transformers）生成文本

使用Python和PyTorch的生成式AI——文本生成方法的崛起

在过去的几年里，自然语言处理（NLP）或文本数据处理在研究圈和特别是在工业界引起了广泛的关注。文本不仅仅是另一种非结构化的数据类型；它所代表的内容远远超过眼见的。文本数据是我们思想、理念、知识和交流的

1年前
408
点赞
评论

使用Python和PyTorch的生成式AI——文本生成方法的崛起

CockroachDB权威指南——SQL调优

CockroachDB旨在成为一个可扩展的、分布式的事务型数据库系统，能够满足高性能、高可用性和全球分布式应用的需求。然而，它并不是一个可以消除应用程序代码或架构设计中所有低效问题的“魔法盒”。开发人

1年前
312
点赞
评论

CockroachDB权威指南——SQL调优

CockroachDB权威指南——应用设计与实现

像所有数据库一样，CockroachDB 对来自应用程序代码的请求作出响应。应用程序如何请求和使用数据对应用程序性能和可扩展性有着巨大的影响。本章将回顾应用程序如何与 CockroachDB 一起工作

1年前
383
点赞
评论

CockroachDB权威指南——应用设计与实现

CockroachDB权威指南——CockroachDB 模式设计

一个合理的数据模型是构建高性能、易维护应用程序的基础。在本章中，我们将回顾关系型数据库模式设计的基本原理，特别关注那些影响分布式数据库操作的设计要素，以及 CockroachDB 的一些高级特性，例如

1年前
530
点赞
评论

CockroachDB权威指南——CockroachDB 模式设计

CockroachDB权威指南——CockroachDB SQL

虽然CockroachDB有一些命令行工具，但所有应用程序与数据库之间的交互都通过SQL语言命令来媒介。 SQL是一种功能丰富的语言，拥有悠久的历史——我们在第一章中提到了一部分历史。对所有SQL语言

1年前
255
点赞
评论

CockroachDB权威指南——CockroachDB SQL

CockroachDB权威指南——开始使用

CockroachDB拥有复杂且现代化的架构，旨在支持全球规模的应用。然而，这种复杂性和可扩展性并不意味着陡峭的学习曲线或高门槛。在本章中，我们将帮助你开始使用CockroachDB的安装，并向你介绍

1年前
838
点赞
评论

CockroachDB权威指南——开始使用

CockroachDB权威指南——CockroachDB 架构

软件系统的架构定义了实现该系统目标的高层设计决策。正如您在第一章中回顾的那样，CockroachDB的目标是提供一个可扩展、高可用、高性能、强一致性、地理分布式、基于SQL的关系数据库系统，能够在各种

1年前
537
1
评论

CockroachDB权威指南——CockroachDB 架构

CockroachDB权威指南——CockroachDB入门

CockroachDB 是一个分布式、事务性、关系型、云原生的 SQL 数据库系统。听起来很复杂吧！但简而言之，CockroachDB 结合了上一代关系型数据库系统的优点——强一致性、SQL 的强大功

1年前
849
点赞
评论

CockroachDB权威指南——CockroachDB入门

数据科学中的因果推断——引入因果关系

本章内容包括：为什么以及何时我们需要因果推断因果推断是如何工作的观察数据和实验数据之间的区别相关统计概念回顾在许多企业和组织中，当我们使用机器学习时，我们的目标通常是对未来会发生什么做出有根

1年前
378
点赞
评论

Snowflake数据工程——使用大语言模型输出增强数据

本章内容：理解外部网络访问配置外部网络访问从 Snowpark 调用 API 端点从 Yelp 等网站获取客户评论推导客户评论的情感使用大语言模型解释电子邮件内容以节省时间 Snowfla

1年前
255
点赞
评论

Snowflake数据工程——持续数据摄取

本章内容包括：比较批量数据摄取与持续数据摄取介绍 Snowpipe 使用云消息配置 Snowpipe 使用和监控 Snowpipe 使用 Snowflake 动态表进行持续数据转换在本章中，我们

1年前
267
点赞
评论

Snowflake数据工程——数据转化

本章内容：从云存储中摄取半结构化数据将半结构化数据扁平化为关系型表使用存储过程封装转换在存储过程中实现异常处理和日志记录构建健壮的数据管道在本章中，我们将增强从云存储摄取数据的数据管道，这

1年前
295
点赞
评论

使用 Databricks Lakehouse 构建现代数据应用程序——使用 Terraform 部署、维护和管理 DLT 管道

在本章中，我们将探讨如何使用像 Terraform 这样的自动化工具，在 Databricks 中将数据管道表示为代码，通常称为基础设施即代码（IaC）。我们将学习如何使用流行的代码编辑器（如 VS

1年前
345
点赞
评论

使用 Databricks Lakehouse 构建现代数据应用程序——使用 Terraform 部署、维护和管理 DLT 管道

使用 Databricks Lakehouse 构建现代数据应用程序——使用 Unity Catalog 查看数据血缘

在本章中，我们将深入探讨数据血缘在 Databricks 数据智能平台中的关键作用。您将学习如何追溯数据的来源，可视化数据集的转化过程，识别上游和下游的依赖关系，并使用目录资源管理器的血缘图功能来记录

1年前
410
点赞
评论

使用 Databricks Lakehouse 构建现代数据应用程序——使用 Unity Catalog 查看数据血缘

使用 Databricks Lakehouse 构建现代数据应用程序——在Unity Catalog中管理数据位置

在本章中，我们将探讨如何使用Unity Catalog中的可安全管理对象有效管理数据存储位置——这些对象允许管理员向用户、组和服务主体授予细粒度的权限。我们将讨论六种类型的可安全管理对象，用于在Uni

1年前
408
点赞
评论

使用 Databricks Lakehouse 构建现代数据应用程序——在Unity Catalog中管理数据位置

使用 Databricks Lakehouse 构建现代数据应用程序——在湖仓中掌握数据治理与Unity Catalog

在本章中，我们将深入探讨如何使用Unity Catalog实现湖仓中的有效数据治理。我们将介绍如何在现有的Databricks工作区启用Unity Catalog，实现数据目录管理以便进行数据发现，如

1年前
385
点赞
评论

使用 Databricks Lakehouse 构建现代数据应用程序——在湖仓中掌握数据治理与Unity Catalog