首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
数据
数据智能老司机
创建于2023-05-27
订阅专栏
数据相关
等 60 人订阅
共300篇文章
创建于2023-05-27
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
排序算法与技术——数学预备知识与理论极限
为什么有些排序算法天生比其他算法更快?这一现实背后的数学基础是什么?本章将揭示排序的深层理论基础,展示支配算法设计中可能与不可能的无形规则。通过探讨形式模型、基本下界以及随机性和稳定性的细微作用,读者
Elastic 中的向量搜索入门指南
欢迎阅读《Elastic 中的向量搜索入门》。本章将帮助你理解 Elastic 搜索的基本范式,以及向量搜索如何成为实时、上下文感知且精准的信息检索利器。 本章内容包括: 向量搜索引入前的 Elast
Elastic 向量搜索实战指南——向量与嵌入简介
在本章中,我们将深入探索嵌入(embeddings)或向量的奇妙世界,以及它们在多个领域中的广泛应用。我们将介绍“嵌入”这一概念,它能够对复杂数据进行有效表示,从而使强大的机器学习(ML)模型能够分析
数据工程设计模式——数据工程设计模式简介
设计模式在软件工程领域已经非常成熟,但在数据工程领域则是近年来才逐渐受到关注。因此,在这里我需要向你简单介绍一下设计模式,并解释它在数据工程中的含义。 什么是设计模式? 你可能会惊讶于自己日常生活中有
使用Python和PyTorch的生成式AI——NLP 2.0:使用变换器(Transformers)生成文本
上一章帮助我们建立了对NLP概念的基础理解,如文本表示和语言建模,以及基于RNN的架构来执行生成任务。在本章中,我们将建立在这些概念的基础上,并介绍一些增强功能,这些功能促成了当前最先进的变换器架构的
使用Python和PyTorch的生成式AI——文本生成方法的崛起
在过去的几年里,自然语言处理(NLP)或文本数据处理在研究圈和特别是在工业界引起了广泛的关注。文本不仅仅是另一种非结构化的数据类型;它所代表的内容远远超过眼见的。文本数据是我们思想、理念、知识和交流的
CockroachDB权威指南——SQL调优
CockroachDB旨在成为一个可扩展的、分布式的事务型数据库系统,能够满足高性能、高可用性和全球分布式应用的需求。然而,它并不是一个可以消除应用程序代码或架构设计中所有低效问题的“魔法盒”。开发人
CockroachDB权威指南——应用设计与实现
像所有数据库一样,CockroachDB 对来自应用程序代码的请求作出响应。应用程序如何请求和使用数据对应用程序性能和可扩展性有着巨大的影响。本章将回顾应用程序如何与 CockroachDB 一起工作
CockroachDB权威指南——CockroachDB 模式设计
一个合理的数据模型是构建高性能、易维护应用程序的基础。在本章中,我们将回顾关系型数据库模式设计的基本原理,特别关注那些影响分布式数据库操作的设计要素,以及 CockroachDB 的一些高级特性,例如
CockroachDB权威指南——CockroachDB SQL
虽然CockroachDB有一些命令行工具,但所有应用程序与数据库之间的交互都通过SQL语言命令来媒介。 SQL是一种功能丰富的语言,拥有悠久的历史——我们在第一章中提到了一部分历史。对所有SQL语言
CockroachDB权威指南——开始使用
CockroachDB拥有复杂且现代化的架构,旨在支持全球规模的应用。然而,这种复杂性和可扩展性并不意味着陡峭的学习曲线或高门槛。在本章中,我们将帮助你开始使用CockroachDB的安装,并向你介绍
CockroachDB权威指南——CockroachDB 架构
软件系统的架构定义了实现该系统目标的高层设计决策。正如您在第一章中回顾的那样,CockroachDB的目标是提供一个可扩展、高可用、高性能、强一致性、地理分布式、基于SQL的关系数据库系统,能够在各种
CockroachDB权威指南——CockroachDB入门
CockroachDB 是一个分布式、事务性、关系型、云原生的 SQL 数据库系统。听起来很复杂吧!但简而言之,CockroachDB 结合了上一代关系型数据库系统的优点——强一致性、SQL 的强大功
数据科学中的因果推断——引入因果关系
本章内容包括: 为什么以及何时我们需要因果推断 因果推断是如何工作的 观察数据和实验数据之间的区别 相关统计概念回顾 在许多企业和组织中,当我们使用机器学习时,我们的目标通常是对未来会发生什么做出有根
Snowflake数据工程——使用大语言模型输出增强数据
本章内容: 理解外部网络访问 配置外部网络访问 从 Snowpark 调用 API 端点 从 Yelp 等网站获取客户评论 推导客户评论的情感 使用大语言模型解释电子邮件内容以节省时间 Snowfla
Snowflake数据工程——持续数据摄取
本章内容包括: 比较批量数据摄取与持续数据摄取 介绍 Snowpipe 使用云消息配置 Snowpipe 使用和监控 Snowpipe 使用 Snowflake 动态表进行持续数据转换 在本章中,我们
Snowflake数据工程——数据转化
本章内容: 从云存储中摄取半结构化数据 将半结构化数据扁平化为关系型表 使用存储过程封装转换 在存储过程中实现异常处理和日志记录 构建健壮的数据管道 在本章中,我们将增强从云存储摄取数据的数据管道,这
使用 Databricks Lakehouse 构建现代数据应用程序——使用 Terraform 部署、维护和管理 DLT 管道
在本章中,我们将探讨如何使用像 Terraform 这样的自动化工具,在 Databricks 中将数据管道表示为代码,通常称为基础设施即代码(IaC)。我们将学习如何使用流行的代码编辑器(如 VS
使用 Databricks Lakehouse 构建现代数据应用程序——使用 Unity Catalog 查看数据血缘
在本章中,我们将深入探讨数据血缘在 Databricks 数据智能平台中的关键作用。您将学习如何追溯数据的来源,可视化数据集的转化过程,识别上游和下游的依赖关系,并使用目录资源管理器的血缘图功能来记录
下一页