PySpark的SQL类型

422 阅读4分钟

PySpark SQL Types

PySpark SQL类型简介

PySpark SQL TYPES是PySpark模型中的一个类,用于定义PySpark数据模型中使用的所有数据类型。数据框架在创建时有一个定义好的数据类型,它在创建时照顾到了所需的数据类型。
在PySpark中定义了一个包pyspark.sql.types.DataType,它照顾到了所有需要定义和使用的数据类型模型。在这个包中定义了各种数据类型,如String Type, Numeric Type, Byte Type,它们可以用来定义PySpark的数据模型。

在这篇文章中,我们将尝试分析使用PYSPARK SQL TYPE操作的各种方法。让我们试着更详细地了解一下PYSPARK的SQL类型。

PySpark SQL类型的语法。

PySpark SQL TYPES函数的语法是。

from pyspark.sql.types import ArrayType from pyspark.sql.types import IntegerType from pyspark.sql.types import StringType from pyspark.sql.types import MapType

这些是在PySpark SQL Types中使用的SQL的导入类型。

屏幕截图。

PySpark SQL Types 1

在PySpark中的SQL类型的工作

让我们看看SQL TYPES是如何在PySpark中工作的。

  • PySpark中的SQL类型定义了需要存储在PySpark数据模型中的值的类型。每个数据类型都是由一些大小范围来定义的,这些范围定义了可以存储的元素大小。
  • import函数pyspark.sql.types提供了需要导入的数据类型,并定义了关于这个的数据类型。一些数据类型是二进制数据类型,数字数据类型。
  • 一旦定义了数据的类型,就会使数据的分析变得更容易,某些与数据类型相关的操作可以很容易地完成。
  • 每当一个变量被创建或每当列被创建时,这个列和变量都需要一个数据类型,这是由PySpark SQL类型完成的。我们也可以根据我们的要求转换这些数据类型,使数据模型能够正常运行。

让我们通过一些编码例子来检查PySpark SQL类型的创建和工作。

实例

让我们看看一些PySpark SQL类型操作的例子。有些类型是数据类型的子类。

阵列类型。

这个SQL类型可以通过从包中导入ArrayType来实现。

from pyspark.sql.types import ArrayType

也有一些方法定义ArrayType中元素的类型。

at = ArrayType(IntegerType(),False) print(at.jsonValue()) print(at.simpleString()) print(at.typeName())

这个ArrayType有一些方法是为SQL类型定义的。

屏幕截图。

PySpark SQL Types 2

StringType() This data type is used to represent StringValues. s = StringType() s

这定义的类型是字符串类型。所有字符串类型的方法都定义在这个SQL类型上。

屏幕截图。

PySpark SQL Types 3

地图类型。

它表示数据框架中的键值对。一个键和值对被设置为定义MAP类型。

from pyspark.sql.types import MapType m = MapType(StringType(), IntegerType()) print(m.keyType) print(m.valueType)

屏幕截图。

Maptype

日期类型

这是用来表示PySpark的数据框架中的数据。一旦转换为DateType,所有的数据类型方法都可以完成。

from pyspark.sql.types import DateType d = DateType() d

屏幕截图。

Data Type

时间戳

这代表了时间戳类型的数据框架。

Timestamp type()被用来获取SQL类型的时间戳。

它的格式是:-yyyy-mm-dd HH:mm: ss. ssss

from pyspark.sql.types import TimestampType t = TimestampType() t

屏幕截图。

PySpark SQL Types 4

有一些方法可以在PySpark中创建一个SQL类型的数据框架。

这些是PySpark中的一些PySpark SQL TYPES的例子。

注意。

1.PySpark SQL TYPES是PySpark数据模型中需要的数据类型。

2.2.PySpark SQL TYPES有一个包可以导入所有需要的数据类型。

3.3.PySpark SQL TYPES对需要的数据类型有一个限制范围。

4.4.PySpark SQL TYPES是用来创建具有特定类型的数据框架。

5.5.PySpark SQL TYPES有一个基类数据类型,它包含了所有基类的SQL类型元素。

总结

从上面的文章中,我们看到了SQL TYPES在PySpark中的工作。从各种例子和分类中,我们试图了解这些SQL TYPES是如何在PySpark中使用的,以及它是如何在编程层面使用的。所用的各种方法显示了它是如何简化数据分析的模式和一个具有成本效益的模型。
我们还看到了PySpark数据框架的内部工作和SQL TYPES的优势,以及它在各种编程目的中的使用。另外,语法和例子帮助我们准确地理解了这个功能。

推荐文章

这是一个关于PySpark SQL类型的指南。在这里,我们讨论了PySpark实例中SQL类型的介绍、语法、工作原理以及代码实现。你也可以看看下面的文章来了解更多------。

  1. PySpark左键连接
  2. PySpark count distinct
  3. PySpark Logistic Regression
  4. 滞后的PySpark

The postPySpark SQL Typesappeared first onEDUCBA.