数据学习从0到1 Apache Hive数据格式开启掘金成长之旅！这是我参与「掘金日新计划 · 12 月更文挑战」的第2

开启掘金成长之旅！这是我参与「掘金日新计划 · 12 月更文挑战」的第24天 juejin.cn/post/716729…

数据类型

Hive 支持关系型数据中大多数基本数据类型

和其他的SQL语言一样，这些都是保留字。需要注意的是所有的这些数据类型都是对Java中接口的实现，因此这些类型的具体行为细节和Java中对应的类型是完全一致的。例如，string类型实现的是Java中的String，float实现的是Java中的float，等等。

Hive会为每个创建的数据库在HDFS上创建一个目录，该数据库的表会以子目录形式存储，表中的数据会以表目录下的文件形式存储。对于default数据库，默认的缺省数据库没有自己的目录，default数据库下的表默认存放在/user/hive/warehouse目录下。

当数据存储在文本文件中，必须按照一定格式区别行和列，并且在Hive中指明这些区分符。Hive默认使用了几个平时很少出现的字符，这些字符一般不会作为内容出现在记录中。

Hive默认的行和列分隔符如下表所示。