如何查看parquet文件的schema信息

1,077 阅读1分钟

如何查看parquet文件的schema信息

IDEA 插件

下载一个Avro and Parquet Viewer插件

  1. plugins.jetbrains.com/plugin/1228…
  2. 找到自己IDEA对应版本的压缩包下载下来,Windows的IDEA版本可以在Help的About里看,mac的IDEA版本在窗口左上角的IntelliJ IDEA中的About IntelliJ IDEA

image.png 这里我的版本是2021.3.1

image.png 对应的插件版本是3.1.0,点击download下载 3. IDEA: Perferences(settings) -> Plugins -> Install Plugins from Disk -> Restart 4. IDEA的下方工具栏会多出一个Avro/Parquet Viewer选项,可以把Parquet文件直接拖到这里查看schema

Parquet-tools

parquet-tools schema XXXX.parquet

spark-shell

spark.read.format("parquet).load("test.parquet").schema