Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。
Presto支持在线数据查询,包括Hive、Cassandra、关系数据库以及专有数据存储,一条Presto查询可以将多个数据源的数据进行合并,可以跨越整个组织进行分析。
安装部署
pull presto docker
docker pull prestosql/presto
Run the Presto server
docker run -p 8080:8080 --name presto prestosql/presto
启动成功后可以看到如下信息
INFO main io.prestosql.server.PrestoServer ======== SERVER STARTED ========
Run the Presto CLI
docker exec -it presto presto
常用交互式命令
show catalogs;
show schemas from tpch; // tpch 是具体catlog名字
use tpch.sf1; // tpch为catalog名字,sf1为schema名字
show tabls;
show tables from tpch.sf1;
show create table tpch.sf1.customer;
select * from tpch.sf1.customer limit 5 \G;
Presto配置
登录presto docker
docker exec -it d84cb72dfa76 bash
默认配置路径
/data/presto/etc
主要配置文件
config.properties
jvm.config
log.properties
node.properties
Web Interface
Presto提供了一个Web Interface用于监控和管理Query。Web Interface内置在Coordinator中,通过HTTP端口访问,配置详见Config Properties。默认用户名为root,密码不需要填写即可登录
