这是我参与「第四届青训营」笔记创作活动的的第7天

Presto架构原理与优化介绍

大数据其实是在2000年后，因为信息化的快速发展。信息交换、信息存储、信息处理三个方面能力的大幅增长而产生的数据。 OLAP对业务数据执行多维分析，并提供复杂计算，趋势分析和复杂数据建模的能力。是许多商务智能应用程序背后的技术。 MapReduce代表了抽象的物理执行模型，使用门槛高。与Mapreduce Job相比，OLAP引擎常通过SQL的形式，为数据分析、数据开发人员提供统一的逻辑描述语言，实际的物理执行由具体的引擎进行转换和转化。

Presto设计思想

多租户任务的管理与调度多数据源联邦查询支持内存化计算 Pipeline式数据处理

Coordinator：解析SQL语句；生成执行计划；分发执行任务给Worker节点 Worder：执行Task处理数据；与其他Worker交互传输数据 Connector：一个Connector代表一种数据源。可以认为Connector是由Presto提供的适配多数据源的统一接口 Catalog：管理元信息与实际数据的映射关系。