Doris和StarRocks vs. Trino

174 阅读3分钟

本文将分享Doris和StarRocks与Trino的对比,分为以下3个部分:

  1. Doris、StarRocks和Trino概览

  2. Doris vs. Trino

  3. StarRocks vs. Trino

Doris、StarRocks和Trino概览

Doris

Apache Doris最初是百度广告报表业务的Palo项目。2017年正式对外开源,2018年7月由百度捐赠给Apache基金会进行孵化。2022年6月成功从Apache孵化器毕业,正式成为Apache顶级项目。

Apache Doris是一款基于MPP架构的高性能、实时分析型数据库。支持高并发的点查以及高吞吐的复杂分析场景。适合用于报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等场景。用户可以基于Doris构建大屏看板、用户行为分析、AB实验平台、日志检索分析、用户画像分析、订单分析等场景。

图片

  • StarRocks

StarRocks是一款高性能分析型数据仓库,使用向量化执行引擎、MPP架构、CBO、智能物化视图、可实时更新的列式存储引擎等技术实现多维、实时、高并发的数据分析。StarRocks支持从各类实时和离线的数据源高效导入数据,也支持直接分析数据湖上各种格式的数据。StarRocks兼容MySQL协议,支持标准SQL语法,兼容多种主流BI产品,包括Tableau、QuickBI等。同时StarRocks具备水平扩展,高可用、高可靠、易运维等特性。且支持存算一体和存算分离多种部署架构模式。广泛应用于OLAP多维分析、报表生成、实时数据分析和Ad-hoc等场景。

比如在实时数仓场景,StarRocks设计和实现了主键表,能够实时更新数据并极速查询,可以秒级同步Transaction Processing数据库的变化,构建实时数仓,业务场景包括:广告投放分析、物流行业的运单分析等。

比如在OLAP多维分析场景,利用StarRocks的MPP框架和向量化执行引擎,支持雪花模型,星型模型,宽表模型或者预聚合模型的构建。适用于灵活配置的多维分析报表,业务场景包括:用户行为分析、自助式报表平台等。

图片

Trino

Trino是一个开源的分布式SQL查询引擎,前身是PrestoSQL,最初由Meta(Facebook的技术部门)开发。2020年,原Presto核心团队成立PrestoSQL项目,后更名为Trino,继续推动技术发展。旨在高效查询分布在多个异构数据源中的大型数据集。支持多种connector,包括MySQL, Oracle, MongoDB, PG, SQL Server, Hive, Kafka, ES, Iceberg, Hudi, ClickHouse, BigQuery等。

图片

Doris vs. Trino

Apache Doris和Trino/Presto均为主流数据湖仓查询引擎,但Doris在性能上表现更具优势。Trino/Presto主要专注于查询加速,而Doris不仅能够加速查询,还具备作为独立数据仓库的能力。企业可以利用Doris实现数据仓库和湖仓查询引擎的统一,从而简化其数据架构。

截屏2025-12-26 下午1.17.39.png

StarRocks vs. Trino

截屏2025-12-26 下午1.17.21.png