数据可视化分析平台开源方案集锦

19,099 阅读4分钟

B/S 架构的数据可视化分析平台开源方案不完全集锦,供各位参考。 排名不分先后。欢迎补充。

kibana

Elasticsearch 专用的数据分析检索仪表盘。ELK Stack 中的 K。

日志系统常见的可视化开源解决方案。

使用 Nodejs+AnglarJs+React 开发,元数据存储在 ES 的一个索引中。

Elastic公司维护开源,社区非常活跃,持续迭代中。

grafana

可视化仪表盘和图形编辑器,是一款常用的指标分析和监控工具。支持Graphite、Elasticsearch、OpenTSDB、Prometheus 和 InfluxDB 作为数据源。

使用 Golang+TypeScript+AngularJS 开发,元数据支持 mysql 和 postgres。

Grafana Labs 公司维护,社区非常活跃,持续迭代中。

Superset

孵化中的准企业级 BI 应用。

很多大公司都在内部使用。

支持的数据源有 MySQL、Postgres、Vertica、Oracle、Microsoft SQL Server、SQLite、Greenplum、Firebird、MariaDB、Sybase、IBM DB2、Exasol、MonetDB、Snowflake、Redshift、Clickhouse、Apache Kylin 等!

使用 Python+Flask+react+jQuery开发,默认使用 sqlite 存储元数据。 由Airbnb开源,现已归属于 Apache 孵化项目,社区非常活跃,持续迭代中。

Zeppelin

支持交互式数据分析的多用途 notebook 编辑器工具,可以接入不同的数据处理引擎和解释器,包括 Apache Spark,Python,JDBC,Markdown和Shell 等。内置Apache Spark集成。

Java+Angular 开发,元数据 notebook 默认使用本地文件系统存储在git仓库中。 由 Apache 开源,持续迭代中,目前版本 0.8。

Hue

开发和访问SQL、数据应用的工作台,支持智能的SQL和任务编辑器、Dashboard 、任务工作流调度、数据浏览器。 Hadoop生态系统可视化利器。

SQL支持: Hive、Impala、MySQL、Oracle、KSQL / Kafka SQL、Solr SQL、Presto、PostgreSQL、Redshift、BigQuery、AWS Athena、Spark SQL、Phoenix、Kylin等。

任务支持:MapReduce、Java、Pig、Sqoop、Shell、DistCp、Spark等。

使用Python+Django+jquery 开发,元数据默认使用 SQLite存储。

Hue 由 Cloudera Desktop 演化而来,最后 Cloudera 公司将其贡献给Apache基金会的Hadoop社区。

CBoard

国产BI 报表和dashboard平台。

支持JDBC数据源,Saiku2.x数据源,Kylin1.6,Elasticsearch 1.x, 2.x, 5.x。

使用 Java Spring+MyBatis+AngularJS+Bootstrap 开发。元数据使用MySQL5+/SQLServer。

上海楚国公司开源,最近发现官方出了收费的企业版,这个社区版显得low了很多。

Mining

Python写的BI应用(Pandas web 界面)

OpenMining 支持基于 ORM SQLAlchemy 的所有数据库。

使用 Python+Lua+AngularJs+jQuery开发,元数据存储在MongoDB。

由Avelino 和 UP! Essência开发,master分支的最新 commit 已经是2016年了

Saiku

经典的OLAP开源方案,Saiku是一个模块化分析套件,提供轻量级OLAP,易于嵌入,可扩展和可配置。 支持 Mondrian, XMLA 或者 Mongo数据源链接类型。

其提供一个Schema设计器、交互式的报表引擎、展示板和nosql连接技术。使用REST API连接OLAP系统。

使用Java+backbone+jQuery开发,使用JackRabbit管理树状元数据。

最初叫做Pentaho分析工具,起初是基于OLAP4J库用GWT(google web toolkit)包装的一个前端分析工具。后改名Saiku,Analytical Labs 提供支持。

Metabase

简单快速的方式使用BI和分析。支持Postgres、MySQL、Druid、SQL Server、Redshift、MongoDB、Google BigQuery、SQLite、H2、Oracle、Vertica、Presto、Snowflake。支持不写SQL 的方式做可视化分析。支持docker、jar包方式安装。

使用clojure和node开发,前端使用react框架。元数据默认存储在H2数据库中。

社区较为活跃,项目也在持续更新中。

redash

SQL editor+可视化,支持35种数据源:Amazon Athena、Amazon DynamoDB、Amazon Redshift、Axibase Time Series Database、Cassandra、ClickHouse、CockroachDB、CSV、Databricks、DB2 by IBM、Druid、Elasticsearch、Google Analytics、Google BigQuery、Google Spreadsheets、Graphite、Greenplum、Hive、Impala、InfluxDB、JIRA、JSON、Apache Kylin、MapD、MemSQL、Microsoft SQL Server、MongoDB、MySQL、Oracle、PostgreSQL、Presto、Prometheus、Python、Qubole、Rockset、Salesforce、ScyllaDB、Shell Scripts、Snowflake、SQLite、TreasureData、Vertica、Yandex AppMetrrica、Yandex Metrica。

后端使用Python 前端使用Angular、React,元数据环境使用PostgreSQL & Redis。

该项目目前也比较活跃,持续迭代中。

SqlPad

不知放在这里是否合适,SqlPad一款基于web 的 SQL 编辑器,支持MySQL, Postgres, SQL Server, Vertica, Crate, Presto, SAP HANA, 和 Cassandra,支持数据可视化。但不支持仪表板等功能。

使用Nodejs+React开发,元数据存储在 Nedb中。

由Rick Bergfalk开发,持续维护中。

结语

这些是我收集或调研过的一些数据可视化开源方案,它们或许在成熟稳定的企业级方案面前显得支离杂乱,也或许在牛人遍地的大厂内部显得不够专业。但它们开发者给提供了优秀的参考案例和二次开发的母版,给小企业带来了几乎免费的数据分析和可视化的能力。由衷的感谢这些令人兴奋的项目,感谢为开源奉献的人们。

由于本人没有全部体验和深入调研上述项目,上述简介仅供参考,以官方为准。