B/S 架构的数据可视化分析平台开源方案不完全集锦,供各位参考。 排名不分先后。欢迎补充。
kibana
Elasticsearch 专用的数据分析检索仪表盘。ELK Stack 中的 K。
日志系统常见的可视化开源解决方案。
使用 Nodejs+AnglarJs+React 开发,元数据存储在 ES 的一个索引中。
Elastic公司维护开源,社区非常活跃,持续迭代中。
grafana
可视化仪表盘和图形编辑器,是一款常用的指标分析和监控工具。支持Graphite、Elasticsearch、OpenTSDB、Prometheus 和 InfluxDB 作为数据源。使用 Golang+TypeScript+AngularJS 开发,元数据支持 mysql 和 postgres。
Grafana Labs 公司维护,社区非常活跃,持续迭代中。
Superset
孵化中的准企业级 BI 应用。很多大公司都在内部使用。
支持的数据源有 MySQL、Postgres、Vertica、Oracle、Microsoft SQL Server、SQLite、Greenplum、Firebird、MariaDB、Sybase、IBM DB2、Exasol、MonetDB、Snowflake、Redshift、Clickhouse、Apache Kylin 等!
使用 Python+Flask+react+jQuery开发,默认使用 sqlite 存储元数据。 由Airbnb开源,现已归属于 Apache 孵化项目,社区非常活跃,持续迭代中。
Zeppelin
支持交互式数据分析的多用途 notebook 编辑器工具,可以接入不同的数据处理引擎和解释器,包括 Apache Spark,Python,JDBC,Markdown和Shell 等。内置Apache Spark集成。Java+Angular 开发,元数据 notebook 默认使用本地文件系统存储在git仓库中。 由 Apache 开源,持续迭代中,目前版本 0.8。
Hue
开发和访问SQL、数据应用的工作台,支持智能的SQL和任务编辑器、Dashboard 、任务工作流调度、数据浏览器。 Hadoop生态系统可视化利器。
SQL支持: Hive、Impala、MySQL、Oracle、KSQL / Kafka SQL、Solr SQL、Presto、PostgreSQL、Redshift、BigQuery、AWS Athena、Spark SQL、Phoenix、Kylin等。
任务支持:MapReduce、Java、Pig、Sqoop、Shell、DistCp、Spark等。
使用Python+Django+jquery 开发,元数据默认使用 SQLite存储。
Hue 由 Cloudera Desktop 演化而来,最后 Cloudera 公司将其贡献给Apache基金会的Hadoop社区。
CBoard
国产BI 报表和dashboard平台。支持JDBC数据源,Saiku2.x数据源,Kylin1.6,Elasticsearch 1.x, 2.x, 5.x。
使用 Java Spring+MyBatis+AngularJS+Bootstrap 开发。元数据使用MySQL5+/SQLServer。
上海楚国公司开源,最近发现官方出了收费的企业版,这个社区版显得low了很多。
Mining
Python写的BI应用(Pandas web 界面)
OpenMining 支持基于 ORM SQLAlchemy 的所有数据库。
使用 Python+Lua+AngularJs+jQuery开发,元数据存储在MongoDB。
由Avelino 和 UP! Essência开发,master分支的最新 commit 已经是2016年了
Saiku
经典的OLAP开源方案,Saiku是一个模块化分析套件,提供轻量级OLAP,易于嵌入,可扩展和可配置。 支持 Mondrian, XMLA 或者 Mongo数据源链接类型。其提供一个Schema设计器、交互式的报表引擎、展示板和nosql连接技术。使用REST API连接OLAP系统。
使用Java+backbone+jQuery开发,使用JackRabbit管理树状元数据。
最初叫做Pentaho分析工具,起初是基于OLAP4J库用GWT(google web toolkit)包装的一个前端分析工具。后改名Saiku,Analytical Labs 提供支持。
Metabase
简单快速的方式使用BI和分析。支持Postgres、MySQL、Druid、SQL Server、Redshift、MongoDB、Google BigQuery、SQLite、H2、Oracle、Vertica、Presto、Snowflake。支持不写SQL 的方式做可视化分析。支持docker、jar包方式安装。使用clojure和node开发,前端使用react框架。元数据默认存储在H2数据库中。
社区较为活跃,项目也在持续更新中。
redash
SQL editor+可视化,支持35种数据源:Amazon Athena、Amazon DynamoDB、Amazon Redshift、Axibase Time Series Database、Cassandra、ClickHouse、CockroachDB、CSV、Databricks、DB2 by IBM、Druid、Elasticsearch、Google Analytics、Google BigQuery、Google Spreadsheets、Graphite、Greenplum、Hive、Impala、InfluxDB、JIRA、JSON、Apache Kylin、MapD、MemSQL、Microsoft SQL Server、MongoDB、MySQL、Oracle、PostgreSQL、Presto、Prometheus、Python、Qubole、Rockset、Salesforce、ScyllaDB、Shell Scripts、Snowflake、SQLite、TreasureData、Vertica、Yandex AppMetrrica、Yandex Metrica。
后端使用Python 前端使用Angular、React,元数据环境使用PostgreSQL & Redis。
该项目目前也比较活跃,持续迭代中。
SqlPad
不知放在这里是否合适,SqlPad一款基于web 的 SQL 编辑器,支持MySQL, Postgres, SQL Server, Vertica, Crate, Presto, SAP HANA, 和 Cassandra,支持数据可视化。但不支持仪表板等功能。使用Nodejs+React开发,元数据存储在 Nedb中。
由Rick Bergfalk开发,持续维护中。
结语
这些是我收集或调研过的一些数据可视化开源方案,它们或许在成熟稳定的企业级方案面前显得支离杂乱,也或许在牛人遍地的大厂内部显得不够专业。但它们开发者给提供了优秀的参考案例和二次开发的母版,给小企业带来了几乎免费的数据分析和可视化的能力。由衷的感谢这些令人兴奋的项目,感谢为开源奉献的人们。
由于本人没有全部体验和深入调研上述项目,上述简介仅供参考,以官方为准。