浅谈Pentaho

378 阅读2分钟

pentaho是目前处理数据中台的一个绝佳解决方案。目前被Hitachi收购整合,大中华地区的销售目前是日立解决方案(中国)。

目前pentaho包括一下几个功能,数据生产者,Pentaho+数据管理平台,数据消费者。

数据生产者:OnPrem,Edge,SaaS,云等,

Pentaho+数据管理平台:原始资料,Pentaho Data Integration ,Pentaho Data Catalog, Pentaho Edge Data Lakehouse, Pentaho Co-Pilot,Pentaho MDM,主要是基于API的消费终端点,访问控制 等功能

数据消费者:SaaS,Private or Public Cloud等,

包括Pentaho Visualizer,Pentaho Digital Advisor等,并且可以连接处理GPT,QuickSight,PowerBI,Tableau等。

Pentaho可以把结构化数据和非结构化数据进行数据整合数据挖掘和数据分析可视化等,利用Hadoop,mongoDB,TERADATA,splink等,最后生成Customized Business Insights and Big Data Use Cases等。

目前pentaho企业版更加适合大规模数据企业,包括银行,12306等类似的大型数据处理解决方案。

Pentaho Data Integration & Pentaho Visualizer

Pentaho Data Integration:无代码拖拽构建数据管道

此工具具有以下优点:

1.200+ 数据转换步骤 

2.广泛数据源对接:  SQL: Oracle, DB2, MySQL

 NoSQL: cassandra,mongodb

Hadoop:Hive,HDFS,Impala

文件:XLS/CSV/TXT/FTP 

AWS/Azure/Google Cloud 

对象存储:REST/Web service

安全性:LDAP/AD/Kerberos… 并且具有• 高可用 • 线性扩展 • 容器化支持等特点

Pentaho Visualizer:数据建模、分析、可视化工具

60+ 可视化组件

拖拽式构建多维分析模型:  星型,雪花,多事实表 

OLAP操作:下钻/上卷、切片/过滤、穿透、组件之间自动交互

并且还具备3D地图 • 跨数据库连接 • 定时自动数据刷新等功能。

好了,今天的分享就此结束,感谢大家的观看。