如何用开源bi,打造自己的轻量级bi系统

2,155 阅读7分钟

对于程序员来说,开源的东西都是好的,别的不说,因为可以自己自己随意开发,毕竟每个人都喜欢自己写的代码嘛,也或者,就是不想花钱哈哈哈哈(扎心了)

就拿最近很火的BI来说吧,BI分两种:开源BI和商用BI,说起开源BI就是有爱又恨,这一切都要从微软带起了商业风说起....

我在网上搜到了一下2018年BI的市场占有率:


说到软件,可能第一反应就是国外的好,于是就先尝试了国外的开源BI。第一个接触的开源BI是pentaho,实在是太臃肿了,花了半年时间没有搞定,bug又多,修改不了。第二个是superset,可视化很强大,不过需要安装Linux,对于非技术人员很不友好,毕竟现在的BI都主打自助式。第三个开源BI就是JasperReports了,这是程序员最受欢迎、最常用的开源报表工具,常和ireport一起搭配使用,不过它有两个致命的缺点:需要学习编程,不支持多源数据源,这无疑是把自己未来的路给封死了....使用了这么多之后,我们决定试试国内的开源BI。

国内的开源BI很多都是假开源,阉割很多核心功能,或者是商业用就要收费。而BI产品又很贵,在商业bi用的比较多的就是tableau,sever价格10万,10个账号,增加一个账号需要1万。由于最近要给公司实施BI,和工程师聊过,如果自己开发一套BI的话,工作量非常大,开发不出来的可能性很大,风险大。于是怎么办呢?只能硬着头皮上Tableau,贵就贵吧,毕竟是全球第一,贵的东西总买不了上当吧。用了一段时间发现,这什么玩意?售后服务太差了,虽然各种图表酷炫至极,还带有语音控制,但是我不需要这些,我只是想要在出bug的时候能有帮助文档或者客服人员帮助我解决,而不是我们的研发像个无头苍蝇一样。

在信息部同事的不断调研之后,我们决定使用国内的BI产品FineBI,在IDC认证的市场占有率上,它是第一。刚刚开始也是抱着试试看的心态,没想到用几天以后发现功能着实贴合企业场景,业务人员可以自己拖拽分析,再也不用排队等IT开发了。今天就给大家讲讲我的使用心得,如何用FineBI打造自己的BI系统。

搭建企业BI系统的第一步是什么?当然是下载BI工具!登录帆软官网,点击免费下载,提醒一下,永久免费版的~企业版才需要收费


打开后就是这样了,页面简洁,突出重点,适合我们这种上了年纪的人,太酷炫会花眼。

那它是怎么实现企业的数据分析的呢,别急,听我慢慢说,先来说说它的数据处理引擎,spider大数据引擎,正是因为有了它,finebi跑1亿数据量的100分组表,时间在0.75s左右,够快吗?Excel相比之下简直弱爆了!

我用FineBI之前,做数据可视化一直都是用的数据透视表,这里就两个比较重要的方面来比一比吧。

1.Excel是平面公式计算,而FineBI是自助式即时探索拖拽分析

我们使用excel做数据计算的时候,往往需要用户进行大量复杂繁琐的的平面单元格公式计算,操作界面是这样的:


而使用FineBI进行数据探索分析时,我们只需要通过鼠标得点击和字段拖拽操作即可完成对数据的整个探索分析过程。FineBI基于著名的图形语法设计,以“形状“和对应的“颜色“,“大小“,“提示“,“标签“等属性进行图表类型替代,这样一来FineBI也就摆脱图表类型对可视化效果的限制,从而达到无限制图表类型的展现能力,让用户轻松实现对数据的即时洞察和见解。


2.FineBI的OLAP多维分析是数据分析大杀器

除了丰富的可视化展示效果之外,FineBI还支持前端的一些丰富多维分析操作,例如钻取、过滤、跳转、数据预警、数据联动等。

首先像钻取,大家都比较熟悉。比如某个企业要统计全国各个省市BI的销量,那么看了之后发现,广东的销量比较多,上海北京的也很多。那在看上海地区销量分布的时候,就可以钻取点进去,一看浦东的最多,看广东城市的销量,钻去点进去,发现深圳和广州的都比较多。


最后,就到了大家最关心的点,FineBI的数据分析实操!

1、FineBI能从很多种数据源导入数据:如两大主流开源平台(Hadoop,Spark),Excel,CSV,XML,以及各类数据库(SQL Server,Oracle,MySQL等),这点倒是挺方便的,无论我从哪里收集到的数据,都可以一起分析了。


2、那如何导入数据呢?仅需2步,数据准备—添加业务包,业务包是用来统一整理数据表的。就得到如下的数据明细。这里可以自动识别数据的字段类型,也可以修改字段类型。


至此,数据就导入成功,接下来开始正式分析。

3、再来说说它的自助式分析吧,我相信这是很多人都关心的一个点,如何能让业务人员自己去探索和分析数据,这样会节省与IT的沟通,也会节省一部分人力成本,双赢。


为了完美支持业务员的分析工作,FineBI作为自助式开源BI工具,不同与传统BI,降低了代码操作,摒弃了手动建模,将重点放在了业务员可理解的前端。

业务员可只需要从数据包中读取数据,在前端像手机一样直接拖拽字段做分析,不需再要问数据在哪?数据好了没?数据不对等这些问题。

各种现成的计算公式,基本告别SQL和代码。


4.精美、酷炫、实用的数据可视化,为什么要加实用两个字呢?现在有很多的数据分析软件,华而不实,只知道提升图表的酷炫效果,而FineBI却是真正地从可视化中发现企业的问题,就拿我曾经做的一个项目来说吧,领导看了

第一眼就觉得,图表的配色确实让人满意,也能让集团高层从大屏上面直接发现问题。



下面这些图是笔者20分钟不到就做好的,稍加美化,绝对可以达到客户对于颜值的要求。


要知道同样的工作使用R语言的ggplot2至少要2小时(含调试),使用Python的matplotlib就更久了,而用FineBI,我15分钟就可以做出来。

总结

开源BI其实真的有很多,那怎么挑选最好的?我上面提到的是一部分,还有一个点:看这款BI能否适合自己的企业发展,无论这款BI被描述地有多酷炫,有多好,在企业的工作场景下用起来才是最好的开源BI。