四大开源商业智能平台大比拼

上帝不响。如歌单车。
Tune Your Ride. Tone Your Glutes. Today. Together.
Bicycling: Boost Brainpower, Better Butt.
打印 被阅读次数

本文从对方面对四大开源商业智能平台进行了比较……

首先看一下它们各自的网站

  openI

  

  openI的 站点就是属于典型的开源站点,简洁,不像是一个商业公司的站点。但有一件很有意思的地方,看到左上角的图片,“盲人摸象”。不知道是不是openI 里面有人觉得这幅画很能表现商业智能现在的状态。

  JasperSoft

  

JasperSoft的网站算是非常典型的商业公司。而且首页做的非常的好。颜色的色调比较统一,商标简洁,图像选择具有代表性,列出了

  products,service,news,customers,community, 不过个人觉得中间图像的一行字:community ,download products,buy now ,要么放到上面,要么放到下面,放中间位置不太好,个人感觉吧。

  SpagoBI

  

  spago网站的整体感觉就比JasperSoft差一点,不过布局方面更好一点,有一个站点导航,原因是你看到的这个页面是spago的cms的一部分 。

  pentaho

  

pentaho的网站也是典型的商业公司的网站,而且是典型的美国的那种商业公司,当然这只是个人感觉,整个网站相当的漂亮,无论是颜色搭配,图片选择,界面布局,导航条的交互,还是商标,注意一下右下角的jolt 大奖,权威的象征呀,软件的奥斯卡呀。

  一个好的项目总是有很多的文档,一个失败的项目总是有各种理由没有文档或很少的文档。所有我们有理由来比较一下四个平台的文档。

  openI的文档

  openI的项目相对来说比较的小,文档可能也少一些,

  Installation DocumentAs Mick Jagger would say -- "Start me up"

  User GuideInstructions on creating/modifying analysis

  Architecture OverviewOh yeah, there was some design work

  Java DocOh yeah, there is internal documentation

  文档虽少,主要的都有了,实际上,这也是每个项目都应该有的文档了,java doc文档实际还是很必要的,方便查询API。

  jaspersoft的文档  

分类

描述

数目

Books 
Books on JasperSoft solutions for sale.
7
Report Samples 
Sample reports typically include the jrxml, html, images, and/or pdf showing result.
11
Articles 
Technical articles from around the globe on JasperSoft products
21
JasperServer 
Documentation for JasperServer
10
iReport 
Documentation for iReport
14
JasperReports 
Documentation for JasperReports
8
JasperETL 
Documentation for JasperETL
2
JasperSource Tips and Tricks 


8

  Jaspersoft的文档不可谓不多,而且集中在report上,大家也都知道,JasperSoft的jasperreport是业界领先的一种报表方式。而iReport则是jasperReport的设计器,好的report都是有自己的设计器的,因为报表的种类很多,不可能把所有的情况都考虑到,所以想要需要自己的设计器。相对于国内的智能平台,光报表这方面来说的话,就没有自己的设计器,所以要想开发一些新的报表样式就得定做,而且不容易管理,修改。所以设计器还是很必要的,无论是做成RCP还是web形式。

SpagoBI的文档

  How_To—1.6.doc.zip

  How_To—1.6.pdf.zip

  QuickStart—0.9.2.doc.zip

  QuickStart—0.9.2.pdf.zip

  SpagoBI_JBoss_Installation_Manual-1.4.3.doc.zip

  SpagoBI_JBoss_Installation_Manual-1.4.3.pdf.zip

  SpagoBI_JOnAS_Installation_Manual-1.4.3.doc.zip

  SpagoBI_JOnAS_Installation_Manual-1.4.3.pdf.zip

  SpagoBI_eXoTomcat_Installation_Manual_1.4.3.doc.zip

  SpagoBI_eXoTomcat_Installation_Manual_1.4.3.pdf.zip

  spagoBI的文档只有怎么安装的,关于它的组件的文档相对就少了,可能是开发着文档只有在进入他们的社区或者是在社区开发者内部才有的吧。顺便说一下,spago本身还有自己的cms , portlet , workflow.实力绝对不容小看。

  pentaho的文档

  pentaho的文档也非常的丰富

  Pentaho Getting Started Guide

  Pentaho AJAX Guide

  Pentaho Security Guide

  Pentaho Subscriptions

  Software Quality Reports for Bugzilla Getting Started Guide

  Software Quality Reports for Bugzilla Solution Documentation

  Pentaho Cube Designer User Guide

  Pentaho Creating Solutions

  Pentaho Data Mining Experimenter Tutorial

  Pentaho Data Mining Explorer Guide

  Pentaho SDK

  Pentaho Advanced Installation Guide

  Pentaho Customizing Deployments

  Pentaho Advanced Reporting Guide

  Pentaho Component Builder's Guide

  Pentaho Dashboard Builder's Guide

  Pentaho Internationalization Guide

Pentaho BI Design Studio User Guide

  Pentaho Report Design Wizard User Guide

  Pentaho Report Designer User Guide

  Pentaho Report Bursting Guide

  Pentaho Jasper Report and BIRT Integration

  Pentaho Using System Actions to Control Data Access

  Session and Global Filter Guide

  pentahoPentaho Report Design Wizard User Guide 和

  Pentaho Report Designer User Guide 是针对Pentaho Report Design的,一个基于eclipse平台的报表设计器。和jaspersoft一样,它把报表跟报表设计器飞开了,spagoBI好像是没有单独的报表设计器。它都是集成在一个WEB平台里面的。

  Pentaho AJAX Guide 是它自己的一个AJAX工具包的开发文档,从pentaho网站的漂亮程度看的出来。Pentaho对于美观还是非常的注重的。

  Pentaho Cube Designer ,Pentaho Data Mining , Pentaho Dashboard Builder's ,Pentaho Internationalization , Pentaho BI Design Studio 则是它的各个组件的开发文档。对于国际话还有专门的文档,看来pentaho 在开发的一开始就没打算之针对英语市场,spagoBI也有国际话,cms和portlet都应该有吧,jaspersoft有没有我就不知道了,pentaho也和另外的报表有集成,Jasper Report and BIRT Integration ,也算是业界主流的报表吧,spagoBI也跟其他有集成。

  OpenI的demo

  OpenI提供下载的demo只有一个,在线演示的有两个,下载的一个是叫foodmart 。

  需要mysql.部署起来相对比较麻烦.至少花了我十分钟.然而在实际的生产环境中.部署openI是最快的,因为它的组件相对较少,贴两张在线演示的图片。

  

  

  下面的灰色比较难看的表格就是JPivot的,的确是很牛的一个项目,不光是技术,关键是界面的颜色,后面介绍pentaho的时候也会提到的。

JasperSoft的Demo

  JasperSoft的Demo要先注册才能下载

  Welcome to the JasperReports demo. JasperSoft and VMware have partnered together to create a virtual application showcasing JasperReports, the world's most popular open source reporting engine. The VMWare image contains a sample web application showing how JasperReports can be used to add reporting to any application. This sample is using SugarCRM as a data source, but can be used with other applications data as well.

  To get started, please fill out the brief form below and you will be taken to the download area.

  做成VMware的,那Demo部署起来就不用一分钟了,只要你装好了VMware.放就是了。

  它自己本身还有一个宣传片.是做成Flash的.贴几张图(Ad Hoc是点对点的意思)。

  

  

jaspersoft的VMware的Demo 让我很奇怪,848M的东西,里面的只有一个SugarCRM的Report的Demo, 跟我看他们宣传的Flash那个版本不一样。相信JasperSoft本身的能力绝对不是这个Demo里面的这样。

  

  

  spagoBI的Demo

  spagoBI的Demo部署起来也非常之快.下载spagoBI demo和eXoPortal-tomcat-1.1.3.别先启动tomcat.把一个往另一个覆盖.启动sbidata里面的HSQL,启动 eXoPortal,按照Readme里面的网址打开浏览器就够了,我个人部署的时候是没问题.可是OLAP进去就报错,其他的都没问题,幸好它还有一个在线的Demo。

  而且难能可贵的是它还有十个tutorials,是Flash的,而且还是分阶段介绍的。

  不得不说这给我留下了太深的印象了,一千个字也许没有一个图片更能介绍清楚的,一百个图片也许没有一个Flash更能介绍清楚的了,也许 SpagoBI的平台知名度比JasperSoft的和Pentaho的要少的多.但是这十个Flash的确证明了他们团队对于平台的推广下了很多的功夫的。

技术再好,也要让别人知道才有用

  JPivot的多维查询,SpagoBI也拿界面没办法。

  

  jfreereport和jaspersoft报表,也有BIRT的。

  

  DashBoard

  

Data Mining

  

  多维查询条件选择

  

  pentaho的Demo:

  主页

  

点左边饼状图,右边的数据会跟着变,pentaho认为这个就是它们的DashBoard了,跟SpagoBI的比差了一些。

  本次的主角登场了。pentaho里面的JPivot,一样的灰色,一样的菜单。

  

  JFreeReport

  

pentaho认为的DashBoard

  

  GEO的搜索,spagoBI也有,不过好像没有这么强大。还跟google map的API 结合了,易用性又高了一点,

  

  各种不同的报表,毕竟报表是BI的最初也是最重要的一环。

  

pentaho的杀手应用,Mondrian + JFreeReport .数字没对好。要扣分的。

  

  Demo 的BI Platform是在JBoss Portal上的。不过要说明的是pentaho本身是平台无关的,无论你是在tomcat,jboss,weblogic,你选用哪种portal都一样,数据库支持的很多,Hibernate做的,只要你有JDBC驱动。

  中间空的会不会太大了一点,下面倒是中规中矩的portal 。

  

  换了个theme后的portal,漂亮多了,平台的颜色是一致的。

  

后台管理界面,跟SpagoBI一样,有耗时比较长的任务都是放在后台运行,运行完了才有提示,都是用quartz做的。

  

  运行报表时的sql,Demo是在HSQL平台。SQL也是中规中矩的SQL 。

  

openI

  首先看openI的体系结构:

  

  RDL是Report Define Language 。

  openI具有一个BI应有的大部分特性了。

  report : jasperreport ,JFreeChart

  olap : mondrian + JPivot

  data mining: weka

  它的各层衔接的非常的紧,好像用了eigenbase做数据管理,不是很清楚这部分,openI在做数据挖掘的时候它没有调度器,它的Portlet Interface 主要是指在用JPivot的时候JPivot可以到处使用。

  openI没有自己的开发专属工具,入门门槛也相对较低。

  JasperSoft

  

JasperSoft最重要的就是它的报表,但是它支持输出的格式很多,管理的方式也很多,也用了eigenbase做数据管理。有比较完善的权限控制,用的acegi,支持多种数据源,只要有JDBC驱动。

  它的产品已经形成了一个产品线,最著名当然还是它的JasperReport。

  你可以看到它为了更好的管理各种报表和数据,有自己专属的展现平台JasperServer,这个平台是 06/26/2006才创建的,完全是JasperSoft为了实现BI而迈出的重要一步。jasper没有数据挖掘。有任务调度器,用了quartz。有自己专属的ETL: JasperETL 。它有自己的OLAP SERVER : jasperAnalysis 。展示层用到了AJAX和applet, 也有DashBoard。查询语句支持SQL, Hibernate (HQL), XPath (XML), EJBQL, MDX(多维查询语言,OLAP专用,SQLSERVER用的是XMLA)

  SpagoBI

  

  spagoBI平台厉害很多,也复杂了很多。它的各个组件之间模块化很好,Plugin加载,来看一下它的各个组件:

  report : BirtReportDriver , BirtReportEngine , JasperReportDriver ,JasperReportEngine

  GEO : GeoDriver , GeoEngine(用地图显示数据和查询的)

  OLAP : JPivotDriver , JPivotEngine

  QBE : QbeDriver, QbeEngine

  Data Mining : WekaDriver , WekaEngine

  Security : ExoPortalSecurityProvider

  Booklet (小册子) : BookletsComponent: it is a component for booklets generation.主要包括文件上传,工作流,OpenOffice支持。

  它还有文档管理,用的是apache的JackRabbit,有搜索功能,用的lucene.不愧是做cms,portlet,workflow出身的,技术就是牛。

  spagoBI的使用的工具也比较多:

  Report : Bird , JasperReport

ETL : Octupus 和 talend (talend是官方合作伙伴)

  OLAP : Mondrian 和 JPivot

  Data Mining : Weka

  Portal : eXoPortal

  它的展现层也使用了AJAX特性,另外它在DashBoard也使用了openlaszlo,(一个用Java code 生成Flash的框架,主页是http://www.openlaszlo.org/。新版的4.0好像也要支持生成DHTML) 所以spagoBI的DashBoard看上去很爽.。

  spagoBI的ETL是非常之牛的。你可以看到它下面的数据处理层是单独分出来的,至于为什么牛,我在后面ETL部分会专门提到的。

  还有一些很细节的东西,想BIPortlet,BIMessage , Notify ,Schedule , Workflow ,Rule Engine ,Profiling ,Analytical Document 我会在后面尽量把我知道的说一下。

  pentaho

  

  pentaho的体系结构跟spagoBI非常相像,我甚至都没看出来有上面很大的区别,不过pentaho喜欢把自己的东西称作 solution,以下引用自pentaho的whitepaper: “pentaho BI 平台不同于传统的BI产品。它是一个以流程为中心的,面向解决方案的(Solution)的框架,具有商业智能(BI)组件,使得公司可以开发商业智能问题的完整解决方案。

  pentaho一样把数据处理层看的很重要,多种数据显示方式,甚至有RSS输出。pentaho是有各种开源组件组成的。

  ETL : Kettle (界面上显示的是pentaho Data Integration ,previously Kettle)

  Report : Pentaho Report (它也支持Birt 和 JasperReport 的集成 ,还有专门的文档)

OLAP : Mondrian 和 JPivot (Mondrian已经加入了pentaho )

  Platform : Pentaho Planform

  Data Mining: Weka (Weka也加入了pentaho)

  roadmap是一个项目的计划表,个人认为任何一个项目都应该有的,这样你的developer能够知道自己工作的项目处在什么状态,也不至于每天都在没日没夜的忙,却不知道自己在忙什么,这样更能够提高团队的士气。

  JasperSoft

  我找到的这一篇是November 2006的,找了半天也没找到最新的,它是分各个不同组件的,我挑一些说一下:

  1 . Many components of JasperIntelligence are localizable. We are doing a pass through to make sure localization works at all levels.

  2 . Dashboards Multiple reports and OLAP components displayed in a single screen

  3 . Portal (JSR168) integration: portlets, security

  4 . Report data sources in all JR query languages, including Mondrian and XML/A

  5 . Scheduling Enhanced UI for scheduling management

  6 . JasperAnalysis Filtering views according to user profile, not just role

  7. JasperAnalysis Visual Schema Builder

  Visual MDX builder

  JasperETL是基于talend的,所以不在我讨论之列。

  1 .可以看出jaspersoft的全球化的意图,实际这也是每一个成熟项目都需要面对的。

  2 .DashBoard是BI展现层技术比较集中的一个地方。我本身没有看过jaspersoft的DashBoard。

  3 . portal是BI展现层不可避免要用到的技术,后面我也会就portal专门有一个篇比较的

  4 . data warehouse 也是支持越来越广泛。

  5 . 任务调度必不可少 。

  6 . 基于profile的参数控制也算是基于权限控制的另一种途径。因为普通的权限控制不可能满足BI的要求,太多的参数要管理了。

  7. Visual , Visual , Visual 不知道它的MDX怎么做的,如果跟JPivot一样就..................

  pentaho

  pentaho的roadmap,官方甚至说没有commitment(许诺),仍然挑几条:

  1. Accelerate dashboard creation by delivering a dashboard design tool.

  2. Business users will be able to select from subject areas predefined by administrator and apply filters (for example, certain time periods or product lines) to select the subset of information they need.

  3. Wizard-driven interfaces to streamline the deployment and optimization of OLAP cubes .

  4. Easily incorporate data from multiple sources into Pentaho Data Mining solutions via Pentaho Data Integration.

  5. Offer integration with Content Management Systems (CMS) to store and manage access to generated reports.

这是一个总的它的roadmap,它的各个组件还有各自自己的roadmap.

  1. 用DashBoard Design tool来做Dashboard,易用性又提高不少,pentaho喜欢把tool做成基于eclipse的tools,spagoBI则是喜欢模块化的设计,都基于web + plugin模式.

  2. 预定义的filter,最后大家都可以共享和分发filter,有点像社交社区的功能

  3. 用wizard-driven的方式来建cube,OLAP的功能会越来越厉害的,JPivot的不爽的另一种表现(挑拨离间我最在行,开玩笑的,大家别当真)

  4. 我也不懂什么意思,pentaho论坛上也有人问了,没有回答

  怎么集成的,怎样data mining , 集成到哪了,kettle吗?只有等release才知道

  5. 终于还是要动用CMS来解决问题了,spagoBI在这点上领先一点.

  spagoBI

  spagoBI的roadmap看了会让你非常的惊讶,为了表示我对spagoBI这个雄心勃勃的项目的尊敬,贴出全部roadmap(加了数字)。

  First half 2007

  Analytical engines and end-user functions

  1 ETL: integration of Talend OS tool

  2 OLAP: new OLAP engine for web based analysis or local spreadsheet elaboration - Integration of Palo/JPalo OS tool

  3 OLAP: new XMLA engine, to integrate MS Analysis Services

  4 QbE: profiling and filtering over data according to the behavioural model

  5 Dashboard: enrichment and new components

  6 Personal folders to storage private documents and the possibility of sharing them

  7 Personal menus of quick access to all kind of documents

  Developer/administrator functions

  8 Scheduler: production, distribution and storage of off-line reporting, deferred execution of documentary Dossiers, Mining or ETL processes

  9 Search engine

  10 Predefined set of metadata to implement frequently used time parameters (ex. current month, current year, current date)

  11 Self-analysis: analytical model developed with the SpagoBI platform on its own metadata. This model offers the developer/administrator the full visibility on the behavioural model and on the analytical metamodel managed by the platform.

  12 Rich client (Ajax) for the developer and administrator functions

  13 Designers: enrichment and simplification of the interactions with the platform for the development of the analytical documents

  14 Evolution of the platform towards SOA architecture

15 Metamodel

  Second half 2007

  Analytical engines and end-user functions

  16 Dashboard: new engine

  17 Subscription: capability for the end-user to enter himself to the periodic delivery of predefined reporting.

  18 Alerts and notifications

  19 Geo-referenced analysis: improvement of the current engine and integration of GIS solutions

  20 Navigation profile, to inherit settings during the vertical and cross navigation between the analytical areas and documents

  Developer/administrator functions

  21 Installer and end-user interface for the configuration of the environment

  22 Rich client (Ajax) for the developer and administrator functions

  23 Designers: enrichment and simplification of the interactions with the platform for the development of the analytical documents

  24 Evolution of the platform towards SOA architecture

  25 Metamodel

  Applicatory development areas

  * What-if

  * BPM

  有很多人认为 pentaho有多么多么厉害,证据呢?能告诉我厉害在哪些方面吗?这个roadmap也许会给你一个不一样的答案pentaho宣传做的很好,有 microsoft的风格,有什么都展现出来,spagoBI更像是一个默默努力的developer,技术一流,不懂的展现自己。

  2和3是支持新的OLAP Server的,Mondrian可不是唯一的选择。

  4. 跟pentaho一样基于profiling,只不过spagoBI有自己的behavioural model(行为模式) ,比pentaho厉害一点

  5 . pentaho的DashBoard注重在易用性方面,spagoBI 则是强调在功能上

  6 和 7.pentaho的cms只是一个plan,spagoBI已经在做private folder和共享文档了,还有导航,技术又高一点.

  8. mining ETLprocess ,后面我会在ETL的部分提到的

  9 . Search Engine 基于lucene的search,cms一部分

  10 .跟pentaho一样,常用的查询预先定义

  18. 用户通知方式的加强.不知道会不会有 RSS的方式

  19 . GEO 的查询快要和GIS集成了,十分期待,不知道会不会一样引用Google的API或是仍然基于原先的SVG.

  21 - 25都是为用户易用性和更好的用户体验做的增强.


登录后才可评论.