四大OLAP工具選型淺析
?
??? 今天從郵件里翻出一篇N久以前的選型文章,感覺挺有意思的,特地發上來。是06年4月的文,已經過去3年多了,這其中Cognos和Hyperion都已經被收購了,還應該加上文里沒有提到的BO,看來這個市場已經越來越受到軟件大鱷的關注了。文中說的ROLAP也逐漸流行起來,現在大有超越MOLAP的趨勢,主要還是取決于現在硬件的大大加強,使得ROLAP的性能越來越好。微軟的Analysis Service也已經發布了2008版本,實用性是越來越強了,目前這個市場屬于百花齊放型來的。
?
------------------------------------------------------------------------
?
選好你的魔幻“立方”——四大OLAP工具選型淺析
網絡世界特約撰稿人 劉慶2006-4-18閱讀人次:10074
?
??? OLAP(在線分析處理)通過對“立方(Cube)”進行“旋轉”、“切塊”、“切片”,從而實現對數據的多維分析處理。在過去的三十年中, OLAP產品雖然已經變得更便宜和便于使用,但是,哪種產品能夠更好地兼顧功能全面和應用簡便、MOLAP產品是否的確優于ROLAP產品等,仍是產品選型中的重要問題。
?
??? OLAP這個名詞是在1993年由E.F.Codd提出來的,不過,目前市場上的主流產品幾乎都是在1993年之前就已出來,有的甚至已有三十多年的歷史了。OLAP產品不少,本文將主要涉及Cognos(Powerplay)、Hyperion(Essbase)、微軟(Analysis Service)以及MicroStrategy幾大廠商的產品。
?
?
快槍手VS多面手
?
??? 單純從成本角度考慮,微軟的產品算是最能節省成本的,Cognos和MicroStrategy則在同一水平線,都比微軟貴一些。而Hyperion (Essbase)的產品價格就更高一些。
?
??? 從市場份額來看,就國外的市場報告分析,微軟、Cognos、Hyperion三家占據主流。在國內,目前還沒有權威的市場報告,如果僅從所接觸到的項目來看的話,用Cognos的很多,買Essbase的也不少。而Microstrategy進入中國不算早,這幾年在政府、金融行業也頗有建樹。
?
??? 若論開發應用,微軟的產品向來以友好的用戶界面著稱,上手迅速。在OLAP產品上,微軟依然發揚了這一優良傳統,并有進一步標準化的趨勢,開發了OLE DB for OLAP以及MDX(Multi-Dimensional Express,多維表達式);參與XMLA(XML for Analysis)規范制定,也是想作為OLAP服務器和前端分析應用的數據傳輸標準。
?
??? 而Cognos以桌面OLAP開始,一直以輕便、快捷的操作聞名。所謂桌面OLAP,是可以用客戶端將cube下載到本地進行訪問。雖然Powerplay早已演變成C/S結構的OLAP服務器,但其輕便的特點還是延續下來,而且提供可以簡潔部署且具有交互性的PowerPlay Web Explorer界面。
?
??? Essbase作為老牌的OLAP服務器,是一個比較復雜的產品。所謂復雜,有兩層意思,一是提供了豐富的API,讓你可以充分定制開發;二是開發的難度較大,部署起來不容易。這也是國內很多用戶難以將這個產品用好的一大原因。
?
??? 比較Essbase和Powerplay,會發現截然相反的兩個特點:Essbase的復雜和Powerplay的簡潔。對于這兩者,單獨說哪一種更好都不夠客觀,因為當你抱怨Essbase繁雜的接口時,也有人在抱怨Powerplay的定制功能怎么如此之少。這種情形其實跟這兩種產品的定位有關,Essbase比較專注于高性能的多維存儲服務,而Powerplay則更專注于快捷的多維訪問。換句話講,Essbase對于Powerplay正像專業相機對于傻瓜相機,在選哪一個更好的問題上,不同的人肯定有不一樣的答案。
?
??? OLAP產品的核心功能是提供多維存儲,另外就是能夠將OLAP訪問操作轉換為對數據的請求并返回,這些OLAP訪問操作大多是用戶通過前端發出的,因此要考慮OLAP產品能夠和哪些前端工具對接。
?
??? Cognos Powerplay是個相對封閉的產品,它有自己的客戶端和Web Explorer,你也甭想著用其他前端來訪問它。Hyperion和微軟都采用開放式接口,提供豐富的訪問API。上文曾提到微軟開發的MDX和參與的XMLA(XML for Analysis)規范,一些第三方的前端工具正是基于這樣的標準和OLAP產品對接,比如可以用BO WebI連接Essbase。
?
??? 誠然,這看起來的確比較酷,但有一點也要明確:目前雖然有XMLA、MDX這樣的標準,但還不是非常成熟,且并非唯一標準。所以即使有第三方前端工具訪問這些OLAP服務器,但只能說是多了一些選擇,真正在前端功能上,并不能保證比封閉結構更豐富。
?
?
百花爭艷 VS 一支獨秀
?
??? 根據多維數據存儲的位置,OLAP一般分為MOLAP(Multi-Dimensional OLAP)和ROLAP(Relational OLAP)兩種,此外,還有混合的HOLAP(Hybrid OLAP)。
?
??? 其中,Cognos的Powerplay、Hyperion 的Essbase和微軟的Analysis Service這些產品都是MOLAP產品。這類產品將數據從關系數據庫(甚至是文本文件、Excel文件)中抽取出來,存儲在自己的數據庫中。
?
??? 如果說OLAP產品市場幾乎都被MOLAP占領,那么,有一家公司肯定不同意,那就是MicroStrategy,它幾乎是目前唯一一家還占據一定市場份額的ROLAP產品。這是一件非常奇怪的事情,從第一個ROLAP產品Metaphor到Metacube、WhiteLight、MicroStrategy,這些獨立的ROLAP廠商似乎都是難以生存下去,只有MicroStrategy堅挺到現在。究竟是它的產品厲害,還是市場做得到位?目前還不得而知。
?
??? 從原理上講,ROLAP將數據存放在關系數據庫中,當然要求關系模型要非常嚴格,比如要遵循星型模式或雪花模式,才能定義出維度、度量、事實表、聚集表等元數據。但這樣就增加了部署的難度,并且如果聚集表構建得不好,最后的訪問性能就難以保證。恐怕這也是ROLAP難以生存下去的原因吧。
?
??? 目前,很多OLAP產品都會混合MOLAP和ROLAP,特別是那些本身就做關系數據庫的廠商,在現有數據庫上面增加一些ROLAP的特性并不困難。IBM在與Essbase終止OEM合同之后,推出一個名為CubeViews的產品,就可以說是一個ROLAP產品了。
?
??? 雖然國內市場上已經涌現出這么多產品,但實際上,OLAP并沒有被廣泛接受,即使在已經建設BI系統好幾年的電信行業也是如此。原因就在于前幾年,原始的cube(立方)等概念被直接推送給市場人員、領導,復雜的界面(對于領導來說,那已經夠復雜了)讓這種應用難以得到推廣。為此,OLAP產品的定位無疑還需要進一步明確。
?
?
?
?