·概述
??? 由于項目需要,今天開始接觸OLAP(Online Analytics Process, 聯機分析處理)。說到OLAP,不能不用窮人通用的Mondrian。Mondrian官方網站(
http://mondrian.pentaho.org/)給出的定義是 Mondrian is an OLAP server written in Java. It enables you to interactively analyze very large datasets stored in SQL databases without writing SQL.
???? 說白了,Mondrian是一個OpenSource的基于關系數據庫的分析服務器,遵循MDX、XML/A和JOLAP標準。
·架構??
??Mondrian從架構上可以分為四個層次:表現層、計算層、聚合層、存儲層。
??計算層:分析、驗證、執行MDX語句,?先計算坐標軸,然后再計算每個單元格的值,從效率上的考慮,計算層批量從聚合層獲取單元格數據集合。
??聚合層:聚合層中緩存了多維查詢結果,即單元格的數據集合,如果計算層所需要的數據不在緩存中,從存儲層中進行查詢獲取數據并緩存。
??存儲層:采用關系數據庫實現,一般采用星型模型構建,提供維表、事實表和聚合表。
??系統部署結構上,可以分三層結構分開部署,將表現層部署在一臺機器上,計算層和聚合層部署在第二臺,存儲層部署在第三臺。
·
存儲和聚合
??根據OLAP服務器數據存儲技術,可以分為ROLAP和MOLAP,Mondrian采用ROLAP技術。
??在ROLAP的多維模型組織和存儲數據中,比較常用的方式是星型模式,由一個事實表和一組維度表組成。維度必須預先確定,可以是一般的星型架構,也可以是比較特殊的父子架構、雪花架構等。在ORACLE數據庫中,我們能夠按照維度進行預先的統計、分類、排序,創建大量的實體化視圖。對于沒有實體化視圖類似功能的數據庫,我們也可以創建大量的臨時聚合表,這樣當用戶進行比較高級的分析的時候,不用訪問數據量龐大的基礎事實表,只需要在我們已經形成的實體化視圖或聚合表上作進一步的聚合就可以了,這樣能夠大大提高查詢分析的效率,并且減少占用的系統資源。
??在使用聚合表方面有一個關鍵的技術稱之為"聚合感知"技術,只有OLAP引擎必須能夠根據多維查詢中的維度信息,從適當的聚合表中提取數據,否則聚合表形同虛設。另外在多維模型設計中,設計正確的聚合表也是很關鍵的。不恰當的設計導致將聚合表的不能滿足多維查詢的需求,每次從事實表取數據,開銷是非常大的。
??Mondrian采用關系數據庫存儲事實表,其本身不具有"聚合感知"的技術,當需要從比較明細的事實表中匯總數據時,性能就比較差了。但是如果關系數據庫能夠支持實體化視圖或其他聚合技術,那么就可以利用關系數據庫的技術透明的提高系統性能。我們可以利用Oracle實體化視圖來提高Mondrian的效率。?
·初次使用
?? 從SourceForge上下載了mondrian-2.3.2.8944版(
http://sourceforge.net/project/showfiles.php?group_id=35302),解壓得到了里面的demo war包,自己搭建環境使用了一下Mondrian。下面的截圖是我運行得到的結果:

??? 關于具體如何使用,請關注我的下一篇文章 :-)
PS:? 歷史上的Mondrian
??? Mondrian,蒙得里安·皮特,1872-1944荷蘭畫家,作品以交錯的三原色為基色的垂直線條和平面為特點,他的著作包括新造型主義(1920年),對抽象藝術的發展曾經產生很深影響。
? 以下為這位藝術家的幾幅作品:



posted on 2007-07-04 18:05
小立飛刀 閱讀(4169)
評論(8) 編輯 收藏 所屬分類:
Mondrian OLAP