數據倉庫架構模型介紹
?
??? 對于經典的數據倉庫模型,經過調查整理,大概歸納成六類:
?
1.獨立的數據集市架構(Independent data mart architecture)
??? 獨立的數據集市架構有時也稱為獨立的數據倉庫架構,應該是出現最早的架構方式,也是很常見的方式。特別是對于中小企業、中小開發公司,出于成本和見效快的考慮都會采用這種架構方式。大家對這種架構方式一定也很熟。
??? 這種架構方式的缺點也很明顯,不是企業內一致的數據,產生信息孤島。當然如果企業就是很小,就一個系統,不用整合,一個數據集市足以的情況下采用這種方式也沒什么。先期小投資,讓企業看看效果,以后發展大了再考慮重新建立數據倉庫。
?
2.聯邦式數據倉庫架構(Federated data warehouse architecture)
??? 它的出現是由于,企業發展的初期建立了幾個獨立的數據集市架構,后來發現這樣不行,數據沒整合,要解決信息孤島得想辦法。推倒重建當然好,不過投入太大,以前的數據集市還想用,怎么辦。于是,想出另一種辦法,在各個獨立的數據集市間建立一些對照表,在不推倒它們的基礎上能進行一下數據交換。后來,慢慢發現,早想好整合策略,直接這樣建數據倉庫也可以,于是,地域聯邦、功能聯邦的概念也就都提出來了。
??? 聯邦架構的缺點也很明顯,除非建立之初就采用類似總線架構的方法實現數據一致,否則很容易出現數據不一致,導致整合的不徹底。如果之初就考慮好的話,和總線架構的差別就不大了。當然,對于臨時解決企業原有獨立數據集市的數據交換問題,聯邦架構還是有一定作用的。
?
3.集中式架構(Centralized architecture)
??? 集中式架構方式的出現,標識著數據倉庫架構已經進入比較成熟的時期。他的架構方式是建立物理的EDW,即中心數據倉庫,數據都集中的EDW中,應用和分析程序都在EDW中進行訪問,數據是全企業內一致的。隨著ROLAP的發展,在這種集中式架構中建立ROLAP開始比較流行,常見的 MicroStrategy公司的解決方案就是在EDW中建立ROLAP。ROLAP單獨建表保存元數據,只保存維度模型的關系,不保存維度模型的數據,由MicroStrategy的應用去解析,加上應用服務器作為緩存,速度還可以。
??? 這種方式也有一些缺點,如擴展能力差,對EDW所在的RDBMS要求太高,隨著數據量和分析的逐步增長,就不得不再把數據進行分離。如果在EDW的基礎上進行數據分離,為不同的應用單獨建立數據集市或者挖掘倉庫,集中式結構也就演變成Hub and Spoke架構方式。
?
4.集線器和車輪輻條架構(Hub and spoke architecture或Corporate information factoryarchitecture)
?
??? 集線器和車輪輻條架構聽起來比較別扭,叫起來也不響亮。而企業信息工廠應該是這種架構方式的最出色的代表。從名稱我們也能大概猜個差不多,中心數據倉庫 EDW從各個源系統收集數據,將數據提供給各個數據集市和挖掘倉庫,功能和集線器很相似,所以稱為Hub。如果大家把圖畫出來,可能會更形象一些,EDW 和各個源數據庫及數據集市、挖掘倉庫之間都連一條線,看起來就向一個車輪,這些連線就像車輪輻條,所以稱為Spoke。而這種采用中心數據倉庫EDW集成數據,再分散到各個數據集市使用數據的方式就形象的稱為Hub and spoke architecture。
??? 這種架構方式當然也有缺點,雖然是在集成的中心數據倉庫EDW上建立數據集市,但是這些數據集市之間還是不能進行數據交換的,大家建立的方法和ETL程序都會不同,各個數據集市之間的數據不見得的是一致的。而且這種架構方式開始變得復雜。
?
5.總線架構(Bus architecture)
??? 總線架構和Hub and spoke architecture 的最大區別,應該是維度建模的原子層和一致性維度的建立。正因為預先建立的總線架構和一致性維度,所以這種架構可以保證在逐步建立數據集市的過程中還能保證企業數據的一致性。總線架構是數據倉庫架構方式從復雜走向簡單的一步,將維度建模的數據倉庫原子層和數據集市合而為一,一層就把數據倉庫建立好的,還能支持各種數據集市分析應用。
??? 當然總線架構也有缺點,中心數據倉庫以維度模型保存,對于特殊的非維度型分析應用會有局限性,支持的不好。
?
6.復合式架構(Composite architecture)
??? 這種架構方式是綜合考慮Huband spoke architecture和Bus architecture兩種架構方式,或者說綜合兩種方式得出的一種架構方式,CDW架構應該就是這種架構方式的代表。
??? 復合式架構的缺點也是很明顯,架構過于復雜,(比CIF還要復雜),企業內數據量大的話,每一次搬動都會非常麻煩。
?
???