Posted on 2007-04-09 14:35
龍~天飛 閱讀(229)
評論(0) 編輯 收藏 所屬分類:
BI Technology
Data Warehouse
本世紀80年代中期,"數據倉庫之父"William H.Inmon先生在其《建立數據倉庫》一書中定義了數據倉庫的概念,隨后又給出了更為精確的定義:數據倉庫是在企業管理和決策中面向主題的、集成的、與時間相關的、不可修改的數據集合。與其他數據庫應用不同的是,數據倉庫更像一種過程,對分布在企業內部各處的業務數據的整合、加工和分析的過程。而不是一種可以購買的產品。
Data mart
數據集市,或者叫做"小數據倉庫"。如果說數據倉庫是建立在企業級的數據模型之上的話。那么數據集市就是企業級數據倉庫的一個子集,他主要面向部門級業務,并且只是面向某個特定的主題。數據集市可以在一定程度上緩解訪問數據倉庫的瓶頸。
OLAP
聯機分析處理(OLAP)的概念最早是由關系數據庫之父E.F.Codd于1993年提出的。當時,Codd認為聯機事務處理(OLTP)已不能滿足終端用戶對數據庫查詢分析的需要,SQL對大數據庫進行的簡單查詢也不能滿足用戶分析的需求。用戶的決策分析需要對關系數據庫進行大量計算才能得到結果,而查詢的結果并不能滿足決策者提出的需求。因此Codd提出了多維數據庫和多維分析的概念,即OLAP。Codd提出OLAP的12條準則來描述OLAP系統:
準則1 OLAP模型必須提供多維概念視圖
準則2 透明性準則
準則3 存取能力推測
準則4 穩定的報表能力
準則5 客戶/服務器體系結構
準則6 維的等同性準則
準則7 動態的稀疏矩陣處理準則
準則8 多用戶支持能力準則
準則9 非受限的跨維操作
準則10 直觀的數據操縱
準則11 靈活的報表生成
準則12 不受限的維與聚集層次
ROLAP
基于Codd的12條準則,各個軟件開發廠家見仁見智,其中一個流派,認為可以沿用關系型數據庫來存儲多維數據,于是,基于稀疏矩陣表示方法的星型結構(star schema)就出現了。后來又演化出雪花結構。為了與多維數據庫相區別,則把基于關系型數據庫的OLAP稱為Relational OLAP,簡稱ROLAP。代表產品有Informix Metacube、Microsoft SQL Server OLAP Services。
MOLAP
Arbor Software嚴格遵照Codd的定義,自行建立了多維數據庫,來存放聯機分析系統數據,開創了多維數據存儲的先河,后來的很多家公司紛紛采用多維數據存儲。被人們稱為Muiltdimension OLAP,簡稱MOLAP,代表產品有Hyperion(原Arbor Software) Essbase、Showcase Strategy等。
Client OLAP
相對于Server OLAP而言。部分分析工具廠家建議把部分數據下載到本地,為用戶提供本地的多維分析。代表產品有Brio Designer,Business Object。
DSS
決策支持系統(Decision Support System),相當于基于數據倉庫的應用。決策支持就是在收集所有有關數據和信息,經過加工整理,來為企業決策管理層提供信息,為決策者的決策提供依據。
ETL
數據抽取(Extract)、轉換(Transform)、清洗(Cleansing)、裝載(Load)的過程。構建數據倉庫的重要一環,用戶從數據源抽取出所需的數據,經過數據清洗,最終按照預先定義好的數據倉庫模型,將數據加載到數據倉庫中去。
Ad hoc query
即席查詢,數據庫應用最普遍的一種查詢,利用數據倉庫技術,可以讓用戶隨時可以面對數據庫,獲取所希望的數據。
EIS
主管信息系統(Executive Information System),指為了滿足無法專注于計算機技術的領導人員的信息查詢需求,而特意制定的以簡單的圖形界面訪問數據倉庫的一種應用。
BPR
業務流程重整(Business Process Reengineering),指利用數據倉庫技術,發現并糾正企業業務流程中的弊端的一項工作,數據倉庫的重要作用之一。
BI
商業智能(Business Intelligence),指數據倉庫相關技術與應用的通稱。指利用各種智能技術,來提升企業的商業競爭力。
Data Mining
數據挖掘,Data Mining是一種決策支持過程,它主要基于AI、機器學習、統計學等技術,高度自動化地分析企業原有的數據,做出歸納性的推理,從中挖掘出潛在的模式,預測客戶的行為,幫助企業的決策者調整市場策略,減少風險,做出正確的決策
CRM
客戶關系管理(Customer Relationship Management),數據倉庫是以數據庫技術為基礎但又與傳統的數據庫應用有著本質區別的新技術,CRM就是基于數據倉庫技術的一種新應用。但是,從商業運作的角度來講,CRM其實應該算是一個古老的"應用"了。比如,酒店對客人信息的管理,如果某個客人是某酒店的老主顧,那么該酒店很自然地會知道這位客人的某些習慣和喜好,如是否喜歡靠路邊,是否吸煙,是否喜歡大床,喜歡什么樣的早餐,等等。當客人再次光臨時,不用客人自己提出來,酒店就會提供客人所喜歡的房間和服務。這就是一種CRM。
Meta Data
元數據,關于數據倉庫的數據,指在數據倉庫建設過程中所產生的有關數據源定義,目標定義,轉換規則等相關的關鍵數據。同時元數據還包含關于數據含義的商業信息,所有這些信息都應當妥善保存,并很好地管理。為數據倉庫的發展和使用提供方便。