1:數(shù)據(jù)倉庫必須由業(yè)務用戶的需求來驅動,并因此從一個簡單的維度視角來建立于展示數(shù)據(jù)倉庫這樣的概念;
2:對數(shù)據(jù)倉庫,業(yè)務才是第一位的;
3:操作性系統(tǒng):存入數(shù)據(jù);數(shù)據(jù)倉庫:取出數(shù)據(jù);
4:數(shù)據(jù)倉庫在需求、客戶、體系結構和運行機制與操作性系統(tǒng)有很大不同;
5:客戶的煩惱:不能訪問數(shù)據(jù);切割數(shù)據(jù);快速訪問;不同系統(tǒng)間不同編碼;
6:數(shù)據(jù)倉庫:易閱讀的、并且精心組織,可信而安全;
7:EAI:企業(yè)應用一體化,所有系統(tǒng)按一定的視角來統(tǒng)一設計;
8:數(shù)據(jù)倉庫的4個環(huán)節(jié):操作源系統(tǒng)、數(shù)據(jù)聚集、數(shù)據(jù)展示和數(shù)據(jù)的存取;
9:ETL:數(shù)據(jù)析取轉換和加載;轉換如拼寫錯誤、丟失補充、標準化格式、多數(shù)據(jù)源組合、重復數(shù)據(jù)消除、倉庫
關鍵字的分配;
10:維度模型是為數(shù)據(jù)倉庫用戶提交數(shù)據(jù)最可行的技術手段;
11:維度建模和3NF范式建模的不同;
12:數(shù)據(jù)倉庫維度建模要求:必須包含原子數(shù)據(jù)、一致性維度和事實;符合數(shù)據(jù)倉庫總線結構;
13:總線結構是構造分布式數(shù)據(jù)倉庫系統(tǒng)的秘訣;
14:元數(shù)據(jù);
15:ODS:操作數(shù)據(jù)的存儲,一般沒有必要;
16:可加性、半加性和非加性事實;
17:事實表傾向于更多的行和更少的列,維表則相反;
18:事實表分類:周期、事務和累積快照;
19:數(shù)據(jù)倉庫:以數(shù)據(jù)庫為基礎,在需求、客戶、體系結構和運作方式等方面都與數(shù)據(jù)庫應用有很大的不同;
20:數(shù)據(jù)倉庫的兩種增值操作:OLAP和DM;