過失
1
:如果您創(chuàng)建了數(shù)據(jù)倉庫,它們的用途自然顯現(xiàn)出來了
在構(gòu)造數(shù)據(jù)倉庫之前,一定不能盲目自信。成功的
DW
規(guī)劃必須考慮整個(gè)企業(yè)的需要并開發(fā)出一系列文檔說明的需求以引導(dǎo)工程的設(shè)計(jì)、構(gòu)造和展示。
?
過失
2
:遺漏了體系結(jié)構(gòu)框架
全面的體系結(jié)構(gòu)框架的開發(fā)和維護(hù)是成功地構(gòu)建
DW
的最重要因素之一,框架必須給出構(gòu)造的藍(lán)圖以及不同
DW
組件的用途。體系結(jié)構(gòu)中必須考慮期望的終端用戶數(shù)量、數(shù)據(jù)容量及多樣性,數(shù)據(jù)的更新周期等問題。
?
過失
3
:理解用文檔對假設(shè)進(jìn)行說明的重要性
DW
相關(guān)假設(shè)和潛在數(shù)據(jù)沖突必須包含在項(xiàng)目體系結(jié)構(gòu)的框架中,需要盡早地在項(xiàng)目文檔中被確定和系統(tǒng)化,以確保在最終產(chǎn)品中反映出來。比如可以加載多少數(shù)據(jù),期望數(shù)據(jù)粒度,多長時(shí)間需要對數(shù)據(jù)進(jìn)行更新,在那些平臺上開發(fā)和實(shí)現(xiàn)
DW
等問題。
?
過失
4
:沒有使用正確的工具
DW
設(shè)計(jì)和構(gòu)造在很多方面都不同于
OLTP
應(yīng)用系統(tǒng)的構(gòu)造,
DW
工程需要完全不同的工具:
(
1
)分析工具:標(biāo)識數(shù)據(jù)需求,
DW
主要數(shù)據(jù)源以及數(shù)據(jù)模型的構(gòu)造,比如
CASE
工具
(
2
)開發(fā)工具:負(fù)責(zé)
ETL
過程,代碼生成,集成等
(
3
)實(shí)現(xiàn)工具:收集、處理、清洗、復(fù)制和合并倉庫中所包含的數(shù)據(jù)的數(shù)據(jù)獲取工具
(
4
)交付工具:進(jìn)行數(shù)據(jù)轉(zhuǎn)化,數(shù)據(jù)推導(dǎo)以及向最終的交付平臺輸出報(bào)表,比如查詢和報(bào)表用的數(shù)據(jù)詞匯表的產(chǎn)生和訪問之用的特殊工具。
?
過失
5
:濫用生命周期
數(shù)據(jù)倉庫生命周期(
DWLC
)和傳統(tǒng)系統(tǒng)開發(fā)生命周期的最大區(qū)別在于
DWLC
永不結(jié)束,它是一個(gè)持續(xù)行為的集合,從對
DW
需求的最初研究經(jīng)過數(shù)據(jù)管理再返回。一般來講,
DW
每個(gè)階段完成后,都會(huì)根據(jù)新的數(shù)據(jù)需求、增加的客戶群和新的數(shù)據(jù)源開始一個(gè)新的階段。
?
過失
6
:忽略了數(shù)據(jù)沖突問題
要設(shè)計(jì)出好的
DW
,不得不進(jìn)行大量的、非常冗長的分析以及確定企業(yè)內(nèi)可用的最佳數(shù)據(jù)源。標(biāo)識數(shù)據(jù)源系統(tǒng)后,需要解決不同命名習(xí)慣,文件格式大小,值范圍相關(guān)沖突等等,這個(gè)解決過程需要與數(shù)據(jù)所有人協(xié)作以對未來可能對源數(shù)據(jù)進(jìn)行的計(jì)劃修改或未計(jì)劃的修改達(dá)成共識。如果沒有用充分的時(shí)間和資源來解決數(shù)據(jù)沖突問題,將會(huì)延遲構(gòu)建倉庫的開始時(shí)間并可能導(dǎo)致危害項(xiàng)目成功的僵局。
?
過失
7
:沒有從失敗中吸取經(jīng)驗(yàn)教訓(xùn)
????
最好對以往項(xiàng)目過程的過失和錯(cuò)誤做下詳細(xì)記錄
凡是有該標(biāo)志的文章,都是該blog博主Caoer(草兒)原創(chuàng),凡是索引、收藏
、轉(zhuǎn)載請注明來處和原文作者。非常感謝。