盡管軟件發(fā)展中的熱點技術(shù)層出不窮,不斷地變化,有一些東西卻一直未曾改變,其中之一就是開發(fā)人員對數(shù)據(jù)庫的使用和設(shè)計開發(fā)。
你可能會興奮地緊跟時尚創(chuàng)建一個AJAX Web界面,或者使用最近迷人的Windows用戶界面,但是透過這些各種各樣的外觀界面,你可能依然需要從后臺數(shù)據(jù)庫中提取或存取所需要的數(shù)據(jù)——這一點就如同十多年以前人們對數(shù)據(jù)庫的操作是一樣的。
然而,令人吃驚的是,現(xiàn)在還有很多開發(fā)者依然在不斷地重復(fù)著很多年以前就存在的數(shù)據(jù)庫使用和開發(fā)上的錯誤。或許是有太多的開發(fā)者只是來學(xué)習(xí)如何使用一個數(shù)據(jù)庫,而不是真正的去研究它。以下是筆者作為一個開發(fā)者,個人在平時的開發(fā)工作中所精選出的數(shù)據(jù)庫開發(fā)者常犯的十大錯誤,以饗讀者和同行。
1、選擇了錯誤的數(shù)據(jù)庫
不是所有的數(shù)據(jù)庫都可以用來完成你的任務(wù),這意味著當(dāng)你在使用數(shù)據(jù)庫來做任何開發(fā)工作和其他事情前,你必須選擇合適的數(shù)據(jù)庫。例如,我們經(jīng)常看到一些Access數(shù)據(jù)庫沒有能力處理的大容量數(shù)據(jù)集,對于SQL Server來說卻像玩小孩子的游戲一樣輕松地完成處理。但是,對于只需要處理幾百行數(shù)據(jù)的需求,有的人卻花錢來購買SQL Server。這些都是錯誤的做法。
廣泛地來說,在當(dāng)今市場中的數(shù)據(jù)庫可以分為三個層次:桌面和嵌入數(shù)據(jù)庫——適合于處理小型任務(wù);一些大型數(shù)據(jù)庫產(chǎn)品的“Express”版也是不錯的,可以處理數(shù)G條數(shù)據(jù);而真正的企業(yè)級數(shù)據(jù)庫,像SQL Server、Oracle和DB2的數(shù)據(jù)處理能力是非常驚人的,你可以毫不猶豫地把數(shù)據(jù)拋給它們。
因此,在你選擇數(shù)據(jù)庫前,你需要對于你的數(shù)據(jù)進(jìn)行一次客觀真實的分析,從而選擇適合你的開發(fā)工作和實際需求的數(shù)據(jù)庫產(chǎn)品。
2、選擇了太多的數(shù)據(jù)庫
諸如ODBC、JDBC和OLEDB等應(yīng)用程序編程接口的出現(xiàn),大大促進(jìn)和提升了數(shù)據(jù)庫獨立性,也就是說,開發(fā)人員可以這樣來編寫你的應(yīng)用程序:你可以讓你的應(yīng)用程序支持使用任何數(shù)據(jù)庫來進(jìn)行數(shù)據(jù)存儲。
然而,這種情況是要付出一些代價的,我曾經(jīng)看到有的開發(fā)團(tuán)隊為了追求應(yīng)用程序的數(shù)據(jù)庫“無關(guān)性”,專門編寫了應(yīng)用程序?qū)⑺械腟QL語句轉(zhuǎn)換成一些底層的語言,以便讓所有的數(shù)據(jù)庫都能理解并執(zhí)行,但是,這樣做的同時也喪失了現(xiàn)有數(shù)據(jù)庫的一些高級功能。
那么為什么這么做呢?可能是出于這樣的考慮:某些客戶在將來的使用中可能想切換到Oracle或DB2或FoxPro,或其他的什么數(shù)據(jù)庫,采用上面的這種做法或許是現(xiàn)在先準(zhǔn)備好了,“未雨綢繆”。
對于此,另一種相反的做法是:當(dāng)你開始開發(fā)一個新產(chǎn)品的時候,選擇一個存儲引擎并開始在此基礎(chǔ)上編寫你的應(yīng)用程序。如果你的產(chǎn)品足夠好,人們會安裝你指定的數(shù)據(jù)庫,因此你不用浪費時間和精力來支持一種“假想”的用戶需求。
3、了解你的數(shù)據(jù)
在我們使用數(shù)據(jù)庫的過程中會碰到很多需要考慮的問題,例如有些客戶編號可能并不是我們通常認(rèn)為的七位,而是六位;而有一些公司和企業(yè)出于保護(hù)個人隱私的考慮,可能不一定非要求員工輸入他們的身份證號碼或者銀行帳號,因此這中數(shù)據(jù)類型在數(shù)據(jù)庫搭建和開發(fā)中必須設(shè)置成可以為空(NULL)。
也就是說,數(shù)據(jù)庫開發(fā)和設(shè)計不能脫離實際情況進(jìn)行,不能遠(yuǎn)離實際業(yè)務(wù)規(guī)則。對數(shù)據(jù)庫開發(fā)者來說,必須要完全了解用戶真正輸入數(shù)據(jù)的需求是什么,并根據(jù)這些數(shù)據(jù)來合理地設(shè)計數(shù)據(jù)字段的大小、類型以及什么規(guī)則,等等。否則,等待你的將是一次又一次地返回頭來進(jìn)行修改工作。因此,你要學(xué)會在開始的時候就對你需要處理的數(shù)據(jù)具有非常全面、深入的了解,要盡量考慮到各種意外的情況。
4、數(shù)據(jù)庫不像Excel一樣人人會用
現(xiàn)在有一種認(rèn)識上的誤區(qū),尤其是在一些小單位的管理者眼中,他們總認(rèn)為任何開發(fā)者都知道如何去合理地搭建一個數(shù)據(jù)庫。
很明顯,這種誤解讓我很困惑。既然你不會假定任何開發(fā)者都知道如何用C#編程或創(chuàng)建一個Web服務(wù),那么為什么要假定每個開發(fā)者都是數(shù)據(jù)庫專家呢?
這種假設(shè)所帶來的最后結(jié)果是,太多的數(shù)據(jù)庫被一些甚至從來沒有聽說過術(shù)語規(guī)范化(term normalization)的人所設(shè)計。很多數(shù)據(jù)庫的功能根本沒有被合理地運用,如果你是這樣一個開發(fā)者的話,那么在你設(shè)計數(shù)據(jù)庫之前,你需要加強(qiáng)這方面的培訓(xùn)和學(xué)習(xí)了。高效的數(shù)據(jù)庫設(shè)計是你必須了解和掌握的技巧,而不要奢望可以通過失敗的教訓(xùn)來了解到這一點。
5、第三范式并不是至高無上
另一方面,開發(fā)人員對數(shù)據(jù)庫的一知半解可能是一件比較危險的事情。我看到過很多數(shù)據(jù)庫被設(shè)計得過于死板,這些數(shù)據(jù)庫的設(shè)計者堅持把所有東西都放在查詢表中。
是的,數(shù)據(jù)庫開發(fā)者需要知道規(guī)范化的規(guī)則,但是你也需要知道什么時候要停止去用規(guī)范化,什么時候逆規(guī)范化反而可能會帶來更好的效果。
?6、隱藏應(yīng)用邏輯的“黑匣子”?
??? 存儲過程和觸發(fā)器是兩個非常偉大的功能。當(dāng)你有多個客戶訪問一個數(shù)據(jù)庫的時候,它們可以幫助你確保對數(shù)據(jù)的一致性處理。?
??? 不過,它們也可能會變成一個隱藏應(yīng)用邏輯的“黑匣子”,讓W(xué)eb和瘦客戶端開發(fā)者無法查看和調(diào)試這些邏輯。在大多數(shù)情況下,數(shù)據(jù)庫代碼不能像其他應(yīng)用程序代碼一樣被進(jìn)行代碼測試和代碼調(diào)試。?
???
因此,當(dāng)你要將代碼放到數(shù)據(jù)庫中的時候,花點時間來問一下自己:這些代碼是否真的適合放在數(shù)據(jù)庫中??
??
? 7、備份!備份!備份!?
??? 你的數(shù)據(jù)庫需要備份嗎?當(dāng)然需要!?
??? 我們?yōu)槭裁匆褦?shù)據(jù)存在數(shù)據(jù)庫中的原因之一就是想長久地保存它們。然而,我卻經(jīng)常碰到這樣的情況,有的開發(fā)人員卻因為這樣或那樣的原因——例如硬件故障、黑客或數(shù)據(jù)庫錯誤——因為沒有備份而導(dǎo)致珍貴的數(shù)據(jù)永遠(yuǎn)丟失。因此在你開始開發(fā)之前,就應(yīng)該制定一個數(shù)據(jù)備份計劃,包括備份的頻率、備份的類型,以及離線備份的頻率等等,而不應(yīng)該在數(shù)據(jù)丟失后才想起備份的重要。?
??? 我不希望“亡羊補(bǔ)牢”的故事發(fā)生在各位數(shù)據(jù)庫程序員的身上。?
???
8、你需要版本控制?
??? 說到備份,你需要擔(dān)心的不僅僅是數(shù)據(jù)的變化,還有數(shù)據(jù)庫的修改。你需要跟蹤并記錄下這些數(shù)據(jù)庫版本的變化,以便在任何需要的時候重新創(chuàng)建這個數(shù)據(jù)庫。如果你想真正專業(yè)化的開發(fā)軟件,你需要在你的數(shù)據(jù)庫設(shè)計中增加版本控制。?
??? 舉個例子來說,如果你想調(diào)試某個軟件版本中的客戶漏洞,但是你無法恢復(fù)到該軟件版本所對應(yīng)的數(shù)據(jù)庫版本的話,調(diào)試可能不會正常進(jìn)行。因此數(shù)據(jù)庫開發(fā)者必須要做好版本控制,否則可能因此帶來很多以后的麻煩。?
??? 9、使用數(shù)據(jù)庫自帶的工具?
??? 現(xiàn)代數(shù)據(jù)庫中已經(jīng)不僅僅是一些讓你存放數(shù)據(jù)的工具。它們還具有很多潛在的工具來使得管理數(shù)據(jù)庫更容易。?
??? 舉個例子來說,SQL Server中有工具可以檢測SQL語句中潛在的攻擊,甚至包括了一個向?qū)В瑏砀嬖V你該使用什么樣的索引才能使你的查詢上更高效,甚至可以模擬在真實服務(wù)器上的實際負(fù)載。?
??? 通過這些工具,我們的確在有的時候加速了數(shù)據(jù)庫運行的速度,降低了CPU的利用率,但是實際情況是,很多人只有在一些專家顧問告訴他們后才知道在數(shù)據(jù)庫中存在這樣的工具。如果你不知道在你的數(shù)據(jù)庫中存在什么樣的工具,以及這些工具能幫你做什么,那么你花的錢就沒有得到應(yīng)有的回報。?
?
?? 10、不要因為你有一個錘子就認(rèn)為什么都是釘子?
??? 現(xiàn)在有一種潮流,一些開發(fā)人員把應(yīng)用程序用到的所有數(shù)據(jù)都存儲在數(shù)據(jù)庫中。我曾經(jīng)看到有的應(yīng)用程序試圖創(chuàng)建一個完全數(shù)據(jù)元驅(qū)動(metadata-driven)的用戶界面,它把元數(shù)據(jù)和用戶偏好的數(shù)據(jù)都存放在相同的數(shù)據(jù)庫中。顯然這會讓開發(fā)人員的生活變得復(fù)雜和降低性能。?
??? 某些數(shù)據(jù)可能的確適合存放在本地文件中,而不是存放在網(wǎng)絡(luò)的客戶—服務(wù)器數(shù)據(jù)庫中。當(dāng)你存儲數(shù)據(jù)的時候,你需要分析一下你的數(shù)據(jù)適合存放在什么地方,是數(shù)據(jù)庫?注冊表?文本文件?還是XML文件?然后為其選擇最適合的存儲類型。“不要因為你有一個錘子就認(rèn)為什么都是釘子”,不要因為有一個數(shù)據(jù)庫,就把所有東西都扔到數(shù)據(jù)庫中——現(xiàn)在還存在一種對XML文件的過度濫用,也是同樣的情況。
-The End-