亚洲国产精品无码久久青草,亚洲国产精品自在线一区二区,亚洲av中文无码乱人伦在线r▽

數(shù)據(jù)加載中……

11 個(gè)重要的數(shù)據(jù)庫設(shè)計(jì)規(guī)則

簡介

在您開始閱讀這篇文章之前，我得明確地告訴您，我并不是一個(gè)數(shù)據(jù)庫設(shè)計(jì)領(lǐng)域的大師。以下列出的11點(diǎn)是我對自己在平時(shí)項(xiàng)目實(shí)踐和閱讀中學(xué)習(xí)到的經(jīng)驗(yàn)總結(jié)出來的個(gè)人見解。我個(gè)人認(rèn)為它們對我的數(shù)據(jù)庫設(shè)計(jì)提供了很大的幫助。實(shí)屬一家之言，歡迎拍磚 : )

我之所以寫下這篇這么完整的文章是因?yàn)椋芏嚅_發(fā)者一參與到數(shù)據(jù)庫設(shè)計(jì)，就會(huì)很自然地把 “三范式” 當(dāng)作銀彈一樣來使用。他們往往認(rèn)為遵循這個(gè)規(guī)范就是數(shù)據(jù)庫設(shè)計(jì)的唯一標(biāo)準(zhǔn)。由于這種心態(tài)，他們往往盡管一路碰壁也會(huì)堅(jiān)持把項(xiàng)目做下去。

如果你對 “三范式” 不清楚，請點(diǎn)擊這里（FQ）一步一步的了解什么是“三范式”。

大家都說標(biāo)準(zhǔn)規(guī)范是重要的指導(dǎo)方針并且也這么做著，但是把它當(dāng)作石頭上的一塊標(biāo)記來記著（死記硬背）還是會(huì)帶來麻煩的。以下11點(diǎn)是我在數(shù)據(jù)庫設(shè)計(jì)時(shí)最優(yōu)先考慮的規(guī)則。
規(guī)則 1：弄清楚將要開發(fā)的應(yīng)用程序是什么性質(zhì)的（OLTP 還是 OPAP）？

當(dāng)你要開始設(shè)計(jì)一個(gè)數(shù)據(jù)庫的時(shí)候，你應(yīng)該首先要分析出你為之設(shè)計(jì)的應(yīng)用程序是什么類型的，它是 “事務(wù)處理型”（Transactional）的還是 “分析型” （Analytical）的？你會(huì)發(fā)現(xiàn)許多開發(fā)人員采用標(biāo)準(zhǔn)化做法去設(shè)計(jì)數(shù)據(jù)庫，而不考慮目標(biāo)程序是什么類型的，這樣做出來的程序很快就會(huì)陷入性能、客戶定制化的問題當(dāng)中。正如前面所說的，這里有兩種應(yīng)用程序類型， “基于事務(wù)處理” 和 “基于分析”，下面讓我們來了解一下這兩種類型究竟說的是什么意思。

事務(wù)處理型：這種類型的應(yīng)用程序，你的最終用戶更關(guān)注數(shù)據(jù)的增查改刪（CRUD，Creating/Reading/Updating/Deleting）。這種類型更加官方的叫法是 “OLTP” 。
分析型：這種類型的應(yīng)用程序，你的最終用戶更關(guān)注數(shù)據(jù)分析、報(bào)表、趨勢預(yù)測等等功能。這一類的數(shù)據(jù)庫的 “插入” 和 “更新” 操作相對來說是比較少的。它們主要的目的是更加快速地查詢、分析數(shù)據(jù)。這種類型更加官方的叫法是 “OLAP” 。

那么換句話說，如果你認(rèn)為插入、更新、刪除數(shù)據(jù)這些操作在你的程序中更為突出的話，那就設(shè)計(jì)一個(gè)規(guī)范化的表否則的話就去創(chuàng)建一個(gè)扁平的、不規(guī)范化的數(shù)據(jù)庫結(jié)構(gòu)。

以下這個(gè)簡單的圖表顯示了像左邊Names和Address這樣的簡單規(guī)范化的表，怎么通過應(yīng)用不規(guī)范化結(jié)構(gòu)來創(chuàng)建一個(gè)扁平的表結(jié)構(gòu)。
規(guī)則 2：將你的數(shù)據(jù)按照邏輯意義分成不同的塊，讓事情做起來更簡單

這個(gè)規(guī)則其實(shí)就是 “三范式” 中的第一范式。違反這條規(guī)則的一個(gè)標(biāo)志就是，你的查詢使用了很多字符串解析函數(shù)
例如 substring、charindex等等。若真如此，那就需要應(yīng)用這條規(guī)則了。

比如你看到的下面圖片上有一個(gè)有學(xué)生名字的表，如果你想要查詢學(xué)生名字中包含“Koirala”，但不包含“Harisingh”的記錄，你可以想象一下你將會(huì)得到什么樣的結(jié)果。

所以更好的做法是將這個(gè)字段拆分為更深層次的邏輯分塊，以便我們的表數(shù)據(jù)寫起來更干凈，以及優(yōu)化查詢。
規(guī)則 3：不要過度使用 “規(guī)則 2”

開發(fā)者都是一群很可愛的生物。如果你告訴他們這是一條解決問題的正路，他們就會(huì)一直這么做下去，做到過了頭導(dǎo)致了一些不必要的后果。這也可以應(yīng)用于我們剛剛在前面提到的規(guī)則2。當(dāng)你考慮字段分解時(shí)，先暫停一下，并且問問你自己是否真的需要這么做。正如所說的，分解應(yīng)該是要符合邏輯的。

例如，你可以看到電話號碼這個(gè)字段，你很少會(huì)把電話號碼的ISD代碼單獨(dú)分開來操作（除非你的應(yīng)用程序要求這么做）。所以一個(gè)很明智的決定就是讓它保持原樣，否則這會(huì)帶來更多的問題。
規(guī)則 4：把重復(fù)、不統(tǒng)一的數(shù)據(jù)當(dāng)成你最大的敵人來對待

集中那些重復(fù)的數(shù)據(jù)然后重構(gòu)它們。我個(gè)人更加擔(dān)心的是這些重復(fù)數(shù)據(jù)帶來的混亂而不是它們占用了多少磁盤空間。

例如下面這個(gè)圖表，你可以看到 "5th Standard" 和 "Fifth standard" 是一樣的意思，它們是重復(fù)數(shù)據(jù)。現(xiàn)在你可能會(huì)說是由于那些錄入者錄入了這些重復(fù)的數(shù)據(jù)或者是差勁的驗(yàn)證程序沒有攔住，讓這些重復(fù)的數(shù)據(jù)進(jìn)入到了你的系統(tǒng)。現(xiàn)在，如果你想導(dǎo)出一份將原本在用戶眼里十分困惑的數(shù)據(jù)顯示為不同實(shí)體數(shù)據(jù)的報(bào)告，該怎么做呢？

解決方法之一是將這些數(shù)據(jù)完整地移到另外一個(gè)主表，然后通過外鍵引用過來。在下面這個(gè)圖表中你可以看到我們是如何創(chuàng)建一個(gè)名為 “Standards”（課程級別）的主表，然后同樣地使用簡單的外鍵連接過去。
規(guī)則 5：當(dāng)心被分隔符分割的數(shù)據(jù)，它們違反了“字段不可再分”

前面的規(guī)則2即“第一范式”說的是避免 “重復(fù)組” 。下面這個(gè)圖表作為其中的一個(gè)例子解釋了 “重復(fù)組”是什么樣子的。如果你仔細(xì)的觀察 syllabus（課程）這個(gè)字段，會(huì)發(fā)現(xiàn)在這一個(gè)字段里實(shí)在是填充了太多的數(shù)據(jù)了。像這些字段就被稱為 “重復(fù)組” 了。如果我們又得必須使用這些數(shù)據(jù)，那么這些查詢將會(huì)十分復(fù)雜并且我也懷疑這些查詢會(huì)有性能問題。

這些被塞滿了分隔符的數(shù)據(jù)列需要特別注意，并且一個(gè)較好的辦法是將這些字段移到另外一個(gè)表中，使用外鍵連接過去，同樣地以便于更好的管理。

那么，讓我們現(xiàn)在就應(yīng)用規(guī)則2（第一范式） “避免重復(fù)組” 吧。你可以看到上面這個(gè)圖表，我創(chuàng)建了一個(gè)單獨(dú)的 syllabus（課程）表，然后使用 “多對多” 關(guān)系將它與 subject（科目）表關(guān)聯(lián)起來。

通過這個(gè)方法，主表（student表）的 syllabus（課程）字段就不再有重復(fù)數(shù)據(jù)和分隔符了。
規(guī)則 6：當(dāng)心那些僅僅部分依賴主鍵的列

留心注意那些僅僅部分依賴主鍵的列。例如上面這個(gè)圖表，我們可以看到這個(gè)表的主鍵是 Roll No.+Standard
。現(xiàn)在請仔細(xì)觀察 syllabus 字段，可以看到 syllabus（課程）字段僅僅關(guān)聯(lián)（依賴） Standard（課程級別）字段而不是直接地關(guān)聯(lián)（依賴）某個(gè)學(xué)生（Roll No. 字段）。

Syllabus（課程）字段關(guān)聯(lián)的是學(xué)生正在學(xué)習(xí)的哪個(gè)課程級別（Standard字段）而不是直接關(guān)聯(lián)到學(xué)生本身。那如果明天我們要更新教學(xué)大綱（課程）的話還要痛苦地為每個(gè)同學(xué)也修改一下，這明顯是不符合邏輯的（不正常的做法）。更有意義的做法是將這些字段從這個(gè)表移到另外一個(gè)表，然后將它們與 Standard（課程級別）表關(guān)聯(lián)起來。

你可以看到我們是如何移動(dòng) syllabus（課程）字段并且同樣地附上 Standard 表。

這條規(guī)則只不過是 “三范式” 里的 “第二范式”：“所有字段都必須完整地依賴主鍵而不是部分依賴”。
規(guī)則 7：仔細(xì)地選擇派生列

如果你正在開發(fā)一個(gè) OLTP 型的應(yīng)用程序，那強(qiáng)制不去使用派生字段會(huì)是一個(gè)很好的思路，除非有迫切的性能要求，比如經(jīng)常需要求和、計(jì)算的 OLAP 程序，為了性能，這些派生字段就有必要存在了。

通過上面的這個(gè)圖表，你可以看到 Average 字段是如何依賴 Marks 和 Subjects 字段的。這也是冗余的一種形式。因此對于這樣的由其他字段得到的字段，需要思考一下它們是否真的有必要存在。

這個(gè)規(guī)則也被稱為 “三范式” 里的第三條：“不應(yīng)該有依賴于非主鍵的列” 。我的個(gè)人看法是不要盲目地運(yùn)用這條規(guī)則，應(yīng)該要看實(shí)際情況，冗余數(shù)據(jù)并不總是壞的。如果冗余數(shù)據(jù)是計(jì)算出來的，看看實(shí)際情況再來決定是否應(yīng)用這第三范式。
規(guī)則 8：如果性能是關(guān)鍵，不要固執(zhí)地去避免冗余

不要把 “避免冗余” 當(dāng)作是一條絕對的規(guī)則去遵循。如果對性能有迫切的需求，考慮一下打破常規(guī)。常規(guī)情況下你需要做多個(gè)表的連接操作，而在非常規(guī)的情況下這樣的多表連接是會(huì)大大地降低性能的。
規(guī)則 9：多維數(shù)據(jù)是各種不同數(shù)據(jù)的聚合

OLAP 項(xiàng)目主要是解決多維數(shù)據(jù)問題。比如你可以看看下面這個(gè)圖表，你會(huì)想拿到每個(gè)國家、每個(gè)顧客、每段時(shí)期的銷售額情況。簡單的說你正在看的銷售額數(shù)據(jù)包含了三個(gè)維度的交叉。

為這種情況做一個(gè)實(shí)際的設(shè)計(jì)是一個(gè)更好的辦法。簡單的說，你可以創(chuàng)建一個(gè)簡單的主要銷售表，它包含了銷售額字段，通過外鍵將其他所有不同維度的表連接起來。
規(guī)則 10：將那些具有“名值表”特點(diǎn)的表統(tǒng)一起來設(shè)計(jì)

很多次我都遇到過這種 “名值表” 。 “名值表” 意味著它有一些鍵，這些鍵被其他數(shù)據(jù)關(guān)聯(lián)著。比如下面這個(gè)圖表，你可以看到我們有 Currency（貨幣型）和 Country（國家）這兩張表。如果你仔細(xì)觀察你會(huì)發(fā)現(xiàn)實(shí)際上這些表都只有鍵和值。

對于這種表，創(chuàng)建一個(gè)主要的表，通過一個(gè) Type（類型）字段來區(qū)分不同的數(shù)據(jù)將會(huì)更有意義。
規(guī)則 11：無限分級結(jié)構(gòu)的數(shù)據(jù)，引用自己的主鍵作為外鍵

我們會(huì)經(jīng)常碰到一些無限父子分級結(jié)構(gòu)的數(shù)據(jù)（樹形結(jié)構(gòu)？）。例如考慮一個(gè)多級銷售方案的情況，一個(gè)銷售人員之下可以有多個(gè)銷售人員。注意到都是 “銷售人員” 。也就是說數(shù)據(jù)本身都是一種。但是層級不同。這時(shí)候我們可以引用自己的主鍵作為外鍵來表達(dá)這種層級關(guān)系，從而達(dá)成目的。

這篇文章的用意不是叫大家不要遵循范式，而是叫大家不要盲目地遵循范式。根據(jù)你的項(xiàng)目性質(zhì)和需要處理的數(shù)據(jù)類型來做出正確的選擇。