http://wiki.mbalib.com/wiki/%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83

正態分布

出自MBA智庫百科(http://wiki.mbalib.com/)

正態分布（normal distribution)

什么是正態分布

　　正態分布是一種概率分布。正態分布是具有兩個參數μ和σ2的連續型隨機變量的分布，第一參數μ是遵從正態分布的隨機變量的均值，第二個參數σ2是此隨機變量的方差，所以正態分布記作N(μ，σ2 )。遵從正態分布的隨機變量的概率規律為取 μ鄰近的值的概率大，而取離μ越遠的值的概率越?。?#963;越小，分布越集中在μ附近，σ越大，分布越分散。正態分布的密度函數的特點是：關于μ對稱，在μ處達到最大值，在正（負）無窮遠處取值為0，在μ±σ處有拐點。它的形狀是中間高兩邊低，圖像是一條位于x 軸上方的鐘形曲線。當μ＝0，σ2 ＝1時，稱為標準正態分布，記為N（0，1）。μ維隨機向量具有類似的概率規律時，稱此隨機向量遵從多維正態分布。多元正態分布有很好的性質，例如，多元正態分布的邊緣分布仍為正態分布，它經任何線性變換得到的隨機向量仍為多維正態分布，特別它的線性組合為一元正態分布。

[編輯]

正態分布的發展

　　正態分布是最重要的一種概率分布。正態分布概念是由德國的數學家和天文學家Moivre于1733年受次提出的，但由于德國數學家Gauss率先將其應用于天文學家研究，故正態分布又叫高斯分布高斯這項工作對后世的影響極大，他使正態分布同時有了“高斯分布”的名稱，后世之所以多將最小二乘法的發明權歸之于他，也是出于這一工作。高斯是一個偉大的數學家，重要的貢獻不勝枚舉。但現今德國10馬克的印有高斯頭像的鈔票，其上還印有正態分布的密度曲線。這傳達了一種想法：在高斯的一切科學貢獻中，其對人類文明影響最大者，就是這一項。在高斯剛作出這個發現之初，也許人們還只能從其理論的簡化上來評價其優越性，其全部影響還不能充分看出來。這要到20世紀正態小樣本理論充分發展起來以后。皮埃爾-西蒙·拉普拉斯很快得知高斯的工作，并馬上將其與他發現的中心極限定理聯系起來，為此，他在即將發表的一篇文章(發表于1810年）上加上了一點補充，指出如若誤差可看成許多量的疊加，根據他的中心極限定理，誤差理應有高斯分布。這是歷史上第一次提到所謂“元誤差學說”——誤差是由大量的、由種種原因產生的元誤差疊加而成。后來到1837年，海根(G.Hagen)在一篇論文中正式提出了這個學說。

　　其實，他提出的形式有相當大的局限性：海根把誤差設想成個數很多的、獨立同分布的“元誤差” 之和，每只取兩值，其概率都是1/2，由此出發，按狄莫佛的中心極限定理，立即就得出誤差(近似地)服從正態分布。皮埃爾-西蒙·拉普拉斯所指出的這一點有重大的意義，在于他給誤差的正態理論一個更自然合理、更令人信服的解釋。因為，高斯的說法有一點循環論證的氣味：由于算術平均是優良的，推出誤差必須服從正態分布；反過來，由后一結論又推出算術平均及最小二乘估計的優良性，故必須認定這二者之一(算術平均的優良性，誤差的正態性) 為出發點。但算術平均到底并沒有自行成立的理由，以它作為理論中一個預設的出發點，終覺有其不足之處。拉普拉斯的理把這斷裂的一環連接起來，使之成為一個和諧的整體，實有著極重大的意義。

[編輯]

正態分布的主要特征

　　1、集中性：正態曲線的高峰位于正中央，即均數所在的位置。

　　2、對稱性：正態曲線以均數為中心，左右對稱，曲線兩端永遠不與橫軸相交。

　　3、均勻變動性：正態曲線由均數所在處開始，分別向左右兩側逐漸均勻下降。

　　4、正態分布有兩個參數，即均數μ和標準差σ，可記作N（μ，σ）：均數μ決定正態曲線的中心位置；標準差σ決定正態曲線的陡峭或扁平程度。σ越小，曲線越陡峭；σ越大，曲線越扁平。

　　5、u變換：為了便于描述和應用，常將正態變量作數據轉換。

[編輯]

正態分布的應用

　　1．估計正態分布資料的頻數分布

　　例1.某地1993年抽樣調查了100名18歲男大學生身高（cm），其均數=172.70cm，標準差s=4.01cm，①估計該地18歲男大學生身高在168cm以下者占該地18歲男大學生總數的百分數；②分別求、、范圍內18歲男大學生占該地18歲男大學生總數的實際百分數，并與理論百分數比較。

　　本例，μ、σ未知但樣本含量n較大，按式（3.1）用樣本均數和標準差S分別代替μ和σ，求得u值，u=(168-172.70)/4.01=-1.17。查附表標準正態曲線下的面積，在表的左側找到-1.1，表的上方找到0.07，兩者相交處為0.1210=12.10%。該地18歲男大學生身高在168cm以下者，約占總數12.10%。其它計算結果見表3.1。

　　表：1100名18歲男大學生身高的實際分布與理論分布

　　2．制定醫學參考值范圍：亦稱醫學正常值范圍。它是指所謂“正常人”的解剖、生理、生化等指標的波動范圍。制定正常值范圍時，首先要確定一批樣本含量足夠大的 “正常人”，所謂“正常人”不是指“健康人”，而是指排除了影響所研究指標的疾病和有關因素的同質人群；其次需根據研究目的和使用要求選定適當的百分界值，如80%，90%，95%和99%，常用95%；根據指標的實際用途確定單側或雙側界值，如白細胞計數過高過低皆屬不正常須確定雙側界值，又如肝功中轉氨酶過高屬不正常須確定單側上界，肺活量過低屬不正常須確定單側下界。另外，還要根據資料的分布特點，選用恰當的計算方法。常用方法有：

　?。?）正態分布法：適用于正態或近似正態分布的資料。

　　雙側界值：單側上界：，或單側下界：

　　（2）對數正態分布法：適用于對數正態分布資料。

　　雙側界值：；單側上界：，或單側下界：。

　　常用u值可根據要求由表3.2查出。

　?。?）百分位數法：常用于偏態分布資料以及資料中一端或兩端無確切數值的資料。

　　雙側界值：P2.5和P97.5；單側上界：P95，或單側下界：P5。

　　表：常用u值表

　　3．正態分布是許多統計方法的理論基礎：如t分布、F分布、分布都是在正態分布的基礎上推導出來的，u檢驗也是以正態分布為基礎的。此外，t分布、二項分布、Poisson分布的極限為正態分布，在一定條件下，可以按正態分布原理來處理。

來自"

如果您認為本條目還有待完善，需要補充新內容或修改錯誤內容，請編輯條目。

-------------------------------------------------------------------------------------

http://baike.baidu.com/view/45379.html?wtp=tt

正態分布

　　normal distribution

　　一種概率分布。正態分布是具有兩個參數μ和σ2的連續型隨機變量的分布，第一參數μ是服從正態分布的隨機變量的均值，第二個參數σ2是此隨機變量的方差，所以正態分布記作N(μ，σ2 )。服從正態分布的隨機變量的概率規律為取與μ鄰近的值的概率大，而取離μ越遠的值的概率越小；σ越小，分布越集中在μ附近，σ越大，分布越分散。正態分布的密度函數的特點是：關于μ對稱，在μ處達到最大值，在正（負）無窮遠處取值為0，在μ±σ處有拐點。它的形狀是中間高兩邊低，圖像是一條位于x軸上方的鐘形曲線。當μ＝0，σ2 ＝1時，稱為標準正態分布，記為N（0，1）。μ維隨機向量具有類似的概率規律時，稱此隨機向量遵從多維正態分布。多元正態分布有很好的性質，例如，多元正態分布的邊緣分布仍為正態分布，它經任何線性變換得到的隨機向量仍為多維正態分布，特別它的線性組合為一元正態分布。

　　正態分布最早由A.棣莫弗在求二項分布的漸近公式中得到。C.F.高斯在研究測量誤差時從另一個角度導出了它。P.S.拉普拉斯和高斯研究了它的性質。

　　生產與科學實驗中很多隨機變量的概率分布都可以近似地用正態分布來描述。例如，在生產條件不變的情況下，產品的強力、抗壓強度、口徑、長度等指標；同一種生物體的身長、體重等指標；同一種種子的重量；測量同一物體的誤差；彈著點沿某一方向的偏差；某個地區的年降水量；以及理想氣體分子的速度分量，等等。一般來說，如果一個量是由許多微小的獨立隨機因素影響的結果，那么就可以認為這個量具有正態分布（見中心極限定理）。從理論上看，正態分布具有很多良好的性質，許多概率分布可以用它來近似；還有一些常用的概率分布是由它直接導出的，例如對數正態分布、t分布、F分布等。

　　正態分布應用最廣泛的連續概率分布，其特征是“鐘”形曲線。

　　from http://www.5yiso.cn

　　(一)正態分布

　　1.正態分布

　　若的密度函數（頻率曲線）為正態函數（曲線）

　　(3-1)

　　則稱服從正態分布，記號～。其中、是兩個不確定常數，是正態分布的參數，不同的、不同的對應不同的正態分布。

　　正態曲線呈鐘型，兩頭低，中間高，左右對稱，曲線與橫軸間的面積總等于1。

　　2．正態分布的特征

　　服從正態分布的變量的頻數分布由、完全決定。

　　(1) 是正態分布的位置參數，描述正態分布的集中趨勢位置。正態分布以為對稱軸，左右完全對稱。正態分布的均數、中位數、眾數相同，均等于。

　　(2) 描述正態分布資料數據分布的離散程度，越大，數據分布越分散，越小，數據分布越集中。也稱為是正態分布的形狀參數，越大，曲線越扁平，反之，越小，曲線越瘦高。

　　(二)標準正態分布

　　1．標準正態分布是一種特殊的正態分布，標準正態分布的μ和σ2為0和1，通常用（或Z）表示服從標準正態分布的變量，記為 Z～N（0，1）。

　　2．標準化變換：此變換有特性：若原分布服從正態分布，則Z=(x-μ)/σ ～ N(0,1) 就服從標準正態分布,通過查標準正態分布表就可以直接計算出原正態分布的概率值。故該變換被稱為標準化變換。

　　3. 標準正態分布表

　　標準正態分布表中列出了標準正態曲線下從-∞到X(當前值）范圍內的面積比例。

　　（三）正態曲線下面積分布

　　1．實際工作中，正態曲線下橫軸上一定區間的面積反映該區間的例數占總例數的百分比，或變量值落在該區間的概率（概率分布）。不同范圍內正態曲線下的面積可用公式3-2計算。

　?。?-2）

　　。

　　2.幾個重要的面積比例

　　軸與正態曲線之間的面積恒等于1。正態曲線下，橫軸區間（μ-σ，μ+σ）內的面積為68.27%，橫軸區間（μ-1.96σ，μ+1.96σ）內的面積為95.00%，橫軸區間（μ-2.58σ，μ+2.58σ）內的面積為99.00%。

　　（四）正態分布的應用

　　某些醫學現象，如同質群體的身高、紅細胞數、血紅蛋白量，以及實驗中的隨機誤差，呈現為正態或近似正態分布；有些指標（變量）雖服從偏態分布，但經數據轉換后的新變量可服從正態或近似正態分布，可按正態分布規律處理。其中經對數轉換后服從正態分布的指標，被稱為服從對數正態分布。

　　1. 估計頻數分布一個服從正態分布的變量只要知道其均數與標準差就可根據公式（3-2）估計任意取值范圍內頻數比例。

　　2. 制定參考值范圍

　?。?）正態分布法適用于服從正態（或近似正態）分布指標以及可以通過轉換后服從正態分布的指標。

　?。?）百分位數法常用于偏態分布的指標。表3-1中兩種方法的單雙側界值都應熟練掌握。

　　表3-1 常用參考值范圍的制定

　　概率

　　（%）正態分布法百分位數法

　　雙側單側雙側單側

　　下限上限下限上限

　　3. 質量控制：為了控制實驗中的測量（或實驗）誤差，常以作為上、下警戒值，以作為上、下控制值。這樣做的依據是：正常情況下測量（或實驗）誤差服從正態分布。

　　4. 正態分布是許多統計方法的理論基礎。檢驗、方差分析、相關和回歸分析等多種統計方法均要求分析的指標服從正態分布。許多統計方法雖然不要求分析指標服從正態分布，但相應的統計量在大樣本時近似正態分布，因而大樣本時這些統計推斷方法也是以正態分布為理論基礎的。

　　from http://www.foodmate.net/lesson/41/3-1.php

　　一、正態分布的概念

　　由表1.1的頻數表資料所繪制的直方圖，圖3.1（1）可以看出，高峰位于中部，左右兩側大致對稱。我們設想，如果觀察例數逐漸增多，組段不斷分細，直方圖頂端的連線就會逐漸形成一條高峰位于中央（均數所在處），兩側逐漸降低且左右對稱，不與橫軸相交的光滑曲線圖3.1（3）。這條曲線稱為頻數曲線或頻率曲線，近似于數學上的正態分布（normal distribution）。由于頻率的總和為100%或1，故該曲線下橫軸上的面積為100%或1。

　　圖3.1頻數分布逐漸接近正態分布示意圖

　　為了應用方便，常對正態分布變量X作變量變換。

　?。?.1）

　　該變換使原來的正態分布轉化為標準正態分布 (standard normal distribution)，亦稱u分布。u被稱為標準正態變量或標準正態離差（standard normal deviate）。

　　二、正態分布的特征：

　　1．正態曲線（normal curve）在橫軸上方均數處最高。

　　2．正態分布以均數為中心，左右對稱。

　　3．正態分布有兩個參數，即均數和標準差。是位置參數，當固定不變時，越大，曲線沿橫軸越向右移動；反之，越小，則曲線沿橫軸越向左移動。是形狀參數，當固定不變時，越大，曲線越平闊；越小，曲線越尖峭。通常用表示均數為，方差為的正態分布。用N（0，1）表示標準正態分布。

　　4．正態曲線下面積的分布有一定規律。

　　實際工作中，常需要了解正態曲線下橫軸上某一區間的面積占總面積的百分數，以便估計該區間的例數占總例數的百分數（頻數分布）或觀察值落在該區間的概率。正態曲線下一定區間的面積可以通過附表1求得。對于正態或近似正態分布的資料，已知均數和標準差，就可對其頻數分布作出概約估計。

　　查附表1應注意：①表中曲線下面積為-∞到u的左側累計面積；②當已知μ、σ和X時先按式（3.1）求得u值，再查表，當μ、σ未知且樣本含量n足夠大時，可用樣本均數和標準差S分別代替μ和σ，按式求得u值，再查表；③曲線下對稱于0的區間面積相等，如區間（-∞，-1.96）與區間（1.96，∞）的面積相等，④曲線下橫軸上的總面積為100%或1。

　　正態分布曲線下有三個區間的面積應用較多，應熟記：①標準正態分布時區間（-1,1）或正態分布時區間（μ-1σ,μ+1σ）的面積占總面積的68.27%；②標準正態分布時區間（-1.96,1.96）或正態分布區間（μ-1.96σ,μ+1.96σ）的面積占總面積的95%；③標準正態分布時區間（-2.58,2.58）或正態分布時區間（μ-2.58σ,μ+2.58σ）的面積占總面積的99%。如圖3.2所示。（μ-3σ）的面積比例為99.74%,(μ-2σ)面積比例為95.44%。

　　圖3.2 正態曲線與標準正態曲線的面積分布

posted on 2009-03-12 23:08 donnie 閱讀(960) 評論(0) 編輯收藏所屬分類: math

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: 正態分布均值方差(Variance)

常用鏈接

留言簿

隨筆分類(66)

隨筆檔案(79)

相冊

收藏夾(11)

搜索

積分與排名

最新隨筆

最新評論

閱讀排行榜

正態分布

出自MBA智庫百科(http://wiki.mbalib.com/)

目錄

什么是正態分布

正態分布的發展

正態分布的主要特征

正態分布的應用

正態分布