6第六章 正態(tài)分布1 體育統(tǒng)計學(xué) 教學(xué)課件
第五章第五章 正態(tài)分布正態(tài)分布第一節(jié)第一節(jié) 正態(tài)分布的概念與性質(zhì)正態(tài)分布的概念與性質(zhì)第二節(jié)第二節(jié) 正態(tài)分布表的使用正態(tài)分布表的使用第三節(jié)第三節(jié) 正態(tài)分布理論在體育中的應(yīng)用正態(tài)分布理論在體育中的應(yīng)用第一節(jié)第一節(jié) 正態(tài)分布的概念與性質(zhì)正態(tài)分布的概念與性質(zhì)一、概念一、概念 正態(tài)分布:正態(tài)分布:靠近均數(shù)分布的頻數(shù)最多,離開均數(shù)越遠,分布的數(shù)據(jù)越少,左右兩側(cè)基本對稱,這種中間多、兩側(cè)逐漸減少的基本對稱的分布即正態(tài)分布。 正態(tài)曲線:正態(tài)曲線:是一條中央高,兩側(cè)逐漸下降,兩端無限延伸,與橫軸相靠而不相交,左右完全對稱的鐘形曲線。從頻數(shù)分布圖從頻數(shù)分布圖到正態(tài)分布圖:到正態(tài)分布圖: 正態(tài)分布的數(shù)學(xué)定義:正態(tài)分布的數(shù)學(xué)定義: 若隨機變量若隨機變量X的概率分布密度函數(shù)是:的概率分布密度函數(shù)是:v位置參數(shù):位置參數(shù): (決定曲線的位置決定曲線的位置)v變異度參數(shù):變異度參數(shù):( 決定曲線的形狀決定曲線的形狀)22221( )12,0,( ,)xf xexXX ()都是常數(shù) 且稱隨機變量服從參數(shù)為 和 的正態(tài)分布 記為。二、正態(tài)曲線(概率密度曲線)的特點:二、正態(tài)曲線(概率密度曲線)的特點:v(1)關(guān)于 對稱。v(2)在 處有最大值,在區(qū)間 上,v (3)曲線下總面積為1。v (4) 決定曲線在橫軸上的位置, 增大,曲線沿橫軸向右移;反之, 曲線沿橫軸向左移。xx(,)( ),( ,),( );,f xf xxx 單調(diào)上升 在單調(diào)下降當(dāng)時 曲線以 軸為漸近線。v(5) 決定曲線的形狀,當(dāng) 恒定時, 越大,數(shù)據(jù)越分散,曲線越“矮胖”; 越小,數(shù)據(jù)越集中,曲線越“瘦高”。習(xí)慣上用N( , 2)表示均數(shù)為 、標(biāo)準(zhǔn)差為 的正態(tài)分布。v下列圖中顯示了不同的均數(shù)和標(biāo)準(zhǔn)差的正態(tài)曲線圖。 不同平均數(shù)和標(biāo)準(zhǔn)差的正態(tài)分布圖不同平均數(shù)和標(biāo)準(zhǔn)差的正態(tài)分布圖 不同標(biāo)準(zhǔn)差的正態(tài)分布圖不同標(biāo)準(zhǔn)差的正態(tài)分布圖三、標(biāo)準(zhǔn)正態(tài)分布三、標(biāo)準(zhǔn)正態(tài)分布v參數(shù)參數(shù) 的正態(tài)分布,稱為標(biāo)準(zhǔn)正態(tài)的正態(tài)分布,稱為標(biāo)準(zhǔn)正態(tài)分布,記為分布,記為 ,則概率分布密度函數(shù),則概率分布密度函數(shù)為:為: 標(biāo)準(zhǔn)正態(tài)分布曲線見標(biāo)準(zhǔn)正態(tài)分布曲線見圖圖7。v非標(biāo)準(zhǔn)正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布的關(guān)系非標(biāo)準(zhǔn)正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布的關(guān)系 對于任一均數(shù)為對于任一均數(shù)為 ,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為 的隨機變量的隨機變量X的的012,(0,1)XN221()2xfxe ( ) 正態(tài)分布,都可以作一個變量代換,將非標(biāo)準(zhǔn)正態(tài)正態(tài)分布,都可以作一個變量代換,將非標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)改造成標(biāo)準(zhǔn)正態(tài)分布的概率密分布的概率密度函數(shù)改造成標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù):度函數(shù): 令令 ,則,則 : 通過變量代換,將(通過變量代換,將(1)式中的平均數(shù)和標(biāo)準(zhǔn)差分)式中的平均數(shù)和標(biāo)準(zhǔn)差分別轉(zhuǎn)換成了別轉(zhuǎn)換成了0和和1。從而達到簡化計算的目的。從而達到簡化計算的目的。xu222221()21()2xufxefue ( )可 寫 為 : ( )01,圖圖7 7 標(biāo)準(zhǔn)正態(tài)曲線標(biāo)準(zhǔn)正態(tài)曲線v 將一般正態(tài)分布轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布,實際上是將原始變量X轉(zhuǎn)換成標(biāo)準(zhǔn)變量U的過程。在此過程中,正態(tài)分布的曲線性質(zhì)并沒有發(fā)生改變。v 在具體研究工作中,通常難以獲得總體均數(shù) 和總體標(biāo)準(zhǔn)差 ,所以在變量標(biāo)準(zhǔn)化時,以樣本均數(shù)和標(biāo)準(zhǔn)差來替代。所以變量標(biāo)準(zhǔn)化的公式變?yōu)椋簒xus第二節(jié)第二節(jié) 正態(tài)分布表的使用正態(tài)分布表的使用v正態(tài)分布表簡況正態(tài)分布表簡況v正態(tài)分布表的使用和計算方法正態(tài)分布表的使用和計算方法正態(tài)分布表簡況正態(tài)分布表簡況v正態(tài)分布表(見附表正態(tài)分布表(見附表1)是在運用正態(tài)分布理)是在運用正態(tài)分布理論解決具體問題時所采用的一種非常有用的論解決具體問題時所采用的一種非常有用的工具。工具。 橫軸變量橫軸變量uv正態(tài)分布表的構(gòu)成正態(tài)分布表的構(gòu)成 350個數(shù)據(jù)個數(shù)據(jù) u變量所對應(yīng)的變量所對應(yīng)的 行值范圍行值范圍 0.00,0.09 列值范圍列值范圍 0. 0,3.40.500,0.9998v由于正態(tài)分布的對稱性,所以附表1中只給出了變量 時的概率值;若要求 的概率值,雖無法直接求得,但可通過正態(tài)分布的對稱性來求。0u 0u 正態(tài)分布表的使用和計算方法正態(tài)分布表的使用和計算方法v根據(jù) 變量的值查出對應(yīng)的的面積(概率)v根據(jù)面積(概率)找出相對應(yīng)的 變量的值。1.求 的面積,其中 。 直接查正態(tài)分布表即可求得。 例1:求 的概率。 在正態(tài)分布表上查到u=2.25處的值為0.9878,即為所求的概率。UU(, )u0u (,2.25)2.求 的面積(概率),其中 。 由于附表1中只有u0時的概率值,所以不能直接求得u為負值時的概率值。但可通過正態(tài)分布的對稱性質(zhì)來求。 例2:求 的概率值。 根據(jù)對稱性, 的概率值(或面積)與(1,+ )的概率值相等。再根據(jù)整個曲線下的概率為1,可用1減去 (, )u0u (, 1) (, 1) (,1) 的概率,即得到所求的概率,見圖8。 ( 1)1(1)10.84130.1587 圖圖8 8v3. 求某個u值以上的面積,見圖9。 例 3:求 的概率。 查表可知 , 所以,所求面積為:圖圖9 91.96,(1.96)0.97501(1.96)0.0254.求兩個正u值所圍成的面積(概率) 例4:求(1.5,2.0)區(qū)間所圍成的面積,見圖10。圖圖1010 所求面積為:5.求兩個負u值所圍成的面積(概率)。例5:求(-2,-1)所圍成的面積(概率),見圖11。(2)(1.5)0.97720.93320.0440圖圖1111 根據(jù)正態(tài)分布的對稱性可知,(-2,-1)區(qū)間的面積與(1,2)區(qū)間的面積相等,所以所求面積為:6.求一個負u值與一個正u值所圍成的面積。 例6:求(-1.55,0.7)區(qū)間的面積(概率),見圖12。(2)(1) 0.9772 0.8413 0.1359圖圖1212所求面積為:7.已知某區(qū)間的面積,求對應(yīng)的u值。例7:已知(-1.45,u)的面積為0.6578,求所對應(yīng)的u值,見圖13。分析(-1.45,0)區(qū)間的面積小于0.5,所以該u值應(yīng)該大于0,故0.6578是-1.45到某一(0.7)( 1.55)(0.7)1(1.55)(0.7)(1.55) 1 0.7580 0.9394 10.6974 正u值所圍成的面積,根據(jù)求某區(qū)間面積的方法,有-1.45uP=0.6578()(1 .4 5 )()(1 .4 5 )1()1(1 .4 5 )puuup所 以 = 0 . 6 5 7 8 + 1 - 0 . 9 2 6 5 = 0 . 7 3 1 3圖圖1313查附表1,得到u值為0.62。 在實際統(tǒng)計工作中,常用到u值及相應(yīng)的面積(概率)見圖14。圖圖 1414習(xí)題v1.求 的面積(概率).v2.求 以及 的面積(概率).v3.求 的面積.v4.求(-1.96,1.96)的概率和P(|z|1.96).v5.求(-2.58,2.58)的面積.v6.求(0.17,1.34)的概率.v7.已知某區(qū)間(-3.02,u)的面積為0.2413,求u?v8.已知某區(qū)間(u,1.55)的面積為0.7340,求u?v9.已知某區(qū)間(u,1.32)的面積為0.3056,求u?(,) (0,)(,0)(, 3.49) 第三節(jié)第三節(jié) 正態(tài)分布理論在體育中的應(yīng)用正態(tài)分布理論在體育中的應(yīng)用一、正態(tài)分布理論在制定考核標(biāo)準(zhǔn)研究中的應(yīng)用一、正態(tài)分布理論在制定考核標(biāo)準(zhǔn)研究中的應(yīng)用二、正態(tài)分布理論在制定離差評價表中的應(yīng)用二、正態(tài)分布理論在制定離差評價表中的應(yīng)用三、正態(tài)分布理論在人數(shù)估計研究中的應(yīng)用三、正態(tài)分布理論在人數(shù)估計研究中的應(yīng)用四、正態(tài)分布理論統(tǒng)一變量單位在綜合評價中的四、正態(tài)分布理論統(tǒng)一變量單位在綜合評價中的應(yīng)用應(yīng)用正態(tài)分布理論在制定考核標(biāo)準(zhǔn)研究中的應(yīng)用正態(tài)分布理論在制定考核標(biāo)準(zhǔn)研究中的應(yīng)用 制定考核標(biāo)準(zhǔn)前應(yīng)獲取建標(biāo)數(shù)據(jù)并求得其平均數(shù)和標(biāo)準(zhǔn)差,確定各等級人數(shù)的百分比。一、制定考核標(biāo)準(zhǔn)的步驟一、制定考核標(biāo)準(zhǔn)的步驟1.制定正態(tài)曲線的分布草圖;2.計算出從 到各ui值所圍成的面積(概率);3. 查表求各等級的ui;4.求各等級標(biāo)準(zhǔn)的原始成績 。ix二、實例二、實例 例1:某地某年120名8歲男孩身高均數(shù)為123.02cm,標(biāo)準(zhǔn)差為4.79cm,試估計(1)該地8歲男孩身高在130cm以上者占該地8歲男孩身高的百分比?(2)身高120cm128cm者占該地8歲男孩總數(shù)的百分比?(3)該地80%的男孩身高集中在哪個范圍?解(1)已知 所以查附表1,可知u所對應(yīng)的概率為0.9279,所以身高在130以上者所占概率為1-0.9279,即7.21%。 (2) 即求(-0.63,1.04)區(qū)間的面積。查表求得概率(面積)為:0.5865130,123.02,4.79xcm xcm scm130123.021.464.79xxus11221 2 01 2 3 .0 20 .6 34 .7 91 2 81 2 3 .0 21 .0 44 .7 9xxusxxus (3)已知概率p=0.80,求x值。 根據(jù)正態(tài)曲線下面積為1以及分布的對稱性,所以可知區(qū)間 的概率為0.9,而區(qū)間 的面積為0.1,所以通過查表知 同理,求得 故所求的區(qū)間為(117.39,128.65)。11(,),uu為負值2(,)u121.28,1.28uu 1111123.02,1.284.79117.39xxxusx 所以有: 2128.65x正態(tài)分布理論在制定離差評價表中的應(yīng)用正態(tài)分布理論在制定離差評價表中的應(yīng)用一、制定離差評價表的步驟:一、制定離差評價表的步驟:1.根據(jù)指標(biāo)總數(shù)畫好框表;2.將各指標(biāo)的平均數(shù) 填入框表中表示均數(shù)的登記線與各指標(biāo)線的交叉處;3.計算各指標(biāo)的 或 并填在各指標(biāo)線與各等級線交叉處。4.將各個體不同時期各指標(biāo)值分別填在表中。ix2iiixsxs和0.51.5iiixsxs和二、舉例 中國隊七場比賽中技術(shù)統(tǒng)計平均為:總得分63,其中2分球得分28.7分、命中率為33%,3分球得分18.5、命中率28.1%,罰球14.8分、命中率為72.5%,籃板總數(shù)為:33.3個,其中前場籃板10.3個、后場籃板23個,助攻8.7次,失誤18次,搶斷3.3次,蓋帽1次,犯規(guī)19次,被侵犯20.3次。以對手的各項技術(shù)得分作為比較標(biāo)準(zhǔn),根據(jù)該數(shù)據(jù)所作的離差評價表如下: 男籃整體與對手在比賽能力上的比較男籃整體與對手在比賽能力上的比較 三、正態(tài)分布理論在人數(shù)估計研究中的應(yīng)用三、正態(tài)分布理論在人數(shù)估計研究中的應(yīng)用估計人數(shù)的步驟:估計人數(shù)的步驟:v作一個正態(tài)分布草圖,以確定估計范圍;v計算估計范圍的 值;v查表找到估計范圍的面積(概率);v計算估計范圍的人數(shù)。例3:已測得某大學(xué)女生的仰臥起坐成績的平均數(shù)為34個,標(biāo)準(zhǔn)差為3個,原始變量基本呈正態(tài)分布,該學(xué)校的女生共3000人,現(xiàn)要分別估計仰臥起坐成績在40個以上、37個到40個、33個到37個,28到33個,28個以下的人數(shù)。iu第一步:作正態(tài)分布草圖(見圖15)。圖圖 1515第二步:求各區(qū)間的 值。 在查表前,要將原始的一般正態(tài)分布改造成標(biāo)準(zhǔn)正態(tài)分布。根據(jù)改造公式,可求得:所以要估計的5個區(qū)間分別為:iu1212343428 3433 342,0.333337 3440 341,2,33xxxxuussxxxxuuss(, 2), 2, 0.33),0.33,1),1,2),2,) 第三步:根據(jù)各 值求各區(qū)間的面積(概率)。 查正態(tài)分布表,可知: 所圍成的面積為:0.0228 所圍成的面積為:0.3479, 所圍成的面積為:0.4706, 所圍成的面積為:0.1359, 所圍成的面積為:0.0228第四步:求各區(qū)間的人數(shù)。40個以上的人數(shù)=3000 x0.0228=68人, iu(,2) 0.33,1) 2, 0.33) 1 , 2 )2,) 37個到40個的人數(shù)=3000 x0.1359=408人; 33個至37個的人數(shù)=3000 x0.4706=1412人; 28個至33個的人數(shù)=3000 x0.3479=1044人; 28個以下的人數(shù)=3000 x0.0228=68人。四、正態(tài)分布理論統(tǒng)一變量單位在綜合評價中正態(tài)分布理論統(tǒng)一變量單位在綜合評價中的應(yīng)用的應(yīng)用(一一) 綜合評價模型綜合評價模型 綜合型評價模型是指根據(jù)一定的目的,采用合理的方法,從多角度(或多因素)衡量被判別事物的價值和水平的過程。 1.平均型綜合評價模型平均型綜合評價模型 該模型對被判別事物的所有構(gòu)成指標(biāo)的得分平均,得到綜合評價值W,其數(shù)學(xué)模型為: 2.加權(quán)平均型綜合評價模型 該模型是將被判別事物所有的評價指標(biāo)的得分與其各自權(quán)重乘積的和作為綜合評價值W。 其數(shù)學(xué)模型為:1/ ,(1,2, )niiiWx nWnxin式中為綜合評價值 為評價指標(biāo)的個數(shù)為各評價指標(biāo)的數(shù)值。11(1)nniiiiiWk xkki式 中為 各 評 價 指 標(biāo) 的 權(quán) 重 。例:已知一群跳遠運動員的4個指標(biāo)為:跳遠成績 縱跳 ?,F(xiàn)有兩名運動員的上述4項指標(biāo)水平為4項指標(biāo)的權(quán)重為:用加權(quán)平均型綜合模型評價兩運動員的能力。1126.1,0.12;302.9 ,xm smxs米跑23340.1 ;80,3;100ssxcm scmxkg縱跳大腿力量44skg123412346.3,2.8 ,84,1056.4,2.7 ,83,95xm xs xcm xkgxm xs xcm xkg甲;乙。12340.3,0.3,0.2,0.2,kkkk(二)幾種統(tǒng)一變量單位的方法(二)幾種統(tǒng)一變量單位的方法 U分法 等距升分 Z分法 累進記分法 不等距升分 百分位數(shù)法 變量非正態(tài)分布 1.U分法分法 將原始變量轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布的橫軸變量的方法。計算公式為: 2.Z分法分法 計算公式為: “+” 在變量水平高數(shù)值也大時用,“-” 在變量水平低而數(shù)值大時用。xxus501005010066uxxZs3.累進記分法 累進記分的分數(shù)與運動成績提高的難度相適應(yīng),其計算公式為: D變量的轉(zhuǎn)換公式為:2kykDZZD為難度系數(shù), 為變量, 為常數(shù)。55,55xxDuSxxDuS( 適 用 于 田 賽 項 目 )( 適,用 于 徑 賽 項 目 )例(累進記分方法):某班跳遠成績 求5.4m和5.7m的原始數(shù)據(jù)的累進分數(shù)。15.5 ,0.12.82.8100 xm smxsxs,若以為起分點(0分),為滿分點(分),v求解起分點和滿分點對應(yīng)的D值。v建立累進記分方程。 v求解原始分數(shù)的D值。 11125.45.55540.15.75.55570.1xxDSxxDS2202.21007.8kZkZ21.798.66yDv求累進記分值。v累進記分法的計算步驟:1.用公式求解起、滿分點對應(yīng)的D值;2.求解方程組,k和z值,即得累進記分方程。3.用公式求原始分數(shù)的D值。4.根據(jù)累進記分方程求累進記分值。21221.7948.6619.981.7978.6679.05yy111255xxDSxxDS4.百分位數(shù)法百分位數(shù)法百分位數(shù)法計算公式為:100iixxn(組下限)組內(nèi)數(shù)組前累計頻數(shù)組距成績百分位數(shù)本章重點v標(biāo)準(zhǔn)正態(tài)分布的性質(zhì)及轉(zhuǎn)換過程。標(biāo)準(zhǔn)正態(tài)分布的性質(zhì)及轉(zhuǎn)換過程。v正態(tài)分布表的使用和計算正態(tài)分布表的使用和計算v正態(tài)分布理論統(tǒng)一變量單位在綜合評價正態(tài)分布理論統(tǒng)一變量單位在綜合評價中應(yīng)用。中應(yīng)用。v問:如果我得出一個概率為P(|z|2) 我該怎樣去查正態(tài)分布表?v答:不妨設(shè)隨機變量Z服從正態(tài)分布N(a,b),a是其均值,b是其方差。 令Z=(Z-a)/sqrt(b),其中sqrt()為開方。 這樣,Z就變成了服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)的隨機變量。 舉倆例子吧。 例一、Z服從N(0,1)。求P(|Z|2)。 由于Z已經(jīng)服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),那么Z=Z,不必轉(zhuǎn)化了。 P(|Z|2)=P(Z2)+P(Z=-2) =2*P(Z2) =2*(1-P(Z=2) v查表可知,P(Z=2)=0.9772,所以P(|Z|2)=0.0456。 注意:所謂的正態(tài)分布表都是標(biāo)準(zhǔn)正態(tài)分布表(N(0,1),通過查找實數(shù)x的位置,從而得到P(Z=x)。表的縱向代表x的整數(shù)部分和小數(shù)點后第一位,橫向代表x的小數(shù)點后第二位,然后就找到了x的位置。比如這個例子,縱向找2.0,橫向找0,就找到了2.00的位置,查出0.9772。 例二、Z服從N(5,9),求P(Z11)+P(Z=-1)。 令Z=(Z-5)/3,Z服從N(0,1) 做轉(zhuǎn)化P(Z11)+P(Z=-1)=P(|Z-5|6) =P(|Z|2) 到此,你可能也看出來了,通過轉(zhuǎn)化,例二和例一實際是一樣的。剩下的計算,請你在不看例一解答的情況下,自己做一遍吧。加深印象,呵呵。 v謝謝3樓的兄弟,謝謝你! 不過還有點沒明白,就是: 查表可知,P(Z=2)=0.9772,所以P(|Z|2)=0.0456。 為什么?0.0456是怎么得出來得呢? = 前面已經(jīng)推導(dǎo)出 P(|Z|2)=P(Z2)+P(Z=-2) =2*P(Z2) =2*(1-P(Z=2) 代入P(Z=2)=0.9772 算出P(|Z|2)=2*(1-0.9772)=0.0456v如果分布函數(shù)是標(biāo)準(zhǔn)正態(tài)分布的話,直接查表就可以了. 標(biāo)準(zhǔn)正態(tài)分布圖關(guān)于y軸對稱。 P(|z|2)=2*1-P(z=2) P(z=2)就是表中2對應(yīng)的值 如果不是標(biāo)準(zhǔn)正態(tài)分布,首先你要知道這個正態(tài)分布的分布函數(shù),也就是知道它的均值和方差,然后把它劃為標(biāo)準(zhǔn)正態(tài)分布。 v如果z服從分布N(,),那么查P(z=2)就要換成標(biāo)準(zhǔn)正態(tài)分布,(z-)/,查表可得所求值. 分析:題中所列各項目的單位并不相同,所以首先需要將其標(biāo)準(zhǔn)化,可采用U分法或Z分法將各項目的單位統(tǒng)一。 本題采用U分法統(tǒng)一單位: 可得到甲乙兩運動員的U分各為: 甲: U1=5/3,U2=-1,U3=4/3,U4=5/4; 乙: U1=5/2,U2=-2,U3=1,U4=-5/4;各指標(biāo)的權(quán)重系數(shù)為:0.3,0.3,0.2,0.2xxUs又由加權(quán)平均型綜合評價模型的數(shù)學(xué)公式為:又由加權(quán)平均型綜合評價模型的數(shù)學(xué)公式為: 15/30.3( 1)0.34/30.25/ 40.25/30.3( 2)0.31 0.2( 5/ 4)0.2niiiWk xWW 甲乙所以,甲、乙及整體的綜合能力為: =0.71 =0.1 從W值可一看出,甲優(yōu)于乙,盡管乙運動員前兩項指標(biāo)上要優(yōu)于甲,而且優(yōu)于整體水平,乙的綜合能力低于整體水平。 在學(xué)完本節(jié)后,請用Z分法統(tǒng)一變量單位再做一遍,看結(jié)論是否相同?