田間試驗(yàn)與統(tǒng)計(jì)方法第四章理論分布和抽樣分布.ppt

上傳人:max****ui 文檔編號(hào):14925051 上傳時(shí)間:2020-08-01 格式:PPT 頁(yè)數(shù):87 大小:694.50KB
收藏 版權(quán)申訴 舉報(bào) 下載
田間試驗(yàn)與統(tǒng)計(jì)方法第四章理論分布和抽樣分布.ppt_第1頁(yè)
第1頁(yè) / 共87頁(yè)
田間試驗(yàn)與統(tǒng)計(jì)方法第四章理論分布和抽樣分布.ppt_第2頁(yè)
第2頁(yè) / 共87頁(yè)
田間試驗(yàn)與統(tǒng)計(jì)方法第四章理論分布和抽樣分布.ppt_第3頁(yè)
第3頁(yè) / 共87頁(yè)

下載文檔到電腦,查找使用更方便

14.9 積分

下載資源

還剩頁(yè)未讀,繼續(xù)閱讀

資源描述:

《田間試驗(yàn)與統(tǒng)計(jì)方法第四章理論分布和抽樣分布.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《田間試驗(yàn)與統(tǒng)計(jì)方法第四章理論分布和抽樣分布.ppt(87頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

1、,第四章 理論分布與抽樣分布,第一節(jié) 事件與概率 第二節(jié) 概率分布 第三節(jié) 二項(xiàng)式分布 第四節(jié) 正態(tài)分布 第五節(jié) 抽樣分布,一、事 件 (一)必然現(xiàn)象與隨機(jī)現(xiàn)象,必然現(xiàn)象(inevitable phenomena)或確定性現(xiàn)象(definite phenomena): 結(jié)果可預(yù)言,確定的,必然的,可重復(fù) 例,標(biāo)準(zhǔn)大氣壓下,水加熱到100C必然沸騰 隨機(jī)現(xiàn)象(random phenomena )或不確定性現(xiàn)象(indefinite phenomena): 結(jié)果事前不可預(yù)言,呈偶然性、不確定性 例,種子發(fā)芽,拋硬幣,隨機(jī)現(xiàn)象或不確定性現(xiàn)象,有如下特點(diǎn): (1)在一定的條

2、件實(shí)現(xiàn)時(shí),有多種可能的結(jié)果發(fā)生,事前人們不能預(yù)言將出現(xiàn)哪種結(jié)果;對(duì)一次或少數(shù)幾次觀察或試驗(yàn)而言,其結(jié)果呈現(xiàn)偶然性、不確定性; (2) 但在相同條件下進(jìn)行大量重復(fù)試驗(yàn)時(shí),其試驗(yàn)結(jié)果卻呈現(xiàn)出某種固有的特定的規(guī)律性頻率的穩(wěn)定性,通常稱之為隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。,(二)隨機(jī)試驗(yàn)與隨機(jī)事件 1、隨機(jī)試驗(yàn) 通常我們把根據(jù)某一研究目的 , 在一定條件下對(duì)自然現(xiàn)象所進(jìn)行的觀察或試驗(yàn)統(tǒng)稱為試驗(yàn)(trial)。 而一個(gè)試驗(yàn)如果滿足下述三個(gè)特性 , 則 稱 其 為 一個(gè) 隨機(jī)試驗(yàn)(random trial),簡(jiǎn)稱試驗(yàn):,(1)試驗(yàn)可以在相同條件下多次重復(fù)進(jìn)行; (2)每次試驗(yàn)的可能結(jié)果不止一個(gè) ,并且事先知道會(huì)

3、有哪些可能的結(jié)果; (3)每次 試驗(yàn)總是恰好出現(xiàn)這些可能結(jié)果中的一個(gè) ,但在一次試驗(yàn)之前卻不能肯定這次試驗(yàn)會(huì)出現(xiàn)哪一個(gè)結(jié)果。 例如小麥發(fā)芽試驗(yàn),拋硬幣。,2、隨機(jī)事件 隨機(jī)試驗(yàn)的每一種可能結(jié)果,在一定條件下可 能 發(fā) 生 ,也 可 能 不 發(fā)生,稱為隨機(jī)事件(random event),簡(jiǎn)稱 事 件(event),通常用A、B、C等來(lái)表示。 (1)基本事件 我 們 把 不 能 再 分的事件稱為基本事件(elementary event) , 也 稱 為 樣本點(diǎn)(sample point)。,例如,在編號(hào)為1、2、3、、20 的數(shù)字中隨機(jī)抽取1個(gè),有20種不同的可能結(jié)果: “

4、取 得 一 個(gè) 編 號(hào) 是 1” 、 “ 取得一個(gè)編號(hào)是2”、、“取得一個(gè)編號(hào)是10”,這10個(gè)事件都是不可能再分的事件,它們都是基本事件。 由若干個(gè)基本事件組合而成的事件稱為 復(fù)合事件 (compound event)。 如 “取得一個(gè)編號(hào)是 2的倍數(shù)”是一個(gè)復(fù)合事件,它由 “ 取得一個(gè)編號(hào)是2 ”、 “ 是4”、“是6、“是8”“是20” 10個(gè)基本事件組合而成。,(2)必然事件 我們把在一定條件下必然會(huì)發(fā)生的事件稱為必然事件(certain event),用表示。其概率為1 例如,標(biāo)準(zhǔn)大氣壓下,水加熱到100C必然沸騰,就是一個(gè)必然事件。,(3)不可能事件 我們把在一定條件下不

5、可能發(fā)生的事件稱為不可能事件(impossible event),用表示。其概率為0 例,沒(méi)有生活能力的種子播種后會(huì)出苗,就是一個(gè)不可能事件。 必然事件與不可能事件實(shí)際上是確定性現(xiàn)象,即它們不是隨機(jī)事件, 但 是 為了方便起見(jiàn),我們把它們看作為兩個(gè)特殊的隨機(jī)事件。,,,積事件AB,和事件A+B,A,B,,A,B,互斥事件,對(duì)立事件,A+B, “或A發(fā)生,或B發(fā)生”。,AB, “A和B同時(shí)發(fā)生或相繼發(fā)生”,AB=V,事件A和B互斥或互不相容,A+B=U,AB=V,事件B為事件A的對(duì)立事件,并記B為,事件間的關(guān)系,二 、 概 率 研究隨機(jī)試驗(yàn),僅知道可能發(fā)生哪些隨機(jī)事件是不夠的,還需了解各種隨機(jī)

6、事件發(fā)生的可能性大小,以揭示這些事件的內(nèi)在的統(tǒng)計(jì)規(guī)律性,從而指導(dǎo)實(shí)踐。 這就要求有一個(gè)能夠刻劃事件發(fā)生可能性大小的數(shù)量指標(biāo),這指標(biāo)應(yīng)該是事件本身所固有的,且不隨人的主觀意志而改變,人們稱之為概率(probability)。 事件A的概率記為P(A)。,(一)概率的統(tǒng)計(jì)定義,思考:投擲一枚硬幣,出現(xiàn)正面的概率是多大?(0表示反面,1表示正面)反復(fù)做它,那么所有出現(xiàn)正面的結(jié)果平均值是多少?,英國(guó)數(shù)學(xué)家皮爾遜做24000次拋硬幣試驗(yàn) 正面向上12012次 頻率 = 隨著試驗(yàn)次數(shù)的增多,正面朝上的頻率越來(lái)越接近0.5.,二、概率,例,,表 在相同條件下盲蝽象在某棉田危害程度的調(diào)查結(jié)果,,調(diào)查株數(shù)

7、n較多時(shí)的穩(wěn)定頻率才能較好地代表棉株受害的可能性,,統(tǒng)計(jì)學(xué)上用n較大時(shí)穩(wěn)定的p近似代表概率。通過(guò)大量實(shí)驗(yàn)而估計(jì)的概率稱為實(shí)驗(yàn)概率或統(tǒng)計(jì)概率,以 表示。 此處P代表概率,P(A)代表事件A的概率,P(A)變化的范圍為01,即0P(A)1。,,(二) 概率的古典定義,概率的統(tǒng)計(jì)定義是在大量的試驗(yàn)中以頻率的穩(wěn)定性為基礎(chǔ)上提出來(lái)的。 不需要做試驗(yàn),根據(jù)隨機(jī)事件本身的特性就可以確定事件出現(xiàn)的概率,稱為古典概率。 古典概型必須滿足以下條件: 隨機(jī)試驗(yàn)的全部可能結(jié)果(基本事件數(shù))是有限的; 各基本事件間是互不相容且發(fā)生是等可能的。 定義: P(A)m / n m為事件A中所包含的基本事件數(shù)

8、 n為基本事件總數(shù)。,例,在1、2、3、20這20個(gè)數(shù)字中隨機(jī)抽取1個(gè),求下列事件的概率 (1)A“抽得1個(gè)數(shù)字小于5” (2)B=“抽得1個(gè)數(shù)字是2的倍數(shù)”,,小概率事件----隨機(jī)事件的概率表示隨機(jī)事件在試驗(yàn)中出現(xiàn)的可能性大小。隨機(jī)事件的概率很小如,小于0.05或0.01或0.001 小概率原理----統(tǒng)計(jì)學(xué)上,把小概率事件在一次試驗(yàn)中看成是實(shí)際不可能發(fā)生的事件,稱為小概率事件實(shí)際不可能性原理,簡(jiǎn)稱小概率原理。 這里的0.05或0.01稱為小概率標(biāo)準(zhǔn),農(nóng)業(yè)試驗(yàn)研究中通常使用這兩個(gè)小概率標(biāo)準(zhǔn)。 小概率事件實(shí)際不可能性原理是統(tǒng)計(jì)學(xué)上進(jìn)行假設(shè)檢驗(yàn)(顯著性檢驗(yàn))的基本依據(jù)。,,(三) 小概率

9、事件實(shí)際不可能性原理,概率是事件在試驗(yàn)結(jié)果中出現(xiàn)可能性大小的定量計(jì)量。它是度量隨機(jī)事件發(fā)生的可能性的統(tǒng)計(jì)學(xué)指標(biāo)。 是事件固有的屬性,有以下明顯的性質(zhì): 隨機(jī)事件A的概率:0P(A)1 必然事件W的概率為1,即P(W)=1 不可能事件(V)的概率為0,即P(V)=0 概率接近于0(如P<0.05)的事件稱為小概率事件。,(四) 概率的性質(zhì),第二節(jié) 概率分布 (probability distribution),一、隨機(jī)變量 二、概率分布,一、隨機(jī)變量(random variable),隨機(jī)變量是指隨機(jī)變數(shù)所取的某一個(gè)實(shí)數(shù)值。表示隨機(jī)現(xiàn)象結(jié)果的變量,也就是在隨機(jī)試驗(yàn)中被測(cè)定的量,所取得的值稱為

10、觀察值。,例1:拋硬幣試驗(yàn),兩種結(jié)果: 用數(shù)“1”表示“幣值面向上”, “0”表示“國(guó)徽面向上” 把 0,1作為變量y的取值 可以簡(jiǎn)單地把拋硬幣試驗(yàn)用取值為0,1的變量來(lái)表示: P(y=1)=0.5,P(y=0)=0.5,例2:用“1”表示“能發(fā)芽種子”,其概率為p;用“0”表示“不能發(fā)芽種子”,其概率為q。 顯然 p+q=1, 則 P(y=1)=p,P(y=0)=q=1p。,例3:用變量y表示水稻產(chǎn)量,若y大于500kg的概率為0.25,大于300kg且等于小于500kg的概率為0.65,等于小于300kg的概率為0.1。 則用變量y的取值范圍來(lái)表示的試驗(yàn)結(jié)果為

11、 P(y300)=0.10, P(300y500)=0.65, P(y500)=0.25。,,(與我們前面所講的連續(xù)型數(shù)據(jù)和離散型數(shù)據(jù)的意義一樣),(一) 離散型隨機(jī)變量 ----當(dāng)試驗(yàn)只有幾個(gè)確定的結(jié)果,并可一一列出,變量y的取值可用實(shí)數(shù)表示,且y取某一值時(shí),其概率是確定的,這種類型的變量稱為離散型隨機(jī)變量。 將這種變量的所有可能取值及其對(duì)應(yīng)概率一一列出所形成的分布稱為離散型隨機(jī)變量的概率分布:,概率,也可用函數(shù)f(y)表述,稱為概率函數(shù)。,,前面例1、例2中的y就是離散型隨機(jī)變量,將其可能取值與對(duì)應(yīng)概率一一列出,即為:,常用概率分布表或概率分布圖表示,圖

12、 離散型隨機(jī)變量概率分布圖,表 離散型隨機(jī)變量的概率分布表,離散型變量概率的分布函數(shù):離散型變量概率的向上累積。其公式為 ,即隨機(jī)變量小于等于某一可能值(x0)的概率。,離散型概率分布的例子,例:從100件產(chǎn)品(其中合格品95件,廢品5件)中任取10件, 求每次抽到廢品數(shù)的概率分布。,概率分布表,累積概率分布表,,(二)連續(xù)型隨機(jī)變量(continuous random variate) ---- 對(duì)于隨機(jī)變量,若存在非負(fù)可積函數(shù)f(y)(y),對(duì)任意a和b (ab)都有P(ayb)= , 則 稱y為連續(xù)型隨機(jī)變量(continuous random

13、 variate), f(y)稱為y的概率密度函數(shù)(probability density function)或分布密度(distribution density)。,上述例3中的y就是一個(gè)連續(xù)型隨機(jī)變量。,概率密度的圖形f (x),稱為分布曲線。,概率是曲線下面積!,,,概率密度曲線f (x)與x軸所圍成的面積為,1,分布函數(shù)(或稱為累積分布函數(shù))是隨機(jī)變量X取得小于x0的值的概率,概率密度函數(shù)圖和概率分布函數(shù)圖,,概率密度函數(shù)圖 概率分布函數(shù)圖 或 或 概率分布曲線 累積分布函數(shù)圖,,,,,,yp(x) yF(x),

14、x1,x2,x2,x1,P(x1

15、黃色和青色, 調(diào)查棉田危害分為受害株和不受害株等等。 通常將二項(xiàng)總體中的“此”事件以變量“1”表示,具概率p; 將“彼”事件以變量“0”表示,具概率q。 因而二項(xiàng)總體又稱為0、1總體,其概率則顯然有:p+q=1,如果從二項(xiàng)總體進(jìn)行n次重復(fù)抽樣,設(shè)出現(xiàn)“此”的次數(shù)為y,那么y的取值可能為0、1、2、、n,共有n+1種可能取值,這n+1種取值各有其概率,因而由變量y及其概率就構(gòu)成了一個(gè)分布,這個(gè)分布叫做二項(xiàng)式概率分布, 簡(jiǎn)稱二項(xiàng)分布( binomial distribution )。B(n,p),二項(xiàng)總體的抽樣試驗(yàn)具有重復(fù)性和獨(dú)立性 重復(fù)性是指每次試驗(yàn)條件不變,即在每次試驗(yàn)中“此”事件出現(xiàn)的概率

16、皆為p 獨(dú)立性是指任何一次試驗(yàn)中“此”事件的出現(xiàn)與其余各次試驗(yàn)中出現(xiàn)何種結(jié)果無(wú)關(guān),二、二項(xiàng)式分布的概率計(jì)算方法,數(shù)學(xué)上的組合公式為:,二項(xiàng)式中包含兩項(xiàng),這兩項(xiàng)的概率為p、q,并且p+q=1,可推知變量y的概率函數(shù)為:,,,,累積函數(shù)F(y):變量小于等于y的所有可能取值的概率之和,,理論次數(shù):對(duì)于任意y,理論次數(shù)=nP(y),這一分布律也稱貝努里( Bernoulli )分布,并有,,,的泰勒展開(kāi)式為:,可以看到,上式右邊的每一項(xiàng)即為二項(xiàng)分布中變量y 取0、1、2、、n時(shí)的概率,又p+q=1,從而 (p+q)n=1,例4.1 棉田盲危害的統(tǒng)計(jì)概率乃從調(diào)查2000株后獲得近似值p=0.35。現(xiàn)受

17、害株事件為A,其概率為p=0.35,未受害株事件為對(duì)立事件,其概率q=(10.35)=0.65。,如調(diào)查5株為一個(gè)抽樣單位,即n=5,則受害株數(shù)y=0,1,2,3,4和5的概率可以計(jì)算出來(lái),,,,如果每次抽5個(gè)單株,抽n=400次,則理論上我們能夠得到y(tǒng)=2的次數(shù)應(yīng)為: 理論次數(shù)=400P(2)=4000.3364=134.56(次),和其累計(jì)函數(shù),表4.2 調(diào)查單位為5株的概率分布表(p=0.35,q=0.65),,,,,,,,,,,,,,,,,受害株數(shù)(y) 受害株數(shù)(y),圖4.1 棉株受危害的概率分布圖 (p=0.35,n=5),圖4.2 棉株受危害的累積概率函

18、數(shù)圖 (p=0.35,n=5),三、二項(xiàng)式分布的形狀和參數(shù),如p=q,二項(xiàng)式分布呈對(duì)稱形狀,如pq,則表現(xiàn)偏斜形狀,受害株數(shù)( y),受害株數(shù)(y),圖4.1 棉株受盲蝽象為害的概率分布圖(p=0.35,n=5),二項(xiàng)式分布的參數(shù),,平均數(shù)、方差和標(biāo)準(zhǔn)差如下式,,,,上述棉田受害率調(diào)查結(jié)果,n=5,p=0.35,可求得總體參數(shù)為: =50.35=1.75株, 株。,,,,四、多項(xiàng)式分布,所謂多項(xiàng)總體,是指將變數(shù)資料分為3類或多類的總體。,例如在給某一人群使用一種新藥,可能有的療效好,有的沒(méi)有療效,而另有療效為副作用的,就是三項(xiàng)分布。,多項(xiàng)總體的隨機(jī)變量的概率

19、分布即為多項(xiàng)式分布(multinomial distribution)。,五、泊松分布二項(xiàng)分布的一種極限分布 ( Poisson distribution ),二項(xiàng)分布中往往會(huì)遇到一個(gè)概率p或q是很小的值,例如小于0.1,另一方面n又相當(dāng)大,這樣的二項(xiàng)分布必將為另一種分布所接近,或者為一種極限分布。這一種分布稱泊松概率分布,簡(jiǎn)稱泊松分布。,令np=m,則泊松分布如下式:,,y=0,1,2,,,泊松分布的平均數(shù) 、方差 和標(biāo)準(zhǔn)差 如下式:,,,,m的大小決定其分布形狀。當(dāng)m值小時(shí)分布呈很偏斜形狀,m增大后則逐漸對(duì)稱。,,第四節(jié) 正態(tài)分布,一、二項(xiàng)分布的極限正態(tài)分布 二、正態(tài)分

20、布曲線的特性 三、計(jì)算正態(tài)分布曲線區(qū)間面積或概率的方法,研究正態(tài)分布的意義: 客觀世界的許多現(xiàn)象的數(shù)據(jù)是服從正態(tài)分布規(guī)律的。 在適當(dāng)條件下,正態(tài)分布可以用來(lái)作二項(xiàng)分布及其它間斷性變數(shù)或連續(xù)性變數(shù)分布的近似分布。 雖然某些總體不作正態(tài)分布,但從總體中隨機(jī)抽出的樣本平均數(shù)及其它一些統(tǒng)計(jì)數(shù)的分布,在樣本容量適當(dāng)大時(shí)仍然趨于正態(tài)分布。,正態(tài)分布,一、二項(xiàng)分布的極限正態(tài)分布,以上述二項(xiàng)分布棉株受害率為例,假定受害概率p=1/2,那么,p=q=1/2?,F(xiàn)假定每個(gè)抽樣單位包括20株,這樣將有21個(gè)組,其受害株的概率函數(shù)為,,,,,,,于是概率分布計(jì)算如下:,現(xiàn)將這概率分布繪于圖4.5。從圖4.5看出它是對(duì)稱

21、的,分布的平均數(shù) 和方差 為:,=npq=20(1/2)(1/2)=5(株)2 。,=np=20(1/2)=10(株),,,如p=q,不論n值大或小,二項(xiàng)分布的多邊形圖必形成對(duì)稱; 如pq,而n很大時(shí),這多邊形仍趨對(duì)稱。,可以推導(dǎo)出正態(tài)分布的概率密度函數(shù)為:,,(49),其中,y是所研究的變數(shù); 是概率密度函數(shù);,,,和 為總體參數(shù), 表示所研究總體平均數(shù), 表示所研究總體標(biāo)準(zhǔn)差,,參數(shù) 和 有如下的數(shù)學(xué)表述,(410),令 可將(49)式標(biāo)準(zhǔn)化為:,,(411),上式稱為標(biāo)準(zhǔn)化正態(tài)分布方程,它是參數(shù) 時(shí)的正態(tài)分布(圖4.7)。記作N(0,1)。,,正態(tài)分布的曲線圖,,

22、,-3 -2 -1 0 1 2 3,圖4.6 正態(tài)分布曲線圖 (平均數(shù)為 ,標(biāo)準(zhǔn)差為 ),,,圖4.7 標(biāo)準(zhǔn)正態(tài)分布曲線圖 (平均數(shù) 為0,標(biāo)準(zhǔn)差 為1),二、正態(tài)分布曲線的特點(diǎn): 曲線以平均數(shù)為對(duì)稱軸,左右對(duì)稱; 算術(shù)平均數(shù)、中數(shù)、眾數(shù)三位合一; 正態(tài)分布曲線是以平均數(shù)和標(biāo)準(zhǔn)差的不同而表現(xiàn)為一系列曲線; 正態(tài)分布資料的次數(shù)分布表現(xiàn)為多數(shù)次數(shù)集中在算是平均數(shù)附近,距之俞遠(yuǎn),次數(shù)俞少; 正態(tài)分布曲線在離開(kāi)平均數(shù)一個(gè)標(biāo)準(zhǔn)差處有拐點(diǎn),且曲線是以x軸為漸進(jìn)線; 正態(tài)分布曲線與x軸間的面積為1,任何兩個(gè)x定值間的面積或概率由平均數(shù)和標(biāo)準(zhǔn)差確定。,正態(tài)分布,,,圖4.8 標(biāo)準(zhǔn)差相同( 1)而平均數(shù)

23、不同( =0、 =1、 =2)的三個(gè)正態(tài)分布曲線,,,,,圖4.9 平均數(shù)相同( 0)而標(biāo)準(zhǔn)差不同( =1、 =1.5、 =2)的三個(gè)正態(tài)分布曲線,,,,,例如,上章水稻140行產(chǎn)量資料的樣本分布表現(xiàn)出接近正態(tài)分布,,,,,,表4.5 140行水稻產(chǎn)量在 1s, 2s, 3s范圍內(nèi)所包括的次數(shù)表,三、計(jì)算正態(tài)分布曲線區(qū)間面積或概率的方法,概率可用曲線下區(qū)間的面積來(lái)表示, 或者說(shuō),用其定積分的值表示,,(413),同樣可以計(jì)算曲線下從到y(tǒng)的面積,其公式如下:,,(414),這里FN(y)稱為正態(tài)分布的累積函數(shù),具有平均數(shù) 和標(biāo)準(zhǔn)差 。,,,A=P(a

24、布密度函數(shù)的積分說(shuō)明圖面積A=P(a

25、7654,P(y40)=1P(y40)=10.9773 =0.0227,查附表2,當(dāng)u=0.8時(shí),F(xiàn)N(26)=0.2119,說(shuō)明這一分布從到26范圍內(nèi)的變量數(shù)占全部變量數(shù)的21.19%,或者說(shuō),y26概率為0.2119.,,,,例4.5 在應(yīng)用正態(tài)分布時(shí),經(jīng)常要討論隨機(jī)變數(shù)y離其平均數(shù)的差數(shù)大于或小于若干個(gè)值的概率。例如計(jì)算離均差絕對(duì)值等于小于和等于大于1 的概率為:,,,也可以簡(jiǎn)寫(xiě)為,相應(yīng)地,離均差絕對(duì)值等于小于2 、等于大于2 、等于小于3 和等于大于3 的概率值為:,,,,圖4.13 離均差的絕對(duì)值1 , 2 和1.96 的概率值,,,第五節(jié) 抽樣分布,統(tǒng)計(jì)學(xué)的一個(gè)主要任務(wù)是研究

26、總體和樣本之間的關(guān)系。,兩個(gè)方向,從總體到樣本的方向, 即本節(jié)所要討論的抽樣分布。,從樣本到總體的方向,即統(tǒng)計(jì)推斷問(wèn)題。,,抽樣分布( sampling distribution )是統(tǒng)計(jì)推斷的基礎(chǔ)。,一、統(tǒng)計(jì)數(shù)的抽樣及其分布參數(shù) 二、正態(tài)總體的抽樣分布 三、二項(xiàng)總體的抽樣分布,一、統(tǒng)計(jì)數(shù)的抽樣及其分布參數(shù),從總體中隨機(jī)抽樣得到樣本,獲得樣本觀察值后可以計(jì)算一些統(tǒng)計(jì)數(shù),統(tǒng)計(jì)數(shù)分布稱為抽樣分布。,抽樣,復(fù)置抽樣,指將抽得的個(gè)體放回總體后再繼續(xù)抽樣,不復(fù)置抽樣,指將抽得的個(gè)體不放回總體而繼續(xù)進(jìn)行抽樣,,(一) 樣本平均數(shù)的抽樣及其分布參數(shù),,,,,,,,,,,,,,,,,,,,,,,,,,,,,,

27、,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,總體,隨機(jī)樣本1 2 3 無(wú)窮個(gè)樣本,,圖4.14 總體和樣本的關(guān)系,從一個(gè)總體進(jìn)行隨機(jī)抽樣可以得到許多樣本,如果總體是無(wú)限總體,那么可以得到無(wú)限多個(gè)隨機(jī)樣本。,如果從容量為N的有限總體抽樣,若每次抽取容量為n的樣本,那么一共可以得到 個(gè)樣本(所有可能的樣本個(gè)數(shù))。 隨機(jī)樣本的任何一種統(tǒng)計(jì)數(shù)都可以是一個(gè)變量,這種變量的分布稱為統(tǒng)計(jì)數(shù)的抽樣分布。 由平均數(shù)構(gòu)成的新總體的分布,稱為平均數(shù)的抽樣分布。,除平均數(shù)抽樣分布外還有總和數(shù)、方差的抽樣分布等。,,,新總

28、體與母總體在特征參數(shù)上存在函數(shù)關(guān)系。以平均數(shù)抽樣分布為例,這種關(guān)系可表示為以下兩個(gè)方面。,(1) 該抽樣分布的平均數(shù) 與母總體的平均數(shù)相等。,(417),(2) 該抽樣分布的方差與母總體方差間存在如下關(guān)系:,,(418),其中n為樣本容量。抽樣分布的標(biāo)準(zhǔn)差又稱為標(biāo)準(zhǔn)誤,它可以度量抽樣分布的變異。,(二) 樣本總和數(shù)的抽樣及其分布參數(shù),樣本總和數(shù)(用 代表)的抽樣分布參數(shù)與母總體間存在如下關(guān)系: (1) 該抽樣分布的平均數(shù) 與母總體的平均數(shù)間的關(guān)系為:,,,(419),(2) 該抽樣分布的方差 與母總體方差間存在如下關(guān)系:,,,(420),(三) 兩個(gè)獨(dú)立隨機(jī)樣本平均數(shù)差數(shù)的抽樣及其分

29、布參數(shù),如果從一個(gè)總體隨機(jī)地抽取一個(gè)樣本容量為n1的樣本,同時(shí)隨機(jī)獨(dú)立地從另一個(gè)總體抽取一個(gè)樣本容量為n2的樣本,那么可以得到分別屬于兩個(gè)總體的樣本,這兩個(gè)獨(dú)立隨機(jī)抽取的樣本平均數(shù)間差數(shù)( )的抽樣分布參數(shù)與兩個(gè)母總體間存在如下關(guān)系:,,,(1) 該抽樣分布的平均數(shù)與母總體的平均數(shù)之差相等。,,(2) 該抽樣分布的方差與母總體方差間的關(guān)系為:,,(421),(422),二、正態(tài)總體的抽樣分布,(一) 樣本平均數(shù)的分布 從正態(tài)總體抽取的樣本平均數(shù)的分布一般為N( , )。,,圖4.16給出樣本容量n=1,4與9時(shí)的分布,從圖中可以看出隨著樣本容量的增加,分布的集中程度增加了,說(shuō)明方差減少

30、了。,,由中心極限定理知,只要樣本容量適當(dāng)大,不論總體分布形狀如何,其 的分布都可看作為正態(tài)分布,且具平均數(shù) 和方差 。在實(shí)際應(yīng)用上,如n30就可以應(yīng)用這一定理。,,,,平均數(shù)的標(biāo)準(zhǔn)化分布是將上述平均數(shù) 轉(zhuǎn)換為u變數(shù)。,,(423),例4.9 在江蘇沛縣調(diào)查336個(gè)m2小地老虎蟲(chóng)危害情況的結(jié)果, =4.73頭, =2.63,試問(wèn)樣本容量n=30時(shí),由于隨機(jī)抽樣得到樣本平均數(shù) 等于或小于4.37的概率為多少?,,查附表2,P(u0.75)=0.2266,即概率為22.66% (屬一尾概率)。,,(二) 兩個(gè)獨(dú)立樣本平均數(shù)差數(shù)的分布,假定有兩個(gè)正態(tài)總體各具有平均數(shù)和標(biāo)準(zhǔn)差為 , 和 , ,

31、從第一個(gè)總體隨機(jī)抽取n1個(gè)觀察值,同時(shí)獨(dú)立地從第二個(gè)總體隨時(shí)機(jī)抽取n2個(gè)觀察值。這樣計(jì)算出樣本平均數(shù)和標(biāo)準(zhǔn)差 ,s1和 ,s2。,,,,,,,從統(tǒng)計(jì)理論可以推導(dǎo)出其樣本平均數(shù)的差數(shù)( )的抽樣分布,具有以下特性:,(1) 如果兩個(gè)總體各作正態(tài)分布,則其樣本平均數(shù)差數(shù) ( )準(zhǔn)確地遵循正態(tài)分布律,無(wú)論樣本容量大或小,都有N( , )。,,,(2) 兩個(gè)樣本平均數(shù)差數(shù)分布的平均數(shù)必等于兩個(gè)總體平均數(shù)的差數(shù),即,(3) 兩個(gè)獨(dú)立的樣本平均數(shù)差數(shù)分布的方差等于兩個(gè)總體的樣本平均數(shù)的方差總和,即 其差數(shù)標(biāo)準(zhǔn)差為:,,(424),這個(gè)分布也可標(biāo)準(zhǔn)化,獲得u值。,

32、,(425),小結(jié): 若兩個(gè)樣本抽自于同一正態(tài)總體,則其平均數(shù)差數(shù)的抽樣分布不論容量大小亦作正態(tài)分布具:,,若兩個(gè)樣本抽自于同一總體,但并非正態(tài)總體,則其平均數(shù)差數(shù)的抽樣分布按中心極限定理在n1和n2相當(dāng)大時(shí)(大于30)才逐漸接近于正態(tài)分布。 若兩個(gè)樣本抽自于兩個(gè)非正態(tài)總體,當(dāng)n1和n2相當(dāng)大、而 與 相差不太遠(yuǎn)時(shí),也可近似地應(yīng)用正態(tài)接近方法估計(jì)平均數(shù)差數(shù)出現(xiàn)的概率,當(dāng)然這種估計(jì)的可靠性得依兩總體偏離正態(tài)的程度和相差大小而轉(zhuǎn)移。,,,三、二項(xiàng)總體的抽樣分布,(一) 二項(xiàng)總體的分布參數(shù),,,,其中p為二項(xiàng)總體中要研究的屬性事件發(fā)生的概率,q=1p 。,標(biāo)準(zhǔn)差:,方差:,平均數(shù):,(二) 樣本平

33、均數(shù)(成數(shù))的抽樣分布,從二項(xiàng)總體進(jìn)行抽樣得到樣本,樣本平均數(shù)抽樣分布的參數(shù)為:,平均數(shù):,方差:,標(biāo)準(zhǔn)誤:,,,同樣n是樣本容量。,(三) 樣本總和數(shù)(次數(shù))的抽樣分布,從二項(xiàng)總體進(jìn)行抽樣得到樣本,樣本總和數(shù)的抽樣分布參數(shù)為:,平均數(shù):,方差:,,,,標(biāo)準(zhǔn)誤:,例4.9 棉田危害棉株分為受害株與未受害株。假定調(diào)查2000株作為一個(gè)總體,受害株為704株。這是一個(gè)二項(xiàng)總體,于是計(jì)算出受害率p=35.2%=0.352, = =0.4776或47.76%。 現(xiàn)從這一總體抽樣,以株為單位,用簡(jiǎn)單隨機(jī)抽樣方法,調(diào)查200株棉株,獲得74株受害,那么,觀察受害率(就是成數(shù),或者

34、說(shuō)是樣本平均數(shù)) =37.0% , 試問(wèn)樣本平均數(shù)與總體真值的差數(shù)的概率為多少?,,,,,,,,總體真值p=0.352, 差數(shù)=( )=(0.3700.352)=0.018。 標(biāo)準(zhǔn)差 = = =0.034或3.4%。,由于二項(xiàng)分布在np及nq大于5時(shí),趨近于正態(tài)分布,本例樣本較大可看為正態(tài)分布,采用正態(tài)離差u查出概率。,于是 =0.53。,如果以次數(shù)資料(或稱為“樣本總和數(shù)資料”)表示也可得到同樣結(jié)果。總體調(diào)查2000株中受害株有704株,調(diào)查200株的理論次數(shù)應(yīng)為np=2000.352=70.4株?,F(xiàn)觀察受害株為74株(總和數(shù)), 差數(shù)=( np)=7470.4 =3.6株, =3.6/6.754=0.53, 與上相同,獲得這種差數(shù)的概率為0.59。,,,查附表3,當(dāng)u=0.53,概率值為0.59, 即獲得這種| |0.018的概率(兩尾概率)為0.59,這就說(shuō)明樣本估計(jì)的受害率為37.0有代表性(可以近似代表總體的受害率)。,

展開(kāi)閱讀全文
溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!