《《統(tǒng)計(jì)學(xué)》高等教育出版社.ppt》由會員分享,可在線閱讀,更多相關(guān)《《統(tǒng)計(jì)學(xué)》高等教育出版社.ppt(39頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、1,教學(xué)重點(diǎn),教學(xué)過程,教學(xué)總結(jié),第七章 區(qū)間估計(jì),STAT,2,,,STAT,一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,每天的產(chǎn)量約為8000袋左右。按規(guī)定每袋的重量應(yīng)不低于100克,否則即為不合格。為對產(chǎn)量質(zhì)量進(jìn)行檢測,企業(yè)設(shè)有質(zhì)量檢查科專門負(fù)責(zé)質(zhì)量檢驗(yàn),并經(jīng)常向企業(yè)高層領(lǐng)導(dǎo)提交質(zhì)檢報(bào)告。質(zhì)檢的內(nèi)容之一就是每袋重量是否符合要求。 由于產(chǎn)品的數(shù)量大,進(jìn)行全面的檢驗(yàn)是不可能的,可行的辦法是抽樣,然后用樣本數(shù)據(jù)估計(jì)平均每袋的重量。質(zhì)檢科從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,下表1是對每袋食品重量的檢驗(yàn)結(jié)果。,實(shí)踐中的統(tǒng)計(jì),3,,,STAT,根據(jù)表1的數(shù)據(jù),質(zhì)檢科估計(jì)出該天生產(chǎn)的食品每袋的平均重量
2、在101.38109.34克之間,其中,估計(jì)的可信程度為95%,估計(jì)誤差不超過4克。產(chǎn)品的合格率在96.07%73.93%之間,其中,估計(jì)的可信程度為95%,估計(jì)誤差不超過16%。,4,,,STAT,質(zhì)檢報(bào)告提交后,企業(yè)高層領(lǐng)導(dǎo)人提出幾點(diǎn)意見:一是抽取的樣本大小是否合適?能不能用一個(gè)更大的樣本進(jìn)行估計(jì)?二是能否將估計(jì)的誤差在縮小一點(diǎn)?比如,估計(jì)平均重量時(shí)估計(jì)誤差不超過3克,估計(jì)合格率時(shí)誤差不超過10%。三是總體平均重量的方差是多少?因?yàn)榉讲畹拇笮≌f明了生產(chǎn)過程的穩(wěn)定性,過大或過小的方差都意味著應(yīng)對生產(chǎn)過程進(jìn)行調(diào)整。,5,,,STAT,本章重點(diǎn) 1、抽樣誤差的概率表述; 2、區(qū)間估計(jì)的基本原理;
3、 3、小樣本下的總體參數(shù)估計(jì)方法; 4、樣本容量的確定方法; 本章難點(diǎn) 1、一般正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布; 2、t分布; 3、區(qū)間估計(jì)的原理; 4、分層抽樣、整群抽樣中總方差的分解。,區(qū) 間 估 計(jì),6,,,STAT,點(diǎn)估計(jì)的缺點(diǎn):不能反映估計(jì)的誤差和精確程度 區(qū)間估計(jì):利用樣本統(tǒng)計(jì)量和抽樣分布估計(jì)總體參數(shù)的可能區(qū)間 【例1】CJW公司是一家專營體育設(shè)備和附件的公司,為了監(jiān)控公司的服務(wù)質(zhì)量, CJW公司每月都要隨即的抽取一個(gè)顧客樣本進(jìn)行調(diào)查以了解顧客的滿意分?jǐn)?shù)。根據(jù)以往的調(diào)查,滿意分?jǐn)?shù)的標(biāo)準(zhǔn)差穩(wěn)定在20分左右。最近一次對100名顧客的抽樣顯示,滿意分?jǐn)?shù)的樣本均值為82分,試建立總體滿意分?jǐn)?shù)的區(qū)間。
4、 8.1.1抽樣誤差 抽樣誤差:一個(gè)無偏估計(jì)與其對應(yīng)的總體參數(shù)之差的絕對值。 抽樣誤差 = (實(shí)際未知),8.1總體均值的區(qū)間估計(jì)(大樣本n30),7,,,STAT,要進(jìn)行區(qū)間估計(jì),關(guān)鍵是將抽樣誤差 求解。若 已知,則區(qū)間可表示為: 此時(shí),可以利用樣本均值的抽樣分布對抽樣誤差的大小進(jìn)行描述。 上例中,已知,樣本容量n=100,總體標(biāo)準(zhǔn)差 ,根據(jù)中心極限定理可知,此時(shí)樣本均值服從均值為 ,標(biāo)準(zhǔn)差為 的正態(tài)分布。 即:,8,,,STAT,8.1.2抽樣誤差的概率表述 由概率論可知, 服從標(biāo)準(zhǔn)正態(tài)分布,即, 有
5、以下關(guān)系式成立: 一般稱, 為置信度,可靠程度等,反映估計(jì)結(jié)果的可信程度。若事先給定一個(gè)置信度,則可根據(jù)標(biāo)準(zhǔn)正態(tài)分布找到其對應(yīng)的臨界值 。進(jìn)而計(jì)算抽樣誤差,9,,,STAT,若, 則查標(biāo)準(zhǔn)正態(tài)分布表可得, 抽樣誤差 此時(shí)抽樣誤差的意義可表述為:以樣本均值為中心的3.92的區(qū)間包含總體均值的概率是95%,或者說,樣本均值產(chǎn)生的抽樣誤差是3.92或更小的概率是0.95。 常用的置信度還有90%,95.45%,99.73%,他們對應(yīng)的臨界值分別為1.645,2和3,可以分別反映各自的估計(jì)區(qū)間所對應(yīng)的精確程度和把握程度。,10,,,STAT,8.1.3計(jì)算區(qū)間估計(jì): 在CJW公司的例
6、子中,樣本均值產(chǎn)生的抽樣誤差是3.92或更小的概率是0.95。因此,可以構(gòu)建總體均值的區(qū)間為, 由于,從一個(gè)總體中抽取到的樣本具有隨機(jī)性,在一次偶然的抽樣中,根據(jù)樣本均值計(jì)算所的區(qū)間并不總是可以包含總體均值,它是與一定的概率相聯(lián)系的。如下圖所示:,11,,,STAT,,,,,,,,,,,,,,,,3.92,3.92,,,,圖1 根據(jù)選擇的在 、 、 位置的樣本均值建立的區(qū)間,12,,,STAT,上圖中,有95%的樣本均值落在陰影部分,這個(gè)區(qū)域的樣本均值3.92的區(qū)間能夠包含總體均值。 因此,總體均值的區(qū)間的含義為,我們有95%的把握認(rèn)為,以樣本均值為中心的3.92的區(qū)間能夠包含總體均值。
7、 通常,稱該區(qū)間為置信區(qū)間,其對應(yīng)的置信水平為 置信區(qū)間的估計(jì)包含兩個(gè)部分:點(diǎn)估計(jì)和描述估計(jì)精確度的正負(fù)值。也將正負(fù)值稱為誤差邊際或極限誤差,反映樣本估計(jì)量與總體參數(shù)之間的最大誤差范圍。 總結(jié):,13,,,STAT,8.1.4計(jì)算區(qū)間估計(jì): 在大多數(shù)的情況下,總體的標(biāo)準(zhǔn)差都是未知的。根據(jù)抽樣分布定理,在大樣本的情況下,可用樣本的標(biāo)準(zhǔn)差s作為總體標(biāo)準(zhǔn)差的點(diǎn)估計(jì)值,仍然采用上述區(qū)間估計(jì)的方法進(jìn)行總體參數(shù)的估計(jì)。,14,,,STAT,【例2】 斯泰特懷特保險(xiǎn)公司每年都需對人壽保險(xiǎn)單進(jìn)行審查,現(xiàn)公司抽取36個(gè)壽保人作為一個(gè)簡單隨即樣本,得到關(guān)于、投保人年齡、保費(fèi)數(shù)量、保險(xiǎn)單的現(xiàn)金值、殘廢補(bǔ)償
8、選擇等項(xiàng)目的資料。為了便于研究,某位經(jīng)理要求了解壽險(xiǎn)投保人總體平均年齡的90%的區(qū)間估計(jì)。,15,,,STAT,上表是一個(gè)由36個(gè)投保人組成的簡單隨機(jī)樣本的年齡數(shù)據(jù)?,F(xiàn)求總體的平均年齡的區(qū)間估計(jì)。 分析:區(qū)間估計(jì)包括兩個(gè)部分點(diǎn)估計(jì)和誤差邊際,只需分別求出即可到的總體的區(qū)間估計(jì)。 解:已知 (1)樣本的平均年齡 (2)誤差邊際,16,,,STAT,樣本標(biāo)準(zhǔn)差 誤差邊際 (3)90%的置信區(qū)間為39.5 2.13 即(37.37,41.63)歲。 注意 (1)置信系數(shù)一般在抽樣之前確定,根據(jù)樣本所建立的區(qū)間能包含總體參數(shù)的概率為 (2)置信區(qū)間的長度(準(zhǔn)確度)在置信度一定的情況下,與樣本容量的
9、大小呈反方向變動(dòng),若要提高估計(jì)準(zhǔn)確度,可以擴(kuò)大樣本容量來達(dá)到。,17,,,STAT,8.2總體均值的區(qū)間估計(jì):小樣本的情況 在小樣本的情況下,樣本均值的抽樣分布依賴于總體的抽樣分布。我們討論總體服從正態(tài)分布的情況。 t分布的圖形和標(biāo)準(zhǔn)正態(tài)分布的圖形類似,如下圖示:,18,,,STAT,,,,,,0,,,,標(biāo)準(zhǔn)正態(tài)分布,t分布(自由度為20),t分布(自由度為10),圖2標(biāo)準(zhǔn)正態(tài)分布與t分布的比較,19,,,STAT,在分布中,對于給定的置信度,同樣可以通過查表找到其對應(yīng)的臨界值,利用臨界值也可計(jì)算區(qū)間估計(jì)的誤差邊際 因此,總體均值的區(qū)間估計(jì)在總體標(biāo)準(zhǔn)差未知的小樣本情況下可采用下式進(jìn)行: 假定總
10、體服從正態(tài)分布;,20,,,STAT,【例3】謝爾工業(yè)公司擬采用一項(xiàng)計(jì)算機(jī)輔助程序來培訓(xùn)公司的維修支援掌握及其維修的操作,以減少培訓(xùn)工人所需要的時(shí)間。為了評價(jià)這種培訓(xùn)方法,生產(chǎn)經(jīng)理需要對這種程序所需要的平均時(shí)間進(jìn)行估計(jì)。以下是利用新方對名職員進(jìn)行培訓(xùn)的培訓(xùn)天數(shù)資料。 根據(jù)上述資料建立置信度為的總體均值的區(qū)間估計(jì)。(假定培訓(xùn)時(shí)間總體服從正態(tài)分布)。,21,,,STAT,解:依題意,總體服從正態(tài)分布,(小樣本),此時(shí)總體方差未知。可用自由度為(n-1)=14的t分布進(jìn)行總體均值的區(qū)間估計(jì)。 樣本平均數(shù) 樣本標(biāo)準(zhǔn)差 誤差邊際 95%的置信區(qū)間為,53.87 3.78 即(50.09,57.65)
11、天。,22,,,STAT,8.3確定樣本容量 誤差邊際 其計(jì)算需要已知 若我們選擇了置信度 由此,得到計(jì)算必要樣本容量的計(jì)算公式:,23,,,STAT,【例4】在以前的一項(xiàng)研究美國租賃汽車花費(fèi)的研究中發(fā)現(xiàn),租賃一輛中等大小的汽車,其花費(fèi)范圍為,從加利福尼亞州的奧克蘭市的每天36美元到康涅狄格州的哈特福德市的每天73.50美元不等,并且租金的標(biāo)準(zhǔn)差為9.65美元。假定進(jìn)行該項(xiàng)研究的組織想進(jìn)行一項(xiàng)新的研究,以估計(jì)美國當(dāng)前總體平均日租賃中等大小汽車的支出。在設(shè)計(jì)該項(xiàng)新的研究時(shí),項(xiàng)目主管指定對總體平均日租賃支出的估計(jì)誤差邊際為2美元,置信水平為95%。 解:依題意, 可得 將以上結(jié)果取下一個(gè)整數(shù)(90
12、)即為必要的樣本容量。,24,,,STAT,說明: 由于總體標(biāo)準(zhǔn)差 在大多數(shù)情況下 是未知的,可以有以下方法取得 的值。 (1)使用有同樣或者類似單元的以前樣本的樣本標(biāo)準(zhǔn)差; (2)抽取一個(gè)預(yù)備樣本進(jìn)行試驗(yàn)性研究。用實(shí)驗(yàn)性樣本的標(biāo)準(zhǔn)差作為 的估計(jì)值。 (3)運(yùn)用對 值的判斷或者“最好的猜測”,例如,通常可用全距的作為 的近似值。,25,,,STAT,8.4總體比例的區(qū)間估計(jì) 8.4.1區(qū)間估計(jì) 對總體比例 的區(qū)間估計(jì)在原理上與總體均值的區(qū)間估計(jì)相同。同樣要利用樣本比例 的抽樣分布來進(jìn)行估計(jì)。 若, 則樣本比例近似服從正態(tài)分布。 同樣,抽樣誤差
13、類似的,利用抽樣分布(正態(tài)分布)來計(jì)算抽樣誤差,26,,,STAT,上式中, 是正待估計(jì)的總體參數(shù),其值一般是未知,通常簡單的用 替代 。 即用樣本方差 替代總體方差 。 則, 誤差邊際的計(jì)算公式為:,27,,,STAT,【例5】1997年菲瑞卡洛通訊公司對全國范圍每內(nèi)的902名女子高爾夫球手進(jìn)行了調(diào)查,以了解美國女子高爾夫球手對自己如何在場上被對待的看法。調(diào)查發(fā)現(xiàn),397名女子高爾夫球手對得到的球座開球次數(shù)感到滿意。試在95%的置信水平下估計(jì)總體比例的區(qū)間。 分解: 解:依題意已知, (1)樣本比例 (2)誤差邊際,28,,,STAT,(3)95%的置信區(qū)間0.44 0
14、.0324 即(0.4076,0.4724)。 結(jié)論:在置信水平為95%時(shí),所有女子高爾夫球手中有40.76%到47.24%的人對得到的球座開球數(shù)感到滿意。 8.4.2 確定樣本容量 在建立總體比例的區(qū)間估計(jì)時(shí),確定樣本容量的原理與8.3節(jié)中使用的為估計(jì)總體均值時(shí)確定樣本容量的原理相類似。,29,,,STAT,【例6】在例中,該公司想在1997年結(jié)果的基礎(chǔ)上進(jìn)行一項(xiàng)新的調(diào)查,以重新估計(jì)女子高爾夫球手的總體中對得到的球座開球此數(shù)感到滿意的人數(shù)所占的比例。調(diào)查主管希望這項(xiàng)新的調(diào)查在誤差邊際為0.025、置信水平為95%的條件下來進(jìn)行,那么,樣本容量應(yīng)該為多大? 解:依題意, 可得 將以上結(jié)果
15、取下一個(gè)整數(shù)(1515)即為必要的樣本容量。,30,,,STAT,說明: 由于總體比例 在大多數(shù)情況下是未知的,可以有以下方法取得 的值。 (1)使用有同樣或者類似單元的以前樣本的樣本比例; (2)抽取一個(gè)預(yù)備樣本進(jìn)行試驗(yàn)性研究。用實(shí)驗(yàn)性樣本的比例作為 的估計(jì)值。 (3)運(yùn)用對 值的判斷或者“最好的猜測”; (4)如果上面的方法都不適用,采用 。,31,,,STAT,8.5其他抽樣方法下總方差的計(jì)算 在第六章中學(xué)習(xí)到,除簡單隨機(jī)抽樣方法外,在現(xiàn)實(shí)中還可運(yùn)用分層抽樣、整群抽樣、系統(tǒng)抽樣等抽樣方法,每一次抽樣都涉及到對總體參數(shù)的估計(jì)過程。 通過前面的知識,可知對總體參數(shù)的估計(jì)
16、過程中比較關(guān)鍵的因素是計(jì)算總體方差。如果已知總體方差,總體參數(shù)區(qū)間估計(jì)的過程與前面介紹的方法相同。,32,,,STAT,8.5.1分層抽樣 在簡單隨機(jī)抽樣中,我們計(jì)算總方差是采用的公式是 在分層抽樣中,我們事先將總體按一定的標(biāo)志進(jìn)行分層,所形成的數(shù)據(jù)實(shí)際等同于組距式數(shù)列,在組距式數(shù)列中,總方差需要運(yùn)用方差加法定理來計(jì)算。,33,,,STAT,這就是說,如果要計(jì)算總方差,則需分別將組間方差和平均組內(nèi)方差先計(jì)算出來。在分層抽樣下,是否真的需要由組間方差和平均組內(nèi)方差相加來計(jì)算總方差呢? 我們來考察一下分層抽樣的實(shí)施過程: 層間抽樣:在每一層抽取 全面調(diào)查 層間方差 層內(nèi)抽樣:抽取部分樣本單位 抽
17、樣調(diào)查 層內(nèi)方差 我們說抽樣誤差是抽樣調(diào)查這種調(diào)查方式所特有的誤差,因此上述兩部分誤差中只有由于抽樣調(diào)查所形成的層內(nèi)方差才是抽樣誤差的組成部分,而由于全面調(diào)查所形成的層間方差不是抽樣誤差的組成部分。,,,,,34,,,STAT,因此,,35,【例7】某廠有甲、乙兩個(gè)車間生產(chǎn)保溫瓶,乙車間產(chǎn)量是甲車間的2倍?,F(xiàn)按產(chǎn)量比例共抽查了60支,結(jié)果如下。試以95.45%的可靠程度推斷該廠生產(chǎn) 的保溫瓶的平均保 溫時(shí)間的可能范圍。,36,【例8】某地一萬住戶,按城鄉(xiāng)比例抽取一千戶,進(jìn)行彩電擁有量調(diào)查,結(jié)果如下。試 以95.45%的概率推斷該地 彩電擁有戶比率的范圍。,37,,,STAT,8.5.2整群抽樣 與分層抽樣類似,整群抽樣下,總方差的計(jì)算仍然需要分解: 同樣考察整群抽樣的實(shí)施過程: 層間抽樣:在部分層中抽取 抽樣調(diào)查 群間方差 層內(nèi)抽樣:抽取全部樣本單位 全面調(diào)查 群內(nèi)方差 類似的,只有群間方差是抽樣誤差的組成部分。,,,,,,38,,,STAT,因此,,39,【例9】某鄉(xiāng)播種某種農(nóng)作物3000畝, 分布在60塊地段上,每塊地段50畝。 現(xiàn)抽取5塊地,得資料如下。現(xiàn)要 求以95%的概率估計(jì)這種農(nóng)作物的 平均畝產(chǎn)。,總體:R=60群 樣本:r=5群,