《z-CH9多階段抽樣-第3、4節(jié)-簡(jiǎn)》由會(huì)員分享,可在線閱讀,更多相關(guān)《z-CH9多階段抽樣-第3、4節(jié)-簡(jiǎn)(45頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),*,*,*,9.3 PU大小不等的2S抽樣,與群規(guī)模不等的CL對(duì)照著來理解本節(jié)的方法體系,自加權(quán)樣本的構(gòu)造模式及估計(jì)方法(計(jì)算的重點(diǎn)),10/22/2024,1,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,PU大小不等時(shí)解決問題的思路,思路一:,PU大小不等的問題可以轉(zhuǎn)化為PU大小相等來討論,比
2、如分層,將大小近似的PU分到一層,則層內(nèi)的2S抽樣就可以按PU大小相等的方法來處理,思路二:,如果做不到上述轉(zhuǎn)化,PU大小不等的處理就要復(fù)雜得多,復(fù)雜性體現(xiàn)在兩個(gè)方面:,抽樣方法:,PU的抽取是否考慮PU不等的因素,估計(jì)方法:,選擇估計(jì)方法是否要考慮PU規(guī)模不等的因素,10/22/2024,2,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,9.3方法體系,類似于CL群規(guī)模不等的估計(jì),(一)對(duì)PU進(jìn)行srs,1、加權(quán)估計(jì),2、比率估計(jì),(二)對(duì)PU進(jìn)行PPS抽樣(WR),1、H-H估計(jì),2、,構(gòu)造自加權(quán)樣本,10/22/2024,3,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,一、符號(hào)說明,兩個(gè)抽樣比,兩個(gè)均值,兩個(gè)方差,10/22/2
3、024,4,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,討論的前提,A個(gè)PU,a個(gè)PU,M,1,個(gè)BU,M,2,個(gè)BU,M,a,個(gè)BU,m,1,個(gè)BU,m,2,個(gè)BU,m,a,個(gè)BU,每個(gè)PU相互獨(dú)立地抽取相應(yīng)的BU數(shù),10/22/2024,5,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,基本符號(hào),(Y,ij,,i=1,2,A;j=1,2,M,i,)(y,ij,,i=1,2,a;j=1,2,m,i,),含義,總體,樣本,第i個(gè)PU的個(gè)體均值,總的個(gè)體均值,PU間方差,第i個(gè)PU內(nèi)BU間的方差,不需要再進(jìn)一步綜合,10/22/2024,6,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,二、均值估計(jì)量及其性質(zhì),10/22/2024,7,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分
4、,(一)對(duì)PU進(jìn)行srs,抽樣方法的選擇上沒有考慮PU規(guī)模不等的因素,估計(jì)方法的選擇是否考慮PU規(guī)模不等的因素呢?,10/22/2024,8,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,討論的前提,A個(gè)PU,srs,a個(gè)PU,M,1,個(gè)BU,M,2,個(gè)BU,M,a,個(gè)BU,srs,m,1,個(gè)BU,m,2,個(gè)BU,m,a,個(gè)BU,每個(gè)PU相互獨(dú)立地抽取相應(yīng)的BU數(shù),10/22/2024,9,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,等概抽樣的加權(quán)估計(jì)量,(P198 9.28-9.31),適應(yīng)性:一般用于M,i,相差不大的情況,是個(gè)無(wú)偏估計(jì),10/22/2024,10,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,(二)對(duì)PU進(jìn)行放回的不等概抽樣,抽樣方法
5、的選擇上考慮了PU規(guī)模不等的因素,選擇與之配套的估計(jì)方法:H-H估計(jì),10/22/2024,11,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,1、抽選方法說明,A個(gè)PU,PPS,a個(gè)PU,M,1,個(gè)BU,M,2,個(gè)BU,M,a,個(gè)BU,m,1,個(gè)BU,m,2,個(gè)BU,m,a,個(gè)BU,每個(gè)PU相互獨(dú)立地抽取相應(yīng)的BU數(shù),PPS抽樣結(jié)果有可能重復(fù)。如果某PU被重復(fù)抽到,比如被抽到2次,則分別獨(dú)立的進(jìn)行2次BU的抽取。對(duì)樣本單元實(shí)施調(diào)查,相同的單元記錄2次,?,10/22/2024,12,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,2、H-H估計(jì)量及其性質(zhì),由H-H估計(jì)量的性質(zhì)可知,這是無(wú)偏估計(jì)量,方差,(P199 9.36),(P200
6、 9.38),10/22/2024,13,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,說明,估計(jì)量方差的估計(jì)式僅與第一階段有關(guān),與第二階段無(wú)關(guān),所以,一般對(duì)第二階段抽樣方法不做特別的規(guī)定,10/22/2024,14,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,3、構(gòu)造自加權(quán)估計(jì)量,理論上,要想構(gòu)造自加權(quán)估計(jì)量,必須,將估計(jì)量形式表示成關(guān)于樣本觀測(cè)值之和的常數(shù)倍,10/22/2024,15,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,關(guān)于f,0,含義的理解,相當(dāng)于總體中任一BU被抽中的概率,如果f,0,事先確定,則,10/22/2024,16,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,總結(jié):實(shí)踐中自加權(quán)樣本的構(gòu)造模式,在2S中,自加權(quán)樣本按如下模式構(gòu)造:,第一階段對(duì)PU實(shí)
7、施與規(guī)模成比例的PPS抽樣,第二階段對(duì)BU按srs抽取,且m,i,=m,這時(shí),總值的估計(jì)量及方差的估計(jì)為:,10/22/2024,17,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,補(bǔ)例,某小區(qū)擁有10座高層建筑,每座高層建筑擁有的樓層數(shù)如下表:,用二階抽樣方法抽出10個(gè)樓層進(jìn)行調(diào)查,第一階抽樣為放回的、按與每座建筑擁有的樓層數(shù)成比例的PPS抽樣抽取5座建筑,第二階按srs對(duì)每座建筑抽取2個(gè)樓層。對(duì)10個(gè)樓層居民人數(shù)的調(diào)查結(jié)果如下表。估計(jì)小區(qū)的總居民數(shù),并給出估計(jì)的精度。,高層建筑,A,B,C,D,E,F,G,H,I,J,合計(jì),樓層,12,12,16,15,10,16,10,18,16,20,145,一階樣本序號(hào),
8、1,2,3,4,5,合計(jì),居民數(shù),18,12,15,18,19,13,16,10,16,11,148,y,i,15,16.5,16,13,13.5,14.8,y,10/22/2024,18,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,解答,2S自加權(quán)樣本的模式構(gòu)造:,第一階段對(duì)PU實(shí)施與規(guī)模成比例的PPS抽樣,第二階段對(duì)BU按srs抽取,且m,i,=m,本例的做法:用2S方法抽出10個(gè)樓層進(jìn)行調(diào)查,第一階抽樣為放回的、按與每座建筑擁有的樓層數(shù)成比例的PPS抽樣抽取5座建筑,第二階按srs對(duì)每座建筑抽取2個(gè)樓層,這時(shí),總值的估計(jì)量及方差的估計(jì)為:,10/22/2024,19,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,解答,自加權(quán)的構(gòu)
9、造模式,a=5,m=2,M,0,=145,10/22/2024,20,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,補(bǔ)充習(xí)題,某公司欲了解職工上班交通所需時(shí)間,該公司共有5個(gè)部門,根據(jù)每個(gè)部門的人數(shù)采用PPS抽樣抽出2個(gè)部門,并在2個(gè)部門中采用srs分別抽出5名職工,調(diào)查的結(jié)果如下:,試估計(jì)該公司職工上班交通平均所需時(shí)間,并給出估計(jì)的標(biāo)準(zhǔn)差。,部門i,職工人數(shù)M,i,時(shí)間y,ij,(分鐘),1,20,40,10,20,30,40,2,35,60,30,20,60,30,9.3結(jié)束,10/22/2024,21,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,9.4其他問題,一、,3S抽樣,二、,2S總樣本量及最優(yōu)樣本量的配置,10/22/2
10、024,22,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,一、3S及MS抽樣,10/22/2024,23,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,(一)各階單元大小相等的MS,(以3S為例),1、含義,總體包含A個(gè)PU,每個(gè)PU含M個(gè)二級(jí)單元,每個(gè)二級(jí)單元含G個(gè)BU,分別srs抽取a個(gè)PU、m個(gè)二級(jí)單元、g個(gè)BU,A,a,PU,srs,M,m,二階單元,srs,G,g,BU,srs,10/22/2024,24,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,2、估計(jì)量及其性質(zhì),(P194 9.46-9.48),實(shí)踐中,對(duì)于更高階的情況,估計(jì)量的方差一般只需計(jì)算到第二或第三階就可以了,這是誤差的,主要組成部分,amg一定時(shí),提高a而減少m、g會(huì)有效提高估
11、計(jì)的精度,方差的,無(wú)偏估計(jì),10/22/2024,25,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,(二)各階單元大小不等的MS,(不要求),以總值Y的估計(jì)為例來說明,通常有兩種方法,1、各階抽樣采用PPS抽樣,2、構(gòu)造自加權(quán)樣本,重點(diǎn)掌握:樣本為自加權(quán)的條件,10/22/2024,26,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,構(gòu)造自加權(quán)樣本,(樣本為自加權(quán)的條件),10/22/2024,27,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,抽樣方法,前兩個(gè)階段PPS抽樣,最后一個(gè)階段srs,從第二階開始,每一階各下級(jí)樣本單元數(shù)都相等,則,樣本是自加權(quán)的,A,a,PU,PPS,M,i,m,二級(jí)單元,PPS,G,ij,g,BU,srs,10/22/202
12、4,28,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,估計(jì)量與方差估計(jì),10/22/2024,29,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,3階以上的MS自加權(quán)樣本的構(gòu)造,類似地,對(duì)于更高階的情況,除了最后一階采用srs(wor或wr都行),前幾階均采用PPS抽樣;并且,從第二階開始,每一階的樣本量都相同,則樣本是自加權(quán)的,自加權(quán)樣本的好處,估計(jì)量的形式及方差的估計(jì)都非常簡(jiǎn)單,抽樣估計(jì)效果一般也不錯(cuò),10/22/2024,30,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,二、2S總樣本量及最優(yōu)樣本量的配置,討論的前提:PU大小相等的2S,背景說明,每個(gè)PU均包含M個(gè)BU,兩個(gè)階段均采用srs,Aa,Mm,各PU相互獨(dú)立地抽取BU,10/22/202
13、4,31,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,(一)(am)的確定,兩種思路:,1、費(fèi)用,2、n,2S,=n,srs,Deff,Deff的確定是關(guān)鍵,實(shí)踐中,一般,MS的Deff在1.33之間,10/22/2024,32,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,(二)最優(yōu)樣本量的配置,前提,:,1、PU大小相等,2、(am)一定的前提下,合理分配a和m的大小,相當(dāng)于確定最優(yōu)抽樣比f(wàn),1,=a/A、f,2,=m/M,10/22/2024,33,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,1、基本思想,怎樣算是最優(yōu)配置,最優(yōu)設(shè)計(jì)、最優(yōu)分配,C一定的前提下,使估計(jì)精度最高,在一定精度的要求下,使C最省,2S費(fèi)用函數(shù)形式:C=c,0,+c,1,a+
14、c,2,am,實(shí)踐中的基本原則,10/22/2024,34,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,實(shí)踐中的基本原則,a盡量大一些,m盡量小一些,兩個(gè)階段方差的大小,如果:PU間的方差S,1,2,大,PU內(nèi)BU間的方差S,2,2,小,則,a大一點(diǎn),m小一點(diǎn),如果:S,1,2,小,S,2,2,大,則,a小一點(diǎn),m大一點(diǎn),兩個(gè)階段單位調(diào)查費(fèi)用,如果:PU的單位調(diào)查費(fèi)用c,1,大,BU的單位調(diào)查費(fèi)用c,2,小,則,a小一點(diǎn),m大一點(diǎn),如果:c,1,小,c,2,大,則a多一點(diǎn),m小一點(diǎn),10/22/2024,35,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,2、求a、m的最優(yōu)分配法,(P202 9.56),結(jié)論:,其中:,將m,opt,
15、代入V公式,可求得V給定的情況下,,使C,min的a,opt,(9.58),將m,opt,代入C公式,可求得C限定的情況下,,使V,min的a,opt,(9.57),問題:如何確定a,opt,?,10/22/2024,36,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,來歷,有兩種方法可以確定以上m的最優(yōu)分配公式,拉格朗日乘子法,柯西施瓦茲不等式,基本思想:,借助方差函數(shù)和費(fèi)用函數(shù)構(gòu)造損失函數(shù),求使得損失函數(shù)達(dá)極小值的m,10/22/2024,37,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,構(gòu)造損失函數(shù),利用方差函數(shù)和費(fèi)用函數(shù)構(gòu)造損失函數(shù),2S的方差函數(shù)為,最簡(jiǎn)單的費(fèi)用函數(shù)形式:,10/22/2024,38,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,
16、柯西施瓦茲不等式,求解使損失函數(shù)達(dá)到極小值的m,這一求解過程借助C-S不等式完成,C-S不等式的內(nèi)容:,若a,1,、a,2,、b,1,、b,2,非負(fù),則,(a,1,2,+a,2,2,)(b,1,2,+b,2,2,)(a,1,b,1,+a,2,b,2,),2,,當(dāng)且僅當(dāng)a,1,/b,1,=a,2,/b,2,=k時(shí),“=”成立,令,10/22/2024,39,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,需要說明的問題,實(shí)際計(jì)算時(shí),S,u,、S,2,、c,1,、c,2,都是估計(jì)值,m,opt,往往非整,怎么辦?,實(shí)踐中常用卡梅倫規(guī)則來處理,10/22/2024,40,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,3、實(shí)用規(guī)則,卡梅倫(Cameron)規(guī)則(1951),解決m,opt,非整的問題,令m=m,opt,,則按以下規(guī)則取m值,當(dāng)m,opt,2,m(m+1),則取m=m+1,當(dāng)m,opt,2,m(m+1),則取m=m,當(dāng)m,opt,2,M或S,u,2,0,則取m=M,即CL,當(dāng)M較小時(shí),有可能出現(xiàn)第三種情況,9.4結(jié)束,10/22/2024,41,統(tǒng)計(jì)學(xué)專業(yè)必修課3學(xué)分,CH9小結(jié),MS的優(yōu)點(diǎn)、估計(jì)推斷原理的理解,PU大小相等