《《異方差和自相關(guān)》PPT課件.ppt》由會員分享,可在線閱讀,更多相關(guān)《《異方差和自相關(guān)》PPT課件.ppt(46頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、異方差和自相關(guān),對于經(jīng)典計(jì)量模型,我們的基本假設(shè)有:,假設(shè) 對于解釋變量的所有觀測值,隨機(jī)誤差項(xiàng)有相同的方差。,此時可得: 在存在異方差的情況下:,因此,估計(jì)結(jié)果無偏,但不是有效的(隨機(jī)誤差項(xiàng)方差變大)。,誤差項(xiàng)存在異方差:U的方差-協(xié)方差矩陣Var(u)主對角線上的元素不相等 。,異方差是違背了球型擾動項(xiàng)假設(shè)的一種情形。在存在異方差的情況下: (1)OLS 估計(jì)量依然是無偏、一致且漸近正態(tài)的。 (2)估計(jì)量方差Var(b|X) 的表達(dá)式不再是2(XX)1,因?yàn)閂ar(|X) 2I。 (3)Gauss-Markov 定理不再成立,即OLS不再是最佳線性無偏估計(jì)(BLUE)。,一般截面數(shù)據(jù)容易產(chǎn)
2、生異方差 而時間序列數(shù)據(jù)容易產(chǎn)生自相關(guān),異方差的檢驗(yàn),1。殘差圖 2。懷特檢驗(yàn) 3。Breusch-Pagan(BP)檢驗(yàn) 4。 G-Q 檢驗(yàn) (Goldfeld-Quandt,1965) 5。 Szroeters 秩檢驗(yàn)(Szreter,1978) 后兩種現(xiàn)在已經(jīng)基本不用。,1。畫圖:散點(diǎn)圖和殘差圖。,1。殘差圖: rvfplot (residual-versus-fitted plot) rvpplot varname (residual-versus-predictor plot) 作圖命令一定要在回歸完成之后進(jìn)行 rvfplot yline(0),2。懷特檢驗(yàn):,2。懷特檢驗(yàn)命令: 做
3、完回歸后,使用命令: estat imtest, white,Breusch and Pagan 檢驗(yàn),根據(jù)異方差檢驗(yàn)的基本思路,Breusch and Pagan(1979)和Cook and Weisberg(1983) 主要思路:用 ei2/avg(ei2) 對一系列可能導(dǎo)致異方差的變量作回歸。,H0: a1=a2=.=0 (不存在) H1: a1,a2.不全為0 (存在) Step1:估計(jì)原方程,提取殘差,并求其平方ei2。 Step2:計(jì)算殘差平方和的均值avg(ei2) 。 Step3:估計(jì)方程,被解釋變量為ei2/avg(ei2) ,解釋變量依然為原解釋變量。 Step4:構(gòu)造統(tǒng)
4、計(jì)量Score=0.5*RSS服從自由度為k的卡方分布。查表檢驗(yàn)整個方程的顯著性。 注意:在第3步中,方便起見也可以用被解釋變量的擬合值作為解釋變量。,3。BP 檢驗(yàn):做完回歸后,使用命令: estat hettest ,normal(使用擬合值y ) estat hettest,rhs (使用方程右邊的解釋變量,而不是y ) 最初的BP 檢驗(yàn)假設(shè)擾動項(xiàng)服從正態(tài)分布,有一定局限性。Koenker(1981)將此假定放松為iid,在實(shí)際中較多采用,其命令為: estat hettest, iid estat hettest, rhs iid,1.sysuse auto,clear reg pri
5、ce weight length mpg 檢查是否具有異方差。 2。reg weight length mpg 檢查是否具有異方差。 3。use production,clear reg lny lnk lnl 檢查是否具有異方差,4。use nerlove,clear reg lntc lnq lnpl lnpf lnpk 檢驗(yàn)是否具有異方差,異方差的處理,1。使用“OLS+異方差穩(wěn)健標(biāo)準(zhǔn)誤”(robust standard error):這是最簡單,也是目前比較流行的方法。只要樣本容量較大,即使在異方差的情況下,只要使用穩(wěn)健標(biāo)準(zhǔn)誤,則所有參數(shù)估計(jì)、假設(shè)檢驗(yàn)均可照常進(jìn)行。 sysuse nl
6、sw88, clear reg wage ttl_exp race age industry hours reg wage ttl_exp race age industry hours, r,2。利用廣義最小二乘法(GLS) 廣義最小二乘法是對原模型加權(quán),使之變成一個新的不存在異方差性的模型,然后采用普通最小二乘法估計(jì)其參數(shù)。 其含義為 Var(b) =2 (XX)-1(XX) (XX)-1 通過加權(quán)使得 =I 因此,GLS和WLS要求已知。,加權(quán)最小二乘法(WLS): sysuse auto,clear reg price weight length foreign estat hette
7、st,normal 假設(shè)異方差由weight引起,即:,reg price weight length foreign aw=1/length estat hettest,normal,在本題中,造成異方差的更可能是解釋變量的線性組合,例如:,此時需要下載命令wls0 findit wls0 wls0 price weight length foreign, wvar(length foreign) type(e2) estat hettest,normal,GLS和WLS的一個缺點(diǎn)是假設(shè)擾動項(xiàng)的協(xié)方差矩陣為已知。這常常是一個不現(xiàn)實(shí)的假定。因此,現(xiàn)代計(jì)量經(jīng)濟(jì)學(xué)多使用“可行廣義最小二乘法”(FG
8、LS)。,可行廣義最小二乘法FGLS,(1) 對原方程用OLS進(jìn)行估計(jì),得到殘差項(xiàng)的估計(jì)i , (2) 計(jì)算ln(i2) (3) 用ln(2)對所有可能產(chǎn)生異方差的的解釋變量進(jìn)行回歸,然后得到擬合值 i (4) 計(jì)算i = exp(i) (5) 用1/ i 作為權(quán)重,做WLS回歸。,FGLS的步驟,predict u,res gen lnu2=ln(u2) reg lnu2 x1 x2 predict g,xb gen h=exp(g) gen invvar=1/h reg y x1 x2aweight=invvar 使用FGLS方法對nerlove.dta的方程重新進(jìn)行估計(jì)。,結(jié)論: 1.
9、GLS估計(jì)是BLUE的(如果 矩陣已知且設(shè)置正確),但FGLS不一定是BLUE的( FGLS 估計(jì)時要事先估計(jì) 矩陣的參數(shù),需要做一些假設(shè))。 2. Robust穩(wěn)健性估計(jì)更加穩(wěn)健,而FGLS更加有效,選擇時要在穩(wěn)健性和有效性之間進(jìn)行權(quán)衡。,在實(shí)際應(yīng)用中,避免異方差的兩種方法。其一,使不同變量的測度單位接近。比如,不同國家的收入和消費(fèi)數(shù)據(jù)。如果利用總收入和總消費(fèi)進(jìn)行分析,由于不同國家的總量相差非常巨大,因此模型中難免出現(xiàn)異方差。如果利用人均收入和人均消費(fèi)進(jìn)行分析,就可以使得減弱不同國家變量之間的測度差異,從而降低異方差的程度甚至消除異方差。 其二,可能的情況下對變量取自然對數(shù)。變量取對數(shù)降低了
10、變量的變化程度,因此有助于消除異方差。,自相關(guān),經(jīng)典假設(shè) 隨機(jī)誤差項(xiàng)彼此之間不相關(guān),如果存在自相關(guān),則:,時間序列數(shù)往往存在著自相關(guān),即:,一般時間序列數(shù)據(jù)中,i.i.d 假設(shè)不成立,如果存在自相關(guān):隨機(jī)誤差項(xiàng)的方差-協(xié)方差矩陣的非主對角線上的元素不為0 。,自相關(guān)包含一階自相關(guān)和高階自相關(guān)。 一階自相關(guān):,高階自相關(guān):,考察英國政府如何根據(jù)長期利率(r20)的變化來調(diào)整短期利率(rs),數(shù)據(jù)集為ukrates.dta (1)做如下回歸: ,其中: 回歸方程為: use ukrates,clear tsset month reg D.rs LD.r20,自相關(guān)的檢驗(yàn),1。圖形法:自相關(guān)系數(shù)和偏
11、自相關(guān)系數(shù) predict e1,res ac e1 pac e1 corrgram e1,lag(10),2。t檢驗(yàn)和F檢驗(yàn)(wooldridge) 思想:t檢驗(yàn),如果存在一階自相關(guān),殘差項(xiàng)與其一階滯后項(xiàng)回歸后系數(shù)顯著,如果解釋變量非嚴(yán)格外生,回歸時可加入解釋變量。 reg e1 L.e1 reg e1 L.e1 LD.r20 同理,可以用F檢驗(yàn)檢驗(yàn)是否存在高階自相關(guān) reg e1 L(1/2).e1,3。DW檢驗(yàn):只能檢驗(yàn)一階自相關(guān)的序列相關(guān)形式,并且要求解釋變量嚴(yán)格外生。,根據(jù)樣本個數(shù)和自由度查表得到DL和DU,并且構(gòu)造不同的區(qū)域。,reg D.rs LD.r20 dwstat,經(jīng)驗(yàn)上D
12、W值1.8-2.2之間接受原假設(shè),不存在一階自相關(guān)。 DW值接近于0或者接近于4,拒絕原假設(shè),存在一階自相關(guān)。,4。Q檢驗(yàn)和Bartlett檢驗(yàn) reg D.rs LD.r20 predict e2,res wntestq e2 wntestq e2,lag(2) wntestb e2,如果不能保證解釋變量嚴(yán)格外生,例如解釋變量中包含被解釋變量的滯后項(xiàng),可以用以下方法: 5。D-Ws h檢驗(yàn) estat durbinalt estat durbinalt,lag(2),6。對于高階自相關(guān)的檢驗(yàn)方法:B-G檢驗(yàn) bgodfrey bgodfrey,lag(2),自相關(guān)的處理,1. 使用OLS+異
13、方差自相關(guān)穩(wěn)健的標(biāo)準(zhǔn)誤(HAC) 方法被稱為Newey-West估計(jì)法(Newey and West,1987) reg D.rs LD.r20 newey D.rs LD.r20 ,lag(1)(假設(shè)存在一階自相關(guān)) newey D.rs LD.r20 ,lag(2) (假設(shè)存在二階自相關(guān)) 系數(shù)完全相同,但標(biāo)準(zhǔn)差和t值不同。,可行廣義最小二乘法(FGLS):廣義差分法: CO-PW方法Cochrane-Orcutt(1949) 估計(jì)(舍棄第一期觀察值) Prais-Winsten(1954) 估計(jì)(對第一期觀察值進(jìn)行處理 sqrt(1-rho2)*y1),Cochrane-Orcutt(1
14、949) 估計(jì)(舍棄第一期觀察值) prais D.rs LD.r20,corc prais D.rs LD.r20,rho(dw) corc Prais-Winsten(1954) 估計(jì)(對第一期觀察值進(jìn)行處理 sqrt(1-rho2)*y1) prais D.rs LD.r20 prais D.rs LD.r20,rho(dw) 時間序列一般樣本不會太大,因此不要輕易舍棄。,多重共線性,直觀上說:當(dāng)模型的R2非常高,但多數(shù)解釋變量都不顯著,甚至系數(shù)符號相反,可能存在多重共線性 完全的多重共線性stata會自動drop掉,例如 gen dom=1-foreign reg price weig
15、ht length foreign dom 多重共線性的檢驗(yàn):膨脹因子 estat vif 經(jīng)驗(yàn)上當(dāng) (1) VIF 的均值 =2 (2) VIF 的最大值 接近或者超過10 認(rèn)為有較為嚴(yán)重的多重共線性。,多重共線性的處理,1。不作處理:如果模型重點(diǎn)關(guān)注的是整體對被解釋變量的解釋能力,而不是具體回歸系數(shù)是否顯著,則可不處理。 2。不作處理:如果存在多重共線性,但變量顯著,此時消除多重共線性,只會使變量更加顯著,此時可不作處理。 3。刪除引起多重共線性的某個變量。 4。合并引起多重共線性的變量,例如,a和b是引起多重共線性的變量,引入新變量c=a/b,同時刪除a和b。 5。增大樣本容量。,reg price mpg weight length foreign estat vif 還可以利用解釋變量的相關(guān)系數(shù) pwcorr mpg weight length foreign 結(jié)論:weight和length具有嚴(yán)重的多重共線性 可以考慮去掉weight。 reg price mpg length foreign estat vif pwcorr mpg length foreign 多重共線性基本消除,