《面板數(shù)據(jù)回歸》PPT課件.ppt
《《面板數(shù)據(jù)回歸》PPT課件.ppt》由會員分享,可在線閱讀,更多相關(guān)《《面板數(shù)據(jù)回歸》PPT課件.ppt(63頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、面板數(shù)據(jù)回歸,時間序列數(shù)據(jù)或截面數(shù)據(jù)都是一維數(shù)據(jù)。例如時間序列數(shù)據(jù)是變量按時間得到的數(shù)據(jù);截面數(shù)據(jù)是變量在截面空間上的數(shù)據(jù)。面板數(shù)據(jù)是同時在時間和截面上取得的二維數(shù)據(jù)。所以,面板數(shù)據(jù)(panel data)也稱時間序列截面數(shù)據(jù)(time series and cross section data)或混合數(shù)據(jù)(pool data)。,面板數(shù)據(jù),簡言之是時間序列和截面數(shù)據(jù)的混合。嚴(yán)格地講是指對一組個體(如居民、國家、公司等) 連續(xù)觀察多期得到的資料。所以很多時候我們也稱其為“追蹤資料”。近年來,由于面板數(shù)據(jù)資料的獲得變得相對容易,使其應(yīng)用范圍也不斷擴(kuò)大。,1996-2002年中國15個省級地區(qū)的居
2、民家庭人均消費(fèi)數(shù)據(jù)(不變價格) (例一),面板數(shù)據(jù)的格式(例二),當(dāng)描述截面數(shù)據(jù)時,我們用下標(biāo)表示個體,如Yi表示第i個個體的變量Y。當(dāng)描述面板數(shù)據(jù)時,我們需要其他符號來同時表示個體和時期。為此我們采用雙下標(biāo)而不是單下標(biāo),其中第一個下標(biāo)i表示個體,第二個下標(biāo)t表示觀測時間。 于是Yit表示n個個體中第i個個體在T期中的第t個時期內(nèi)變量Y的觀測值。,面板數(shù)據(jù)用雙下標(biāo)變量表示。例如 Yit, i = 1, 2, , N; t = 1, 2, , T N表示面板數(shù)據(jù)中含有N個個體。T表示時間序列的最大長度。,對于樣本點(diǎn)來說:,Stata中面板數(shù)據(jù)的表示,在stata中,首先使用xtset命令指定個體
3、特征和時間特征,然后可以用xtdes命令顯示面板數(shù)據(jù)的結(jié)構(gòu)。 use fatality,clear xtset state year xtdes,短面板和長面板,如果面板數(shù)據(jù) T 較小,而n 較大,這種面板數(shù)據(jù)被稱為“短面板”(short panel)。(大n小T)如fatality.dta 反之,如果T 較大,而n 較小,則被稱為“長面板”(long panel)。 (大T小n)如Grunfeld.dta,面板數(shù)據(jù)的優(yōu)勢,(1)可以解決遺漏變量問題:遺漏變量偏差是一個普遍存在的問題。雖然可以用工具變量法解決,但有效的工具變量常常很難找。遺漏變量常常是由于不可觀測的個體差異或“異質(zhì)性”(het
4、erogeneity)所造成,如果這種個體差異“不隨時間而改變”(time invariant),則面板數(shù)據(jù)提供了解決遺漏變量問題的又一利器。 (2)提供更多個體動態(tài)行為的信息:由于面板數(shù)據(jù)同時有截面與時間兩個維度,有時它可以解決單獨(dú)的截面數(shù)據(jù)或時間序列數(shù)據(jù)所不能解決的問題。,比如,如何區(qū)分規(guī)模效應(yīng)與技術(shù)進(jìn)步對企業(yè)生產(chǎn)效率的影響。在截面數(shù)據(jù)中,由于沒有時間維度,故無法觀測到技術(shù)進(jìn)步。然而,對于單個企業(yè)的時間序列數(shù)據(jù)來說,我們無法區(qū)分其生產(chǎn)效率的提高究竟有多少是由于規(guī)模擴(kuò)大,有多少是由于技術(shù)進(jìn)步。 (3)樣本容量較大:由于同時有截面維度與時間維度,通常面板數(shù)據(jù)的樣本容量更大,可以提高估計(jì)的精確度
5、。,面板數(shù)據(jù)的建模方法主要有三種: 固定效應(yīng)回歸模型 隨機(jī)效應(yīng)回歸模型 混合回歸模型,實(shí)例:交通事故死亡人數(shù)和酒精稅,由此我們就能得出增加啤酒稅收會導(dǎo)致更多的交通事故死亡人數(shù)嗎?不一定,這是因?yàn)檫@些回歸中可能存在著巨大的遺漏變量偏差。,影響死亡率的因素有很多,包括: 1。州內(nèi)駕駛的汽車質(zhì)量; 2。高速公路的維修情況是否良好; 3。大部分駕駛的路程是在鄉(xiāng)下還是市內(nèi); 4。路上的汽車密度; 5。社會文化能否接受酒后駕車等。 這些因素都有可能與酒精稅有關(guān)。 若相關(guān),則會導(dǎo)致遺漏變量偏差。一種解決這些導(dǎo)致遺漏變量偏差潛在根源的方法是收集這些變量的數(shù)據(jù),并把它們加入到上式中。不幸的是,我們很難或不可能度
6、量諸如酒后駕車的文化接受度等變量。,解決方法:固定效應(yīng)OLS回歸,具有兩個時期的面板數(shù)據(jù):“前后”比較,特別注意:Zi不隨時間變化,結(jié)論: 兩期的變化(差分)表示的回歸消除了隨時間不變的不可觀測變量Zi的效應(yīng)。換言之,分析Y和X的變化可以控制隨時間不變的變量,于是就消除了這種產(chǎn)生遺漏變量偏差的來源。,當(dāng)數(shù)據(jù)是在兩個不同年份里觀測得到的時候,這種“前后”分析很有效。但我們的數(shù)據(jù)集中包含7個不同年份里的觀測值,即當(dāng)T2時不能直接應(yīng)用這種“前后”比較方法。為了分析該面板數(shù)據(jù)集中的所有觀測值,我們使用固定效應(yīng)回歸方法。,固定效應(yīng)模型,對于特定的個體i而言,ai 表示那些不隨時間改變的影響因素,如個人的
7、消費(fèi)習(xí)慣、國家的社會制度、地區(qū)的特征、性別等,一般稱其為“個體效應(yīng)” (individual effects)。如果把“個體效應(yīng)”當(dāng)作不隨時間改變的固定性因素, 相應(yīng)的模型稱為“固定效應(yīng)”模型。,對于固定效應(yīng)模型,可采用虛擬變量法。 基本思想:固定效應(yīng)模型實(shí)質(zhì)上就是在傳統(tǒng)的線性回歸模型中加入 N-1 個虛擬變量,使得每個截面都有自己的截距項(xiàng)。 由于固定效應(yīng)模型假設(shè)存在著“個體效應(yīng)”,每個個體都有其單獨(dú)的截距項(xiàng)。這就相當(dāng)于在原方程中引入n1個虛擬變量(如果省略常數(shù)項(xiàng),則引入n個虛擬變量)來代表不同的個體,獲得每個個體的截?fù)?jù)項(xiàng)。,如何理解個體效應(yīng)、個體截距項(xiàng)的不同以及虛擬變量的引入? 我們用一份模
8、擬的數(shù)據(jù)來分析: use example,clear xtset company year xtdes 1。 畫出散點(diǎn)圖和擬合線,并建立OLS回歸方程。 2。加入虛擬變量,并重新畫出建立OLS回歸方程。,reg y x,gen d1=0 gen d2=0 gen d3=0 replace d1=1 if id=1 replace d2=1 if id=2 replace d3=1 if id=3 reg y x d1 d2,固定效應(yīng)模型的估計(jì)算法,“個休中心化”O(jiān)LS算法或者組內(nèi)離差估計(jì)法 假設(shè)原方程為:,(式1),給定第i 個個體,將(式1)兩邊對時間取平均可得,,(式2),(式1) (式2
9、),得:,可以用OLS方法一致地估計(jì) ,稱為“固定效應(yīng)估計(jì)量”(Fixed Effects Estimator),記為,由于 主要使用了每個個體的組內(nèi)離差信息,故也稱為“組內(nèi)估計(jì)量”(within estimator)。,固定效應(yīng)模型的優(yōu)勢和劣勢,面板固定效應(yīng)模型的優(yōu)勢是:即使個體特征ui與解釋變量Xit相關(guān),只要使用組內(nèi)估計(jì)量,就可以得到一致估計(jì),即即使存在不隨時間改變的遺漏變量,也可得到無偏一致的估計(jì)。 面板固定效應(yīng)模型的劣勢是:模型無法估計(jì)不隨時間而變的變量之影響,這需要用隨機(jī)效應(yīng)模型。,在交通事故死亡人數(shù)中的應(yīng)用,由于(10. 8)式中的“差分”回歸只用了1982年和1988年的數(shù)據(jù)(
10、具體講就是這兩年的差額),而(10. 15)式中的固定效應(yīng)回歸用到了所有7年的數(shù)據(jù),因此這兩個回歸是不同的。由于利用了更多的數(shù)據(jù),因此(10. 15)式中的標(biāo)準(zhǔn)誤差小于(10. 8)式中的標(biāo)準(zhǔn)誤差。,固定效應(yīng)模型的stata實(shí)現(xiàn),use fatality,clear xtset state year xtdes xtline FatalityRate 固定效應(yīng)模型: xtreg FatalityRate beertax,fe,回歸結(jié)果解讀,1。三個R2哪個重要? 2。固定效應(yīng)為什么有兩個F檢驗(yàn)? 3。corr(u_i, Xb) 的含義。 4。 sigma_u、sigma_e、rho的含義。,1
11、。因?yàn)楣潭ㄐ?yīng)模型是組內(nèi)估計(jì)量(離差),因此,只有within是一個真正意義上的R2,其他兩個是組間相關(guān)系數(shù)的平方。 2。右側(cè)的F統(tǒng)計(jì)量表示除常數(shù)項(xiàng)外其他解釋變量的聯(lián)合顯著性。最后一個F檢驗(yàn),原假設(shè)所有U_i=0,即不存在個體效應(yīng),不必使用固定效應(yīng)模型。,首先注意:結(jié)果中的u_i不表示殘差,而是表示個體效應(yīng)。,3。corr(u_i, Xb) 個體效應(yīng)與解釋變量的相關(guān)系數(shù),相關(guān)系數(shù)為0或者接近于0,可以使用隨機(jī)效應(yīng)模型;相關(guān)系數(shù)不為0,需要使用固定效應(yīng)模型。 4。 sigma_u:表示個體效應(yīng)的標(biāo)準(zhǔn)差 sigma_e:表示干擾項(xiàng)的標(biāo)準(zhǔn)差 rho:rho = sigma_u2 / (sigma_u
12、2 + sigma_e2) 個體效應(yīng)的波動占整個波動的比例。,顯示每個個體截距的方法: tab state,gen(dum) drop dum1 reg FatalityRate beertax dum*,例二,use grunfeld,clear xtset company year xtdes xtline invest 固定效應(yīng)模型: xtreg invest mvalue kstock ,fe,顯示每個個體截距的方法: tab company , gen(dum) reg invest mvalue kstock dum*,nocons drop dum1 reg invest mva
13、lue kstock dum* 分析每個公司的截距,時間固定效應(yīng)回歸,其中St是只隨時間改變,不隨個體改變的變量。,和個體固定效應(yīng)能控制不隨時問變化但個體間不同的變量一樣,時間固定效應(yīng)能控制個體間相同但隨時間變化的變量。 由于新車安全性能的提高是發(fā)生在全國范圍內(nèi)的。因此它們能夠減少所有州的交通死亡事故。故把汽車安全性能視為隨時間變化但對所有州都相同的遺漏變量是合理的。于是加入用St表示的汽車安全性能的效應(yīng)后,得:,只有時間效應(yīng),我們暫時假設(shè)Zi不出現(xiàn),方程變?yōu)椋?我們的目的是在控制St條件下估計(jì)1,在上述例子中加入時間固定效應(yīng)。 實(shí)際上添加了t-1個時間虛擬變量。主要反映隨著時間變化的一些特征
14、。 use fatality,clear tab year,gen(yr) edit drop yr1 reg FatalityRate beertax yr* 幾乎所有時間虛擬變量均不顯著,說明FatalityRate不隨時間的變動呈現(xiàn)變動的趨勢。,個體和時間固定效應(yīng)(雙向固定效應(yīng)模型),如果某些遺漏變量不隨時間變化但隨州變化(如對酒后駕車的文化接受度),而其他遺漏變量不隨州變化但隨時間變化(如國家安全標(biāo)準(zhǔn)),則在模型中同時加入個體(州)和時間效應(yīng)更為恰當(dāng),我們稱為雙向固定效應(yīng)模型。 固定效應(yīng)模型: Yit=ai+Xit1+it 雙向固定效應(yīng)模型:Yit=ai+t+Xit1+it,雙向固定效
15、應(yīng)模型的估計(jì),雙向固定效應(yīng)模型可以通過加入n-1個個體二元變量和T-1個時間二元變量進(jìn)行OLS估計(jì),但這會使解釋變量的數(shù)目變得極為龐大! 所以一般我們還是采用組內(nèi)離差法進(jìn)行估計(jì)。 方法一:可以通過先從Y和X中減去個體和時間平均值,然后估計(jì)被減后的Y關(guān)于被減后的X的多元回歸方程的方法來估計(jì)X的系數(shù)。這種方法可以避免二元變量的出現(xiàn)。 方法二:從Y, X和時間指示變量中減去個體(不是時間)均值然后估計(jì),被減后的Y對被減后的X和被減后的時間指示變量的多元回歸中的k+T個系數(shù)。,在交通死亡人數(shù)中的應(yīng)用,上述形式中包含了啤灑稅,47個州二元變量(州固定效應(yīng)),6個年二元變量(時間固定效應(yīng))和截距項(xiàng),所以這
16、個模型的解釋變量個數(shù)多達(dá)55個,這將帶來大量的自由度的損失。因?yàn)闀r間和州二元變量和截距項(xiàng)的系數(shù)不是我們主要感興趣的,所以我們在這里沒有列出。 比較參數(shù)發(fā)現(xiàn)加入時間效應(yīng)后啤酒稅的系數(shù)由-0.66變?yōu)?0.64,可見加入時間效應(yīng)對結(jié)果影響不大。,固定效應(yīng)回歸假設(shè)和固定效應(yīng)回歸的標(biāo)準(zhǔn)誤差,本章給出的標(biāo)準(zhǔn)誤差是利用一般異方差穩(wěn)健公式計(jì)算得到的。當(dāng)T中等大小或較大時,在稱為固定效應(yīng)回歸假設(shè)的五個假設(shè)條件下面板數(shù)據(jù)中的這些異方差穩(wěn)健標(biāo)準(zhǔn)誤差都是正確的。,固定效應(yīng)回歸假設(shè),自相關(guān)(序列相關(guān)),(如果違反,則出現(xiàn)自相關(guān)),固定效應(yīng)回歸的標(biāo)準(zhǔn)誤差,如果重要概念10.3中的假設(shè)5成立,則給定回歸變量條件下,誤差u
17、在時間上不相關(guān),在這種情況下如果T中等大小或較大時,則常用(異方差穩(wěn)健)標(biāo)準(zhǔn)誤差是正確的。 如果誤差自相關(guān),則常用標(biāo)準(zhǔn)誤差公式不正確。理解這一點(diǎn)的一種方法是同異方差做類比。在截面數(shù)據(jù)回歸中,如果誤差異方差,則由于同方差適用的標(biāo)準(zhǔn)誤差是在同方差的錯誤假設(shè)下導(dǎo)出的,因此是不正確的。類似地,如果面板數(shù)據(jù)中的誤差自相關(guān),則由于常用標(biāo)準(zhǔn)誤差是在它們沒有自相關(guān)的錯誤假設(shè)下導(dǎo)出的,因此也是不正確的。,由于面板數(shù)據(jù)具有潛在異方差且在給定個休的不同時間上潛在相關(guān)時,正確的標(biāo)準(zhǔn)誤差稱為異方差和自相關(guān)一致的標(biāo)準(zhǔn)誤差(HAC)。這種標(biāo)準(zhǔn)誤差由稱為群標(biāo)準(zhǔn)誤差。 在時間序列中使用的命令是newey 在面板數(shù)據(jù)中使用的命令
18、是xtgls,有關(guān)酒后駕車的法律規(guī)定和交通事故死亡人數(shù),酒精稅只是抑制酒后駕車的一種方法,如果某州想要打擊酒后駕車,可以通過增加稅收和嚴(yán)酷的法律來做到這一點(diǎn)。因此,即使在包含州和時間固定效應(yīng)的模型中遺漏這些有關(guān)酒后駕車的法律也會導(dǎo)致啤酒稅對交通死亡事故效應(yīng)的OLS估計(jì)量中存在遺漏變量偏差。此外,是否開車也部分取決于司機(jī)是否有工作,同時,稅收變化也反映了經(jīng)濟(jì)狀況(如州預(yù)算赤字會增加稅收)。所以遺漏州的經(jīng)濟(jì)狀況也會導(dǎo)致遺漏變量偏差。,本節(jié)中我們將前面的分析推廣到保持經(jīng)濟(jì)狀況不變條件下有關(guān)酒后駕車的法律規(guī)定(包括啤酒稅)對交通死亡事故效應(yīng)的研究。為此,我們需要估計(jì)包含其他酒后駕車法律和州經(jīng)濟(jì)狀況的回
19、歸變量的面板數(shù)據(jù)回歸。 這些結(jié)果刻畫了一幅抑制酒后駕車和交通死亡事故措施引發(fā)爭議的畫面。這些估計(jì)值表明嚴(yán)厲的處罰和提高最低法定喝酒年齡對死亡率都不會產(chǎn)生重要作用。相反,有證據(jù)表明提高類似啤酒稅這樣的酒精稅會減少交通死亡率。但這個效應(yīng)的估計(jì)仍是不精確的。,隨機(jī)效應(yīng)模型,對于面板數(shù)據(jù)而言,除了我們前面講的混合回歸和固定效應(yīng)模型以外,還存在另外一種模型形式:隨機(jī)效應(yīng)模型。 為了區(qū)別固定效應(yīng)模型和隨機(jī)效應(yīng)模型,我們把兩個模型的方程分別寫成:,固定效應(yīng)模型,隨機(jī)效應(yīng)模型,兩個模型看似一樣,但模型形式截然不同: 在固定效應(yīng)模型中: 作為一個隨機(jī)變量(解釋變量),標(biāo)示模型的個體效應(yīng)。 而在隨機(jī)效應(yīng)模型中:隨
20、機(jī)誤差項(xiàng)分成兩部分,一部分是不隨時間變化的誤差項(xiàng) ,另一部分是隨時間變化的誤差項(xiàng) ,即 其中,關(guān)于隨機(jī)效應(yīng)模型: 1。隨機(jī)效應(yīng)模型將固定效應(yīng)模型的個體效應(yīng)歸入到隨機(jī)誤差項(xiàng)中,因此更加靈活。 2。固定效應(yīng)模型通過組內(nèi)離差的方法消除掉不隨時間改變的變量,這一方面保證了模型的無偏性,另一方面模型無法估計(jì)不隨時間改變的變量之影響,這在隨機(jī)效應(yīng)模型中可以實(shí)現(xiàn)。 3?;貧w的結(jié)果是隨機(jī)效應(yīng)模型的所有的個體具有相同的截距項(xiàng),個體的差異主要反應(yīng)在隨機(jī)干擾項(xiàng)的設(shè)定上。,4。由于上述特性,隨機(jī)效應(yīng)模型比固定效應(yīng)模型結(jié)果更加有效,同時,條件更加苛刻。,隨機(jī)效應(yīng)模型必須滿足下列條件:,一般在固定效應(yīng)模型中,隨機(jī)效應(yīng)模型
21、: xtreg invest mvalue kstock ,re 回歸結(jié)果解讀。 與固定效應(yīng)模型的結(jié)果比較。,3。固定效應(yīng)還是隨機(jī)效應(yīng)? Hausman檢驗(yàn) 基本思想:如果 , Fe 和 Re 都是一致的,但Re更有效。 如果 , Fe 仍然一致,但Re是有偏的。 因此 原假設(shè): 即應(yīng)該采用隨機(jī)效應(yīng)。 備則假設(shè) 應(yīng)該采用固定效應(yīng)。,xtreg invest mvalue kstock ,fe est store fixed xtreg invest mvalue kstock ,re est store random hausman fixed random 本題接受原假設(shè),即應(yīng)該用隨機(jī)效應(yīng)。,多數(shù)實(shí)證研究都采用固定效應(yīng)模型或雙向固定效應(yīng)模型,
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 市教育局冬季運(yùn)動會安全工作預(yù)案
- 2024年秋季《思想道德與法治》大作業(yè)及答案3套試卷
- 2024年教師年度考核表個人工作總結(jié)(可編輯)
- 2024年xx村兩委涉案資金退還保證書
- 2024年憲法宣傳周活動總結(jié)+在機(jī)關(guān)“弘揚(yáng)憲法精神推動發(fā)改工作高質(zhì)量發(fā)展”專題宣講報告會上的講話
- 2024年XX村合作社年報總結(jié)
- 2024-2025年秋季第一學(xué)期初中歷史上冊教研組工作總結(jié)
- 2024年小學(xué)高級教師年終工作總結(jié)匯報
- 2024-2025年秋季第一學(xué)期初中物理上冊教研組工作總結(jié)
- 2024年xx鎮(zhèn)交通年度總結(jié)
- 2024-2025年秋季第一學(xué)期小學(xué)語文教師工作總結(jié)
- 2024年XX村陳規(guī)陋習(xí)整治報告
- 2025年學(xué)校元旦迎新盛典活動策劃方案
- 2024年學(xué)校周邊安全隱患自查報告
- 2024年XX鎮(zhèn)農(nóng)村規(guī)劃管控述職報告