重復(fù)測(cè)量資料方差分析.ppt
重復(fù)測(cè)量設(shè)計(jì)方差分析,方差分析,單因素:完全隨機(jī)設(shè)計(jì)兩因素:隨機(jī)區(qū)組設(shè)計(jì)多因素:析因、拉丁方、正交設(shè)計(jì),重復(fù)測(cè)量設(shè)計(jì),單組多組,第一節(jié)重復(fù)測(cè)量資料數(shù)據(jù)特征第二節(jié)重復(fù)測(cè)量資料的方差分析第三節(jié)重復(fù)測(cè)量方差分析案例及SAS實(shí)現(xiàn),3,第一節(jié)重復(fù)測(cè)量資料數(shù)據(jù)特征,重復(fù)測(cè)量的定義,重復(fù)測(cè)量(repeatedmeasure)是指對(duì)同一研究對(duì)象的某一觀察指標(biāo)在不同場(chǎng)合(occasion,如時(shí)間點(diǎn))進(jìn)行的多次測(cè)量。,(1)隨時(shí)間變化趨勢(shì),如生長(zhǎng)發(fā)育模型(2)時(shí)間上的穩(wěn)定性分析,如環(huán)境監(jiān)測(cè)中對(duì)同一地區(qū)不同時(shí)間點(diǎn)的污染情況進(jìn)行動(dòng)態(tài)監(jiān)測(cè)(3)結(jié)果變量的可重復(fù)性,如實(shí)驗(yàn)室中某儀器或?qū)嶒?yàn)的準(zhǔn)確性,重復(fù)測(cè)量資料的研究目的,重復(fù)測(cè)量設(shè)計(jì),重復(fù)測(cè)量設(shè)計(jì)(repeatedmeasurementdesign)受試者內(nèi)設(shè)計(jì)(within-subjectdesign)是指同一觀察對(duì)象的某觀察指標(biāo)在不同時(shí)間點(diǎn)上進(jìn)行多次觀察,醫(yī)學(xué)研究中十分常見。如:兒童生長(zhǎng)發(fā)育中多次測(cè)量臨床試驗(yàn)中患者接受治療后在不同時(shí)間測(cè)量結(jié)果流行病學(xué)研究中接受干預(yù)后多次隨訪觀測(cè)結(jié)果,重復(fù)測(cè)量資料,重復(fù)測(cè)量資料,是重復(fù)測(cè)量設(shè)計(jì)中所獲取的多次測(cè)量資料。不同稱謂:縱向數(shù)據(jù)(Longitudinaldata),如在生長(zhǎng)發(fā)育研究中重復(fù)測(cè)量資料(Repeatedmeasuresdata),如在臨床試驗(yàn)研究中面板數(shù)據(jù)(Paneldata),如在社會(huì)學(xué)研究中,(1)平衡資料:如果每一個(gè)體重復(fù)測(cè)量的時(shí)間和次數(shù)相同,稱為平衡資料。(2)非平衡資料:不同個(gè)體重復(fù)測(cè)量的時(shí)間點(diǎn)不同,或重復(fù)次數(shù)不同,稱為非平衡資料。,重復(fù)測(cè)量資料,同一受試對(duì)象的同一觀察指標(biāo)在不同時(shí)間點(diǎn)上進(jìn)行多次測(cè)量所得的資料,常用來(lái)分析該觀察指標(biāo)在不同時(shí)間點(diǎn)上的變化。有時(shí)是從同一個(gè)體的不同部位(或組織)上重復(fù)測(cè)量獲得的指標(biāo)的觀測(cè)值。,目的:就是比較不同時(shí)間點(diǎn)動(dòng)態(tài)變化趨勢(shì)的特征,重復(fù)測(cè)量資料,(1)同一觀察對(duì)象的重復(fù)測(cè)量值之間是非獨(dú)立的,后一次測(cè)量的數(shù)據(jù)可能受前一次測(cè)量結(jié)果的影響。這不符合傳統(tǒng)的統(tǒng)計(jì)分析方法中關(guān)于獨(dú)立性的假設(shè)。(2)觀察指標(biāo)在所測(cè)量的時(shí)間范圍內(nèi)可能成趨勢(shì)性變化。(3)觀察值的變異來(lái)源較多,有來(lái)自個(gè)體內(nèi)的變異,個(gè)體間的變異,或更高水平上的變異;變異可能與時(shí)間有關(guān),或其他協(xié)變量有關(guān)。,重復(fù)測(cè)量資料的特點(diǎn),重復(fù)測(cè)量資料的數(shù)據(jù)特征,當(dāng)對(duì)同一受試對(duì)象在不同時(shí)間重復(fù)測(cè)量次數(shù)p3時(shí),稱為重復(fù)測(cè)量設(shè)計(jì)或重復(fù)測(cè)量數(shù)據(jù)。,實(shí)例舉例1,每一根線代表1只兔子,實(shí)例舉例2,每一根線代表1位病人,典型的重復(fù)測(cè)量資料,典型的重復(fù)測(cè)量資料,實(shí)際中:重復(fù)測(cè)量資料比獨(dú)立資料更多見,臨床研究中,需要觀察病人在不同時(shí)間的某些生理、生化或病理指標(biāo)的變化趨勢(shì),研究不同時(shí)間或療程的治療效果。流行病學(xué)研究中,觀察隊(duì)列人群在不同時(shí)間上的發(fā)病情況。研究不同職業(yè)、性別人群實(shí)施某種控制后,不同時(shí)間的多次效果考察。衛(wèi)生學(xué)研究中,縱向觀察兒童生長(zhǎng)發(fā)育規(guī)律等,不同地區(qū)和環(huán)境營(yíng)養(yǎng)狀況。,簡(jiǎn)單處理:對(duì)平衡的重復(fù)測(cè)量資料,分別在各時(shí)間點(diǎn)上進(jìn)行分析集合分析:將各個(gè)體的幾次不同觀察值相加,得到該個(gè)體的一個(gè)綜合值,再進(jìn)行比較分析兩階段分析:為每個(gè)研究對(duì)象獨(dú)立擬合時(shí)間函數(shù),再對(duì)擬合結(jié)果求均數(shù)。,重復(fù)測(cè)量資料的常見誤用,減少樣本含量控制個(gè)體變異非實(shí)驗(yàn)因素(干擾因素),滯留效應(yīng)(carry-overeffect)潛隱效應(yīng)(latenteffect)學(xué)習(xí)效應(yīng)(learningeffect),重復(fù)測(cè)量設(shè)計(jì)優(yōu)缺點(diǎn),21,重復(fù)測(cè)量設(shè)計(jì)與配對(duì)設(shè)計(jì)的區(qū)別?,1.隨機(jī)區(qū)組設(shè)計(jì)要求每個(gè)區(qū)組內(nèi)實(shí)驗(yàn)單位彼此獨(dú)立,區(qū)組號(hào)A營(yíng)養(yǎng)素B營(yíng)養(yǎng)素C營(yíng)養(yǎng)素150.1058.2064.50247.8048.5062.40353.1053.8058.60463.5064.2072.50571.2068.4079.30641.4045.7038.40761.9053.0051.20842.2039.8046.20,表A、B、C3種營(yíng)養(yǎng)素喂養(yǎng)小白鼠所增體重(克),處理因素只能在區(qū)組內(nèi)隨機(jī)分配每個(gè)實(shí)驗(yàn)單位接受處理是不同的見右表:,重復(fù)測(cè)量設(shè)計(jì)與隨機(jī)區(qū)組設(shè)計(jì)的區(qū)別?,2.重復(fù)測(cè)量設(shè)計(jì)區(qū)組內(nèi)實(shí)驗(yàn)單位彼此不獨(dú)立,同一受試的血樣重復(fù)測(cè)量結(jié)果是高度相關(guān),提示:分析存在一定的復(fù)雜性。,小結(jié)重復(fù)測(cè)量資料,數(shù)據(jù):對(duì)同一受試對(duì)象的某個(gè)觀察指標(biāo)進(jìn)行連續(xù)觀測(cè)所得至少有兩個(gè)因素:處理因素、時(shí)間因素;重復(fù)測(cè)量的試驗(yàn)結(jié)果按時(shí)間順序固定排列,不能像隨機(jī)區(qū)組設(shè)計(jì)的處理那樣隨機(jī)排列。觀察指標(biāo)在所測(cè)量的時(shí)間范圍內(nèi)可能成趨勢(shì)性變化;同一個(gè)體不同時(shí)間測(cè)量值之間高度相關(guān);觀察值的變異來(lái)源較多,有來(lái)自個(gè)體內(nèi)的變異,個(gè)體間的變異,或更高水平上的變異;變異可能與時(shí)間有關(guān),或其他協(xié)變量有關(guān)。,第二節(jié)重復(fù)測(cè)量資料方差分析,想一想?,同一觀察單位具有多個(gè)觀察值,而這些觀察值來(lái)自同一受試對(duì)象的不同時(shí)點(diǎn)(部位等),這類數(shù)據(jù)間往往有相關(guān)性存在,違背了方差分析要求數(shù)據(jù)滿足獨(dú)立性基本條件。,將總變異分解為:個(gè)體間(betweensubjects)變異個(gè)體內(nèi)(withinsubject)變異,其中個(gè)體內(nèi)變異是與重復(fù)因素有關(guān)的變量。,重復(fù)測(cè)量資料的方差分析總思想,平均值之間的多重比較,先采用配對(duì)t檢驗(yàn)方法,計(jì)算需比較的兩兩均數(shù)的t統(tǒng)計(jì)量,然后將這些樣本統(tǒng)計(jì)量t值與Bonferroni臨界t值進(jìn)行比較。確定P值是否大于,重復(fù)測(cè)量資料,多變量重復(fù)測(cè)量方差分析,單變量重復(fù)測(cè)量方差分析,重復(fù)測(cè)量資料分類repeatedmeasurementdata,多變量重復(fù)測(cè)量方差分析,單變量重復(fù)測(cè)量方差分析,重復(fù)測(cè)量資料分類repeatedmeasurementdata,兩組,單組,重復(fù)測(cè)量資料,重復(fù)測(cè)量方差分析模型,式中,為總均值,g表示第g個(gè)處理水平的效應(yīng),j表示第j個(gè)測(cè)量時(shí)間點(diǎn)的效應(yīng),表示第g組第i個(gè)受試者的效應(yīng),該效應(yīng)為隨機(jī)效應(yīng),表示處理因素第g個(gè)水平在第j個(gè)測(cè)量時(shí)間點(diǎn)上的效應(yīng),也就是處理因素與時(shí)間點(diǎn)的交互效應(yīng),為隨機(jī)誤差。,單變量重復(fù)測(cè)量方差分析,1.單組重復(fù)測(cè)量指同一組內(nèi)(或接受同一種處理)的多個(gè)受試者,在多個(gè)時(shí)間點(diǎn)上的反應(yīng)變量所作的測(cè)量,又稱為單變量重復(fù)測(cè)量。,2.多組重復(fù)測(cè)量(多組并不等于多因素)指將受試者按處理的不同水平分為幾個(gè)組,對(duì)這些組內(nèi)的每一受試者,都在不同時(shí)間點(diǎn)對(duì)他們的反應(yīng)變量進(jìn)行測(cè)量。,重復(fù)測(cè)量資料方差分析的條件:1.正態(tài)性處理因素的各處理水平的樣本個(gè)體之間是相互獨(dú)立的隨機(jī)樣本,其總體均數(shù)服從正態(tài)分布;2.方差齊性相互比較的各處理水平的總體方差相等,即具有方差齊同3.各時(shí)間點(diǎn)組成的協(xié)方差陣(covariancematrix)具有球形性(sphericity)特征。,Box(1954)指出,若球形性質(zhì)得不到滿足,則方差分析的F值是有偏的,這會(huì)造成過多的拒絕本來(lái)是真的無(wú)效假設(shè)(增加型錯(cuò)誤)。,重復(fù)測(cè)量資料方差分析的前提條件,重復(fù)測(cè)量方差分析的球性假定,方差是指在某一時(shí)點(diǎn)上測(cè)定值變異性的大小,而協(xié)方差是指在兩個(gè)不同時(shí)點(diǎn)上測(cè)定值相互變異性的大小。如果在某個(gè)時(shí)點(diǎn)上的取值不影響其他時(shí)點(diǎn)上的取值,則協(xié)方差為0,反之,則不為0。由方差協(xié)方差構(gòu)成的矩陣稱協(xié)方差陣。,設(shè)k、l為兩個(gè)測(cè)定時(shí)點(diǎn),代表協(xié)方差陣中的元素。當(dāng)kl時(shí)為方差,kl時(shí)為協(xié)方差。共有a個(gè)測(cè)定時(shí)點(diǎn),將這a個(gè)方差和(a-1)/2個(gè)協(xié)方差排成協(xié)方差陣V為:,協(xié)方差陣的球形假定是指該矩陣主對(duì)角線元素(方差)相等、非主對(duì)角線元素(協(xié)方差)為零。,重復(fù)測(cè)量方差分析的球性假定,所有兩兩時(shí)間點(diǎn)變量間差值對(duì)應(yīng)的方差相等,對(duì)于yi與yj兩時(shí)間點(diǎn)變量間差值對(duì)應(yīng)的方差可采用協(xié)方差矩陣計(jì)算為:,重復(fù)測(cè)量方差分析的球性假定,s1-22=10+20-2(5)=20s1-32=10+30-2(10)=20s1-42=10+40-2(15)=20s2-32=20+30-2(15)=20s2-42=20+40-2(20)=20s3-42=30+40-2(25)=20,所有兩兩差值對(duì)應(yīng)的方差相等,說明滿足球形假定。,重復(fù)測(cè)量方差分析的球性假定,球性假定常用Mauchly法進(jìn)行檢驗(yàn)Mauchly法檢驗(yàn)的P值若大于研究者所選擇的顯著性水準(zhǔn)時(shí),說明協(xié)方差陣的球形性質(zhì)得到滿足。否則,必須對(duì)與時(shí)間有關(guān)的F統(tǒng)計(jì)量的分子、分母自由度進(jìn)行調(diào)整,以便減少犯I類錯(cuò)誤的概率。注意:該法在小樣本時(shí)很難檢出差異。,重復(fù)測(cè)量方差分析的球性假定,對(duì)角線元素(方差)相等非主對(duì)角線元素(協(xié)方差)為零,球形對(duì)稱的檢驗(yàn),用Mauchly法檢驗(yàn)協(xié)方差陣是否為球形H0:資料符合球形要求,H1:資料不滿足球形要求檢驗(yàn)的P值若大于研究者所選擇的顯著性水準(zhǔn)時(shí),說明協(xié)方差陣的球形性質(zhì)得到滿足。,球形條件不滿足怎么辦,常有兩種方法可供選擇:對(duì)重復(fù)測(cè)量ANOVA檢驗(yàn)結(jié)果中與時(shí)間有關(guān)的F值的自由度進(jìn)行調(diào)整(調(diào)?。┎捎肕ANOVA(多變量方差分析方法),(1)Geenhouse-Geisser調(diào)整系數(shù)(G-G)(2)Huynh-Feldt調(diào)整系數(shù)(H-F),分子自由度,分母自由度,自由度調(diào)整方法1,自由度調(diào)整方法2,調(diào)整規(guī)則,調(diào)整后的F臨界值較原先大,提高了拒絕H0的門檻。減少了犯I類錯(cuò)誤的概率。,多變量方差分析統(tǒng)計(jì)量,目前多數(shù)統(tǒng)計(jì)軟件會(huì)給出四個(gè)統(tǒng)計(jì)量:WilkslambdaPillaistrace、Hotelling-LawleytraceRoyslargestroot。,多變量方差分析統(tǒng)計(jì)量,Wilkslambda指標(biāo)的含義是最明確的,其計(jì)算公式為|H|/(|H|+|E|)。反映了組內(nèi)方差占總方差(組間方差+組內(nèi)方差)的比例。該值越小,組間方差越大,意味著組間差異越大。其它三個(gè)指標(biāo)的含義并不是很直觀:Hotelling-Lawleytrace是HE-1矩陣的對(duì)角線方差之和。Pillaistrace是H(H+E)-1矩陣的對(duì)角線方差之和。Royslargestroot是HE-1矩陣的最大特征值。,第三節(jié)重復(fù)測(cè)量方差分析案例及SAS實(shí)現(xiàn),重復(fù)測(cè)量方差分析的SAS語(yǔ)句,procglm;class分組變量;model分析變量=分組變量;lsmeans分組變量;means分組變量;repeated重復(fù)測(cè)量變量名/;,repeated重復(fù)測(cè)量變量名/;【repeated】后必須指定重復(fù)測(cè)量變量名,測(cè)量水平可選,轉(zhuǎn)換項(xiàng)也是可選的。如:repeatedtime4;表示指定重復(fù)測(cè)量變量名為time,測(cè)量水平(即重復(fù)次數(shù))為4次,中間均以空格隔開。其中time由讀者自行命名,也可為其它名稱,如repeatedt4,repeatedmeasure4等均可。,重復(fù)測(cè)量方差分析的SAS語(yǔ)句,repeated語(yǔ)句后的主要用于各次測(cè)量之間的比較,常用的有兩種轉(zhuǎn)換方式:contrast和polynomial。contrast表示指定一個(gè)參照水平,其它均與參照水平比較。如repeatedtime4contrast(1);表示共有4次重復(fù)測(cè)量,以第1次測(cè)量為參照,第2、3、4次測(cè)量分別與第1次測(cè)量水平進(jìn)行比較。polynomial表示正交多項(xiàng)式對(duì)比,即正交轉(zhuǎn)換后判斷曲線的n階水平是否有統(tǒng)計(jì)學(xué)意義。如:repeatedtime4polynomial;表示4次重復(fù)測(cè)量,分別對(duì)一次、二次和三次曲線分析是否有統(tǒng)計(jì)學(xué)意義,也就是判斷測(cè)量值隨時(shí)間變化大致呈何種趨勢(shì)。,重復(fù)測(cè)量方差分析的SAS語(yǔ)句,重復(fù)測(cè)量方差分析的SAS語(yǔ)句,例某研究評(píng)價(jià)一醫(yī)療儀器在治療頸椎病中的療效,以VAS評(píng)分作為評(píng)價(jià)指標(biāo),共治療2個(gè)療程。從該研究中隨機(jī)選擇20例研究對(duì)象,表1列出了20例研究對(duì)象的治療前、治療1個(gè)療程、治療2個(gè)療程的VAS評(píng)分結(jié)果,試分析VAS評(píng)分的變化趨勢(shì)。,重復(fù)測(cè)量方差分析案例1,重復(fù)測(cè)量方差分析案例1,dataexample1;inputvas1-vas3;cards;procglm;modelvas1-vas3=/nouni;repeatedtime3contrast(1)/printesummary;run;,重復(fù)測(cè)量方差分析案例1,重復(fù)測(cè)量方差分析案例1,重復(fù)測(cè)量方差分析案例1,重復(fù)測(cè)量方差分析案例1,重復(fù)測(cè)量方差分析案例1,重復(fù)測(cè)量方差分析案例1,從本例分析結(jié)果可以看出,三次VAS評(píng)分之間存在一定的相關(guān)性,不應(yīng)采用單變量方差分析。重復(fù)測(cè)量方差分析結(jié)果提示,三次評(píng)分之間存在一定的趨勢(shì)。如果我們想進(jìn)一步了解存在什么樣的趨勢(shì),可以通過在repeated語(yǔ)句中指定polynomial來(lái)實(shí)現(xiàn)。procglm;modelvas1-vas3=/nouni;repeatedtime3polynomial/printesummary;run;,重復(fù)測(cè)量方差分析案例1,重復(fù)測(cè)量方差分析案例1,重復(fù)測(cè)量方差分析案例1,重復(fù)測(cè)量方差分析案例1,例為探索磁共振擴(kuò)散加權(quán)成像在胃腸癌肝轉(zhuǎn)移化療療效中的價(jià)值,某研究者觀察了20例化療反應(yīng)良好和化療反應(yīng)不良的胃腸癌患者分別在化療前、化療后3天、7天、42天的成像,并計(jì)算表觀擴(kuò)散系數(shù)ADC值。表中g(shù)roup=0代表反應(yīng)良好組,group=1代表反應(yīng)不良組。試比較兩組人群的ADC值差異是否有統(tǒng)計(jì)學(xué)意義。,重復(fù)測(cè)量方差分析案例2,重復(fù)測(cè)量方差分析案例2,dataexample2;inputgadc1-adc4;cards;01.861.821.831.8601.941.771.881.7311.131.211.241.2510.911.051.191.16;procglm;classg;modeladc1-adc4=g/nouni;repeatedtime4(03742)polynomial/printesummary;run;,注意,當(dāng)repeated語(yǔ)句指定polynomial變換時(shí),如果觀測(cè)時(shí)間間隔不等,必須在括號(hào)中加入具體的時(shí)間點(diǎn)。因?yàn)檎欢囗?xiàng)式系數(shù)在等間隔和不等間隔時(shí)是截然不同的。如果不指定,則默認(rèn)為等間隔,計(jì)算的正交多項(xiàng)式結(jié)果會(huì)有偏差。,重復(fù)測(cè)量方差分析案例2,重復(fù)測(cè)量方差分析案例2,重復(fù)測(cè)量方差分析案例2,重復(fù)測(cè)量方差分析案例2,重復(fù)測(cè)量方差分析案例2,重復(fù)測(cè)量方差分析案例2,謝謝,