統(tǒng)計學(xué)-第四章多個樣本均數(shù)比較的方差分析.ppt
2019/12/17,醫(yī)學(xué)統(tǒng)計學(xué)供研究生用,1,第四章多個樣本均數(shù)比較的方差分析,Analysisofvariance(ANOVA),2,方差分析,方差分析的基本思想完全隨機設(shè)計的單因素隨機區(qū)組設(shè)計的兩因素方差分析交叉設(shè)計的方差分析多個樣本均數(shù)間的多重比較,3,第一節(jié)方差分析的基本思想,用途:檢驗3組及以上總體均數(shù)是否相等。通過分析處理組均數(shù)之間的差別,推論它們所代表的k個總體均數(shù)間是否存在差別,或k個處理組間的差別是否具有統(tǒng)計學(xué)意義。,4,總變異=組間變異+組內(nèi)變異,X=110.3,5,全部實驗結(jié)果存在三種不同的變異,總變異:全部實驗數(shù)據(jù)大小不等。變異的大小用觀察值與總均數(shù)的離均差平方和表示,記為SS總,組間變異:各處理組的樣本均數(shù)也大小不等,變異的大小用各組均數(shù)與總體均數(shù)的離均差平方和表示,記為SS組間。,組內(nèi)變異:各處理組內(nèi)部觀察值也大小不等,可用各處理組內(nèi)部每個觀察值與組均數(shù)的離均差平方和表示。記為SS組內(nèi)。,6,總變異=組間變異+組內(nèi)變異,7,F=MS組間/MS組內(nèi),如果:各樣本均數(shù)來自同一總體(0:m1=m2=mk),即各組均數(shù)之間無差別。則:組間變異與組內(nèi)變異均只能反映隨機誤差,此時:F值應(yīng)接近1。反之,若各樣本均數(shù)不是來自同一總體,組間變異應(yīng)較大,F(xiàn)值將明顯大于1,則不能認(rèn)為組間的變異僅反映隨機誤差,也就是認(rèn)為處理因素有作用。,8,F值要到多大才有統(tǒng)計學(xué)意義呢?,在各樣本來自正態(tài)總體,各樣本所來自的總體方差相等的假定之下,當(dāng)H0成立時,檢驗統(tǒng)計量F服從自由度組間=k-1,組內(nèi)=N-k的F分布,表示為:FF(組間,組內(nèi))可由F界值表查出在某一水準(zhǔn)下F分布的單尾界值F。當(dāng)F。,9,方差分析的基本思想,根據(jù)資料的設(shè)計類型,將全部觀察值總的離均差平方和及自由度分解為兩個或多個部分,除隨機誤差(如SS組內(nèi))外,其余每個部分的變異(如SS組間)可由某個因素的作用(或某幾個因素的交互作用,如A因素B因素)加以解釋。通過比較不同變異來源的均方,借助F分布作出統(tǒng)計推斷,從而了解該因素對觀測指標(biāo)有無影響。,10,方差分析對數(shù)據(jù)的基本假設(shè)(方差分析的應(yīng)用條件),任何兩個觀察值之間均不相關(guān)每一水平下的觀察值均來自正態(tài)總體各總體方差相等,即方差齊性(homogeneityofvariance),11,第二節(jié)完全隨機設(shè)計資料的單因素方差分析,在實驗研究中,將受試對象隨機分配到一個研究因素的多個水平中去,然后觀察實驗效應(yīng)。在觀察研究中,按某個因素的不同水平分組,比較該因素的效應(yīng)。如比較糖尿病患者,IGT異常和正常人的載脂蛋白有無差別(人群這個研究因素分為3個水平)。如將30名乙型腦炎患者隨機分為三組,分別用單克隆抗體、胸腺肽和利巴韋林三種藥物治療(藥物這個研究因素分為3個水平),觀察治療后的退熱時間。,12,一、完全隨機設(shè)計,如何隨機分組?如欲將24只小白鼠隨機分為3組。方法如下:首先,將小白鼠124編號利用隨機數(shù)字表(附表15,p832)依次讀取兩位數(shù)作為一個隨機數(shù)字錄于編號下,將全部隨機數(shù)從小到大編序號規(guī)定序號:18甲組;916乙組;1724為丙組,13,二、變異分解:,例:某社區(qū)隨機抽取了30名糖尿病患者(11例),IGT異常(9例)和正常人(10例)進行載脂蛋白(mg/dL)測定,問三種人的載脂蛋白有無差別?,14,1.完全隨機設(shè)計方差分析中變異的分解總變異=組間變異+組內(nèi)變異,X=110.3,15,2.分析計算步驟,建立檢驗假設(shè)和確定檢驗水準(zhǔn)H0:三種人載脂蛋白的總體均數(shù)相等,即m1=m2=m3H1:三種人載脂蛋白的總體均數(shù)不全相等=0.05計算檢驗統(tǒng)計量F值,16,17,C=3309.52/30=365093(校正數(shù))SS總=372974.87-365093=7881.87SS組間=11602/11+921.52/9+12282/10-365093=2384.03SS組內(nèi)=SS總-SS組間=7881.87-2384.03=5497.84,18,確定P值和作出推斷結(jié)論查附表3F界值表(P522),1=2,2=27F0.05(2,27)=3.35,F0.01(2,27)=5.49本例F=5.85>F0.01(2,27),故P0.05。尚不能認(rèn)為三種營養(yǎng)素喂養(yǎng)的小白鼠體重增量有差別。F0.01(7,14)=4.28,P<0.01??烧J(rèn)為8個區(qū)組的小白鼠體重增量有差別,即遺傳因素對小白鼠體重增量有影響(但一般更關(guān)注處理組間差別的假設(shè)檢驗)。,29,一般而言,隨機區(qū)組設(shè)計較成組設(shè)計更容易檢驗出處理組間的差別,提高了研究效率。但不是在任何情況下都能提高研究效率。,區(qū)組效應(yīng)是否具有統(tǒng)計學(xué)意義是重要的,它表明區(qū)組的劃分是否成功,即達到:區(qū)組內(nèi)各實驗單位很均勻,而不同區(qū)組內(nèi)的實驗單位具有很大差異。如果區(qū)組效應(yīng)無統(tǒng)計學(xué)意義,則并不能提高研究效率,甚至?xí)档脱芯啃?。(如果MS區(qū)組<MS誤差)若沒有足夠理由顯示不同區(qū)組間的差別確有統(tǒng)計學(xué)意義,則寧可不分區(qū)組。,30,第四節(jié)交叉設(shè)計資料的方差分析,在醫(yī)學(xué)研究中,將A、B兩種處理先后施加于同一批受試對象,先隨機的將一半的受試對象接受A后接受B,而另外一半則相反,先接受B再接受A,將兩種處理因素在全部試驗過程中交叉進行,故稱之為交叉設(shè)計(crossoverdesign)。,31,交叉設(shè)計,是一種特殊的自身對照設(shè)計克服了試驗前后自身對照由于觀察期間各種非試驗因素對試驗結(jié)果的影響所造成的偏移。,32,交叉設(shè)計的優(yōu)點:,1.節(jié)約樣本含量2.控制了時間因素以及個體差異對處理方式的影響3.每一個試驗對象同時接受試驗因素和對照,從醫(yī)德的觀點出發(fā),均等考慮了每一個患者的利益,33,交叉設(shè)計的缺點:,不允許有病人失訪,否則會造成該個體已有的數(shù)據(jù)完全浪費不適用于病程較短的急性病治療效果的研究,34,交叉設(shè)計的限制條件,前一個試驗階段的處理效應(yīng)不能持續(xù)作用到下一個試驗階段洗脫時間(washouttime):目的是消除殘留效應(yīng)(carry-overeffect),35,例題,為了研究12名高血壓病人用A、B兩種治療方案療效的差別,隨機的讓其中6名病人先以A法治療,后以B法治療,而另外一半的6名病人則先用B法,后用A法,記錄治療后血壓的下降值(KPa),請分析A、B兩方案療效有無差別。,36,二階段交叉設(shè)計變異的來源:,1.處理(藥物)效應(yīng)2.階段效應(yīng)3.順序效應(yīng)和個體差異其中處理效應(yīng)是希望研究的因素,而順序效應(yīng)則在目前常用的統(tǒng)計分析中被忽略,因為這是交叉設(shè)計能夠?qū)嵤┑那疤釛l件。保證順序效應(yīng)忽略的辦法,就是消除殘留效應(yīng)。4.誤差,37,例:12例高血壓病人交叉設(shè)計資料,38,第五節(jié)拉丁方設(shè)計(latinsquaredesign),拉丁方設(shè)計是將三個因素(一個處理因素兩個控制因素)按水平數(shù)r排列成一個rr的隨機方陣。如33、44拉丁方。,39,常用拉丁方表,將兩個控制因素分別安排在拉丁方設(shè)計的行和列上,需對基本拉丁方表作行列變換。,40,拉丁方設(shè)計的優(yōu)點:,與隨機區(qū)組相比較,可以多安排一個控制因素,增加了均衡性,減少了誤差,提高了效率。,41,例4-5,比較A、B、C、D、E、F6種藥物給家兔注射后產(chǎn)生的皮膚皰疹大小(mm2),研究者選用6只家兔、并在每只家兔的6個不同部位進行注射。試驗結(jié)果見下表,試做拉丁方設(shè)計和方差分析。,42,拉丁方設(shè)計與試驗結(jié)果(皮膚皰疹大小,mm2),拉丁方設(shè)計與隨機區(qū)組區(qū)別,43,拉丁方設(shè)計變異的來源:,1.處理組變異2.行區(qū)組變異3.列區(qū)組變異4.誤差其中處理效應(yīng)是希望研究的因素。,44,第四節(jié)多個樣本均數(shù)間的多重比較multiplecomparison,概念無效假設(shè)的兩種情況常用方法,45,一、概念,指出哪幾組均數(shù)之間的差別具有或不具有統(tǒng)計學(xué)意義。當(dāng)對比組數(shù)大于2時,為什么不能用t檢驗?因為會增加第一類錯誤的概率,使本來無無差別的兩總體均數(shù)判為有差別。如有5個樣本均數(shù),可作10次t檢驗。每次不犯第一類錯誤的概率為1-0.05=0.95。每次比較均不犯第一類錯誤的概率僅為0.9510=0.5987,每次犯第一類錯誤的概率為1-0.5987=0.4013,明顯增加了犯第一類錯誤的概率。,46,二、無效假設(shè)的兩種情況,檢驗?zāi)硯讉€特定總體均數(shù)是否相等,其無效假設(shè)稱為部分無效假設(shè)。檢驗全部k個總體均數(shù)是否相等,其無效假設(shè)稱為完全無效假設(shè)。,47,1.檢驗?zāi)硯讉€特定總體均數(shù)是否相等,H0:i=j(ij)在試驗設(shè)計階段就根據(jù)研究目的或?qū)I(yè)知識決定了某些均數(shù)間的兩兩比較,常用于事先有明確研究假設(shè)的證實性研究。如多個處理組與對照組比較;處理后不同時間與處理前比較;幾個特定的處理組間比較,48,2.檢驗全部k個總體均數(shù)是否相等,H0:1=2=.=k。在研究設(shè)計階段對實驗結(jié)果知道不多的探索性研究,或經(jīng)數(shù)據(jù)結(jié)果的提示后,才決定作多個均數(shù)間的兩兩比較。一般涉及到每兩個均數(shù)的兩兩比較。,49,三、常用方法,BonferroniTukeyDunnett-t檢驗TamhanesT2LSD-t檢驗(leastsignificantdifference)SNK-q檢驗(Student-Newman-Keuls),50,SPSS統(tǒng)計軟件中的兩兩比較方法,51,1.LSD-t檢驗,Leastsignificantdifferencettest,最小有意義差異,比較k組中一對或幾對在專業(yè)上有特殊意義的均數(shù)差值的總體均數(shù)是否為“0”;,52,LSD-t檢驗公式,以誤差自由度誤差(或組內(nèi))和檢驗水準(zhǔn)查t界值表缺點:沒有調(diào)整多重比較的檢驗水準(zhǔn),比較的次數(shù)愈多,犯I類錯誤的可能性愈大。,53,2.Dunnett-t,k1個實驗組與一個對照組均數(shù)差別的多重比較。根據(jù)算得的t值,誤差自由度誤差,試驗組數(shù)k-1,以及檢驗水準(zhǔn)查Dunnett-t界值表,作出推斷結(jié)論。,54,3.SNK-q檢驗,Student-Newman-Keuls,q檢驗一般在方差分析結(jié)果拒絕H0時,再用q檢驗進行多重比較缺點:沒有調(diào)整多重比較的檢驗水準(zhǔn),比較的次數(shù)愈多,犯I類錯誤的可能性愈大。,55,組次123均數(shù)102.39105.45122.80組別IGT異常糖尿病患者正常人,例將3個樣本均數(shù)從小到大排序:,56,4.Bonferroni,樣本組數(shù)不宜過多,樣本數(shù)一般4,這時的檢驗效率高于Tukey法。調(diào)整了多重比較時的檢驗水準(zhǔn):=/比較的總次數(shù),當(dāng)計算所得的tt(,)時,則以P<稱所比較的兩組均數(shù)的差別有統(tǒng)計學(xué)意義。是SPSS統(tǒng)計軟件推薦的方法,57,5.Tukey,當(dāng)比較的樣本數(shù)大于5時,檢驗效率高于Bonferroni。當(dāng)樣本數(shù)為5時,要作10次兩兩比較;當(dāng)樣本數(shù)為6時,要作15次兩兩比較調(diào)整了多重比較時的檢驗水準(zhǔn),是SPSS統(tǒng)計軟件推薦的方法,58,BonferroniandTukey,TheBonferroniandTukeyshonestlysignificantdifferencetestsarecommonlyusedmultiplecomparisontests.,59,Bonferroni,TheBonferronitest,basedonStudentststatistic,adjuststheobservedsignificancelevelforthefactthatmultiplecomparisonsaremade.Forasmallnumberofpairs,Bonferroniismorepowerful.,60,Tukey,TukeyshonestlysignificantdifferencetestusestheStudentizedrangestatistictomakeallpairwisecomparisonsbetweengroupsandsetstheexperimentwiseerrorratetotheerrorrateforthecollectionforallpairwisecomparisons.Whentestingalargenumberofpairsofmeans,TukeyshonestlysignificantdifferencetestismorepowerfulthantheBonferronitest.,61,容易得出有統(tǒng)計學(xué)意義結(jié)論的,依次為:,LDS(最容易)SNKTukeybonferroni(最不容易),62,6.方差不齊時的兩兩比較,TamhanesT2法:Conservativepairwisecomparisonstest(保守的兩兩比較檢驗,I類錯誤小)basedonattest.Thistestisappropriatewhenthevariancesareunequal.DunnettsT3GamesHowUDunnettsC,63,多個方差的齊性檢驗LeveneTest,Ahomogeneity-of-variancetestthatislessdependentontheassumptionofnormalitythanmosttests.Foreachcase,itcomputestheabsolutedifferencebetweenthevalueofthatcaseanditscellmeanandperformsaone-wayanalysisofvarianceonthosedifferences.,64,SPSS操作與結(jié)果解釋,方差分析,65,建立SPSS數(shù)據(jù)工作表g:分組(1:糖尿?。?:IGT;3:正常人)X:載脂蛋白,一、完全隨機設(shè)計方差分析的SPSS,66,2.選用SPSS過程,67,One-wayANVOA對話框?qū)選入DependentList欄,g選入Factor欄,68,單擊PostHoc按鈕,69,選擇Bonferroni,單擊Continue返回,70,選擇Descriptive,Homogeneity單擊Continue返回,71,單擊OK按鈕運行ANOVA過程,72,3.結(jié)果解釋三組均數(shù)(mg/dL)依次為:正常人(122.80)、糖尿病患者(105.46)和IGT患者(102.39)。,73,經(jīng)方差齊性檢驗,P=0.548,按=0.05水準(zhǔn),還不能認(rèn)為3個總體方差不等。,74,經(jīng)完全隨機設(shè)計的單因素方差分析,F(xiàn)=5.85,P=0.008,可認(rèn)為三種人的載脂蛋白不同。,75,經(jīng)Bonferroni檢驗,正常人與糖尿病患者(P=0.029)、正常人與IGT患者(P=0.013)載脂蛋白的差別有統(tǒng)計學(xué)意義,76,二、隨機區(qū)組設(shè)計的兩因素方差分析,在不同的室溫下測定家兔的血糖濃度。室溫分七組,家兔分四個種屬,每一種屬七只。問不同溫度的血糖濃度有無差別及不同水平血糖濃度均數(shù)的變化趨勢?,77,1.建立SPSS數(shù)據(jù)工作表,78,求不同溫度的血糖濃度均值A(chǔ)nalyzeComparemeansMeans,79,1.選用SPSS過程:AnalyzeGeneralLinearModelUnivariate,80,在Univariate對話框,將血糖濃度選入DependentVariable欄;將室溫選入Fixfactors欄;將家兔種屬選入Randomfactors欄,81,單擊Model按鈕,82,選擇Custom,83,將室溫和家兔種屬選入Model欄,從下拉菜單選擇Maineffents(因不能分析交互作用)。單擊Continue返回。,84,單擊PostHoc按鈕,85,將變量:室溫選入PostHocTestsfor欄,以便進行兩兩比較。由于組數(shù)多,選擇Tukey進行兩兩比較。單擊Continue按鈕返回,86,單擊OK按鈕,87,3.SPSS結(jié)果解釋:Means過程顯示不同室溫的均值:可見從5分鐘(130.0mg%)到20分鐘(89.3mg%),血糖均值由高逐漸降低;從20分鐘(89.3mg%)到35分鐘(147.5mg%),血糖均值由低逐漸升高。,88,3.SPSS結(jié)果解釋,89,經(jīng)隨機區(qū)組設(shè)計的兩因素方差分析:,不同室溫血糖濃度的差別有統(tǒng)計學(xué)意義(F=19.12,P=0.000)不同家兔種屬血糖濃度的差別也有統(tǒng)計學(xué)意義(F=10.02,P=0.000),90,期望均方表(可不看該結(jié)果),91,Tukey檢驗結(jié)果(1),92,Tukey檢驗結(jié)果(2),93,Tukey法的均衡子集表,94,三、交叉設(shè)計方差分析的SPSS,例4-6分析A、B兩種閃爍液測定血漿中3H-cGMP的交叉試驗結(jié)果。第I階段1、3、4、7、9號用A測定,2、5、6、8、10號用B測定;第II階段1、3、4、7、9號用B測定,2、5、6、8、10號用A測定。試對交叉試驗結(jié)果進行方差分析。,95,1.建立數(shù)據(jù)庫,96,交叉設(shè)計方差分析的Spss過程,AnalyzeGeneralLinealModelUnivariateDependentlist:XFixedFactor框:treatphaseRandomFactor框personModelCustomBuildTerms下拉:MaineffectsModel框:treat、phase、personOK,97,Spss結(jié)果分析與解釋,98,方差分析表,99,四、拉丁方設(shè)計方差分析的SPSS,例4-5比較A、B、C、D、E、F6種藥物給家兔注射后產(chǎn)生的皮膚皰疹大?。╩m2),研究者選用6只家兔、并在每只家兔的6個不同部位進行注射,試做拉丁方設(shè)計和方差分析。,100,1.建立數(shù)據(jù)庫,101,拉丁方設(shè)計方差分析的Spss過程,AnalyzeGeneralLinealModelUnivariateDependentlist:areaFixedFactor框:no、part、drugModelCustomBuildTerms下拉:MaineffectsModel框:no、part、drugOK,102,Spss結(jié)果分析與解釋,103,方差分析表,104,方差分析要點,掌握方差分析的基本思想;方差分析變異的分解。熟悉One-WayANOVA過程和GLM-GeneralLinearModel過程的操作;并能對計算結(jié)果進行正確的分析(包括兩兩比較的結(jié)果選擇)。,105,1、完全隨機設(shè)計的單因素方差分析,單因素方差分析的總變異分幾部分?F值是與的比值?如各樣本均數(shù)來自同一總體,則F值理論上等于。若各樣本均數(shù)不是來自同一總體,則變異會增大,F(xiàn)值將明顯于1。,106,2、隨機區(qū)組設(shè)計的兩因素方差分析,隨機區(qū)組設(shè)計的兩因素方差分析的總變異分為幾部分?由于從總變異中多分離出區(qū)組變異,使誤差更能反映隨機誤差的大小,因而提高了檢驗效率。前提:區(qū)組效應(yīng)具有統(tǒng)計學(xué)意義,107,3、多個樣本均數(shù)每兩個均數(shù)間的兩兩比較,多個樣本均數(shù)每兩個均數(shù)間的兩兩比較常用的統(tǒng)計方法是:Bonferroni(組數(shù)少),Tukey(組數(shù)多),TamhanesT2(方差不齊,結(jié)論較保守)。多個實驗組與一個對照組均數(shù)間的兩兩比較常用的統(tǒng)計方法是Dunnett-t。比較G組中某一對或幾對在專業(yè)上有特殊意義的均數(shù)差值的總體均數(shù)是否為“0”,較常用的統(tǒng)計方法是LSD。,108,作業(yè)(p9497),三、計算分析題題2、356如果差異有統(tǒng)計學(xué)意義,須作方差齊性檢驗,并進行多重比較。,