統(tǒng)計(jì)推斷與方差分析.ppt
第13章統(tǒng)計(jì)推斷與方差分析,教學(xué)目標(biāo):1.了解假設(shè)檢驗(yàn)的原理和步驟2.描述參數(shù)檢驗(yàn)中對(duì)平均值的檢驗(yàn)3.描述參數(shù)檢驗(yàn)中對(duì)百分比的檢驗(yàn)4.描述非參數(shù)檢驗(yàn)中卡方、魏氏和麥?zhǔn)系臋z驗(yàn)5.描述單因素和雙因素方差分析,2019/12/17,1,2019/12/17,2,第13章統(tǒng)計(jì)推斷與方差分析,了解假設(shè)檢驗(yàn)的原理和步驟描述參數(shù)檢驗(yàn)中對(duì)平均值的檢驗(yàn)描述參數(shù)檢驗(yàn)中對(duì)百分比的檢驗(yàn)描述非參數(shù)檢驗(yàn)中卡方、魏氏和麥?zhǔn)系臋z驗(yàn)描述單因素和雙因素方差分析,2019/12/17,3,開(kāi)篇案例:方差分析,在相關(guān)分析和回歸分析中,往往要求自變量和因變量均為連續(xù)變量,而對(duì)于因變量為連續(xù)變量、自變量為分類變量的情況,一般要使用方差分析的方法。方差分析在SPSS統(tǒng)計(jì)軟件里可以實(shí)現(xiàn),包括一元方差分析(AnalysisofVariance,ANOVA)、協(xié)方差分析(AnalysisofCovariance,ANCOVA)和多元方差分析(MultivariateAnalysisofVariance,MANOVA),2019/12/17,4,開(kāi)篇案例:方差分析,一元方差分析是為了簡(jiǎn)化多個(gè)T檢驗(yàn)而建立的綜合性更強(qiáng)的分析方法。在統(tǒng)計(jì)分析中,如果我們要比較兩組樣本的平均值是否有顯著性差異,比如說(shuō)比較男性和女性的用戶滿意度是否有顯著性的差異,一般可以采用T檢驗(yàn)的方法。但在涉及到多組分類數(shù)據(jù)的時(shí)候,比如對(duì)某品牌的調(diào)查中,高收入、低收入和中等收入的被調(diào)查者的用戶滿意度是否有顯著性差異,如果要用T檢驗(yàn),就必須對(duì)高收入和低收入、低收入和中等收入、中等收入和高收入被調(diào)查者進(jìn)行兩兩比較,顯得十分繁瑣。因此,我們常用綜合性更強(qiáng)的方差分析來(lái)取代。,2019/12/17,5,開(kāi)篇案例:方差分析,方差分析將提出問(wèn)題的方式進(jìn)行了變化,即是否至少有一組數(shù)據(jù)的平均值與其它組的平均值有顯著性差異。方差分析的思路是將所有樣本的總變動(dòng)分成兩個(gè)部分,一部分是組內(nèi)變動(dòng)(withingroups),代表本組內(nèi)各樣本與該組平均值的離散程度;另一部分是組間變動(dòng)(betweengroups),代表各組平均值關(guān)于總平均值的離散程度。將這兩個(gè)變動(dòng)部分除以它們所對(duì)應(yīng)的自由度,即得到均方差。然后,用組間變動(dòng)的均方差除以組內(nèi)變動(dòng)的均方差,即可得到F檢驗(yàn)值,根據(jù)統(tǒng)計(jì)值對(duì)應(yīng)的顯著性水平就可以判斷不同組間是否有顯著性的差異。事實(shí)上,如果不同組間的差異越大,組內(nèi)的離散程度越小,那么組間變動(dòng)的均方差越大,組內(nèi)變動(dòng)的均方差越小,即F值越大,越容易通過(guò)顯著性水平檢驗(yàn)。,2019/12/17,6,假設(shè)檢驗(yàn)的概念,研究假設(shè)假設(shè)檢驗(yàn)的原理假設(shè)檢驗(yàn)的步驟,研究假設(shè),目的:保證通過(guò)市場(chǎng)調(diào)研獲得的資料能滿足研究目標(biāo)的要求。因此研究假設(shè)的工作是在研究目標(biāo)確定以后進(jìn)行的,一旦研究目標(biāo)確定,就要針對(duì)市場(chǎng)上出現(xiàn)的各種可能情況形成一些合適的假設(shè)。假設(shè)的形成并不是憑想象產(chǎn)生的,它是在市場(chǎng)調(diào)研的基礎(chǔ)上,通過(guò)對(duì)研究資料的粗步分析后得出的結(jié)論。假設(shè)可以是對(duì)研究資料的一種陳述性假設(shè),也可以用于陳述某個(gè)行動(dòng)的不同方案。研究者可以調(diào)查每一個(gè)假設(shè)方案,通過(guò)對(duì)各類信息的仔細(xì)分析和假設(shè)檢驗(yàn),確定一個(gè)最優(yōu)的開(kāi)發(fā)方案。,2019/12/17,7,假設(shè)檢驗(yàn)的原理,如何利用樣本值對(duì)一個(gè)具體的假設(shè)進(jìn)行檢驗(yàn),一般借助于直觀分析和理論分析相結(jié)合的做法?;驹恚喝藗?cè)趯?shí)踐問(wèn)題中經(jīng)常采用的所謂實(shí)際推斷原理:小概率事件在一次實(shí)驗(yàn)中幾乎是不可能發(fā)生的。如果小概率事件在一次試驗(yàn)中居然發(fā)生了,則有理由首先懷疑原假設(shè)的真實(shí)性,從而拒絕原假設(shè)。,2019/12/17,8,假設(shè)檢驗(yàn)的原理,從理論上看,小概率事件也有可能發(fā)生,只是發(fā)生的概率小而已。但從假設(shè)檢驗(yàn)的基本思想看,這就可能導(dǎo)致I、II兩類錯(cuò)誤,第I類錯(cuò)誤也叫“棄真”,第II類錯(cuò)誤也叫“取偽”。所謂“棄真”,顧名思義,就是原假設(shè)實(shí)際上是正確的,卻被當(dāng)成錯(cuò)誤拒絕了。而“取偽”則相反,本來(lái)原假設(shè)是錯(cuò)誤的,卻被當(dāng)成正確的內(nèi)容接受了。無(wú)論是“棄真”還是“取偽”,在現(xiàn)實(shí)中都是無(wú)法避免的,這就是我們通常所說(shuō)的“次策失誤”。可以通過(guò)增加樣本容量的辦法來(lái)減少犯兩類錯(cuò)誤的概率,這就要求我們?cè)谶M(jìn)行市場(chǎng)調(diào)研時(shí)應(yīng)盡可能詳盡地把握原始資料。,2019/12/17,9,2019/12/17,10,假設(shè)檢驗(yàn)的步驟,1、根據(jù)實(shí)際情況提出原假設(shè)H0和備擇假設(shè)H1;2、選擇合適的檢驗(yàn)統(tǒng)計(jì)量;3、根據(jù)樣本觀察值計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的觀察值;4、選定顯著性水平,并根據(jù)相應(yīng)統(tǒng)計(jì)量的統(tǒng)計(jì)分布表查出相應(yīng)的臨界值;5、根據(jù)統(tǒng)計(jì)觀察值和臨界值,作出接受或拒絕H0的假設(shè)。,2019/12/17,11,參數(shù)檢驗(yàn),對(duì)平均值的檢驗(yàn)百分?jǐn)?shù)檢驗(yàn),對(duì)平均值的檢驗(yàn),對(duì)平均值的檢驗(yàn)是根據(jù)樣本均值及標(biāo)準(zhǔn)差來(lái)判斷總體均值的一種方法。通常采用Z檢驗(yàn)法和t檢驗(yàn)法。Z檢驗(yàn)法適用于總體方差已知的平均值檢驗(yàn)t檢驗(yàn)法適用于總體方差未知以及在小樣本情況下的平均值檢驗(yàn),2019/12/17,12,2019/12/17,13,對(duì)平均值的檢驗(yàn),單個(gè)正態(tài)總體的平均值檢驗(yàn)兩個(gè)總體的平均值檢驗(yàn)通常是考慮分別來(lái)自兩個(gè)獨(dú)立的正態(tài)總體N(1,)與N(2,)的兩組樣本當(dāng)方差12與22已知時(shí),可進(jìn)行Z檢驗(yàn):當(dāng)方差12與22未知時(shí),則進(jìn)行T檢驗(yàn):,,2019/12/17,14,百分?jǐn)?shù)檢驗(yàn),對(duì)總體百分?jǐn)?shù)的檢驗(yàn)一般采用Z檢驗(yàn)法,選用統(tǒng)計(jì)量為:為樣本百分?jǐn)?shù);為總體百分?jǐn)?shù)。取樣大小直接影響著結(jié)論的可靠性。一般,樣本量越小,隨機(jī)性越大。因此,要想使作出的判斷更加準(zhǔn)確,就應(yīng)盡量保證樣本容量的數(shù)量。樣本值代替不了總體值。樣本百分?jǐn)?shù)之間差別的檢驗(yàn),2019/12/17,15,非參數(shù)檢驗(yàn),2檢驗(yàn)魏氏(Wilcoxon)檢驗(yàn)麥?zhǔn)希∕cNehmar)檢驗(yàn),2019/12/17,16,2檢驗(yàn),主要用于對(duì)獨(dú)立樣本本身或不同獨(dú)立樣本之間不同因素的差別進(jìn)行檢驗(yàn)。對(duì)單個(gè)獨(dú)立樣本的2檢驗(yàn)2為觀察頻數(shù);為期望頻數(shù);為類別組數(shù)多個(gè)獨(dú)立樣本的2檢驗(yàn)為行變量;為列變量個(gè)數(shù);2為第i行第j列的觀察值為第i行第j列期望值,Eij,魏氏檢驗(yàn),主要用于兩個(gè)有聯(lián)系樣本的比較?;舅枷耄菏紫惹蟪鰧?duì)樣本觀察值的差值,并按其絕對(duì)值大小進(jìn)行排列,剔除差值為0的樣本,最小者等級(jí)為1,依此類推。如果順序排列中有幾個(gè)差值的絕對(duì)值相等,則取其平均值作為這幾個(gè)差值的等級(jí)。然后恢復(fù)其原來(lái)的正負(fù)號(hào),再分別將正負(fù)符號(hào)的等級(jí)相加,用代表正的等級(jí)和,代表負(fù)的等級(jí)和。選擇其中較小的等級(jí)和作為檢驗(yàn)統(tǒng)計(jì)量。其拒絕域?yàn)椋涸诖髽颖荆╪25)情況下,統(tǒng)計(jì)量T也近似地服從正態(tài)分布,可以采用Z檢驗(yàn)法。,2019/12/17,17,2019/12/17,18,麥?zhǔn)希∕cNehmar)檢驗(yàn),用于同一樣本在兩種不同情況下的比較。,2019/12/17,19,方差分析,單因素方差分析雙因素方差分析,2019/12/17,20,單因素方法分析,單因素方差分析只檢驗(yàn)一個(gè)變量的影響。,2019/12/17,21,雙因素方法分析,單因素方差分析法只考察了一個(gè)變量的影響,但在許多實(shí)際問(wèn)題中,往往不能只考察單一因素各水平下的影響,而必須同時(shí)考察幾種因素的影響作用。雙因素方差分析法與單因素方差分析法在某些方面雖然存在著本質(zhì)的區(qū)別,但其基本思想和基本方法大致相同。,2019/12/17,22,本章小結(jié),本章主要介紹了幾類常用的假設(shè)檢驗(yàn)法和方差分析法。假設(shè)檢驗(yàn)法的基本思路是通過(guò)對(duì)樣本值的分析來(lái)檢驗(yàn)原假設(shè)是否正確,從而做出接受或拒絕的判斷。假設(shè)檢驗(yàn)包括參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)兩大類。參數(shù)檢驗(yàn)是在總體分布已知的情況下對(duì)一些主要的參數(shù)所進(jìn)行的假設(shè)檢驗(yàn)。如對(duì)均值的檢驗(yàn)、對(duì)百分?jǐn)?shù)的檢驗(yàn)等。非參數(shù)檢驗(yàn)方法較常用主要有三類:2檢驗(yàn)法、魏氏檢驗(yàn)法和麥?zhǔn)蠙z驗(yàn)法。2檢驗(yàn)法主要適用于對(duì)獨(dú)立樣本的檢驗(yàn);魏氏檢驗(yàn)法和麥?zhǔn)蠙z驗(yàn)法則適用于對(duì)有關(guān)聯(lián)樣本的檢驗(yàn),其中魏氏檢驗(yàn)法主要用于對(duì)兩個(gè)有聯(lián)系樣本的比較,麥?zhǔn)蠙z驗(yàn)法則適用于同一樣本在兩種不同情況下的比較。,2019/12/17,23,本章小結(jié),方差分析是試驗(yàn)數(shù)據(jù)來(lái)推斷一個(gè)或多個(gè)因素在其狀態(tài)變化時(shí)對(duì)試驗(yàn)指標(biāo)的影響作用,并根據(jù)影響作用的顯著性程度選出對(duì)試驗(yàn)指標(biāo)起最好影響的試驗(yàn)條件的一種統(tǒng)計(jì)方法。根據(jù)方差分析中檢驗(yàn)變量的多少,可將方差分析分成單因素方差分析和多因素方差分析兩類。單因素方差分析只檢驗(yàn)一個(gè)變量的影響;多因素方差分析則同時(shí)檢驗(yàn)多個(gè)變量的影響。雙因素方差是多因素方差分析中的一種。,