獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用 ppt課件

上傳人:仙*** 文檔編號:47529936 上傳時間:2021-12-22 格式:PPT 頁數(shù):33 大小:4.53MB
收藏 版權(quán)申訴 舉報 下載
獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用 ppt課件_第1頁
第1頁 / 共33頁
獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用 ppt課件_第2頁
第2頁 / 共33頁
獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用 ppt課件_第3頁
第3頁 / 共33頁

下載文檔到電腦,查找使用更方便

10 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用 ppt課件》由會員分享,可在線閱讀,更多相關(guān)《獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用 ppt課件(33頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、3.23.2 獨(dú)立性檢驗(yàn)的基本思想獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用及其初步應(yīng)用 新課新課新課新課, ,另習(xí)題課、習(xí)題見金榜另習(xí)題課、習(xí)題見金榜3.23.2獨(dú)立性檢驗(yàn)的獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用基本思想及其初步應(yīng)用 我們經(jīng)常聽到這些說法:我們經(jīng)常聽到這些說法:l 吸煙對患肺癌有影響;吸煙對患肺癌有影響;l 數(shù)學(xué)好的人物理一般也很好;數(shù)學(xué)好的人物理一般也很好;l 是否喜歡數(shù)學(xué)課程與性別之間有關(guān)系;是否喜歡數(shù)學(xué)課程與性別之間有關(guān)系;l 人的血型會決定人的性格;人的血型會決定人的性格;l 星座與人的命運(yùn)之間有某種聯(lián)系星座與人的命運(yùn)之間有某種聯(lián)系.這些說法都有道理嗎?這些說法都有道理嗎?1.1.理

2、解獨(dú)立性檢驗(yàn)的基本思想理解獨(dú)立性檢驗(yàn)的基本思想. .(重點(diǎn))(重點(diǎn))2.2.會從列聯(lián)表、等高條形圖直觀判斷吸煙與患會從列聯(lián)表、等高條形圖直觀判斷吸煙與患肺癌肺癌 有關(guān)有關(guān). .(難點(diǎn))(難點(diǎn))3.3.了解隨機(jī)變量了解隨機(jī)變量K K2 2的含義的含義, ,理解獨(dú)立性檢驗(yàn)的基理解獨(dú)立性檢驗(yàn)的基本思想及實(shí)施步驟本思想及實(shí)施步驟. .(難點(diǎn))(難點(diǎn))探究點(diǎn)探究點(diǎn)1 1 獨(dú)立性檢驗(yàn)的基本思想獨(dú)立性檢驗(yàn)的基本思想 對于性別變量,其取值為男和女兩種對于性別變量,其取值為男和女兩種. .這種變量這種變量的不同的不同“值值”表示個體所屬的不同類別,像這樣的變表示個體所屬的不同類別,像這樣的變量稱為量稱為 . .

3、 分類變量在現(xiàn)實(shí)生活中是大量存在的,如是否分類變量在現(xiàn)實(shí)生活中是大量存在的,如是否吸煙,是否患肺癌,宗教信仰,國別,年齡,出生吸煙,是否患肺癌,宗教信仰,國別,年齡,出生月份等月份等. .分類變量分類變量不患肺癌不患肺癌患肺癌患肺癌總計總計不吸煙不吸煙7 7757 77542427 8177 817吸煙吸煙2 0992 09949492 1482 148總計總計9 8749 87491919 9659 965問題:問題:為了研究吸煙是否對患肺癌有影響,某腫瘤研究為了研究吸煙是否對患肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了所隨機(jī)地調(diào)查了9 9659 965人,得到如下結(jié)果:人,得到如下結(jié)果:吸煙與患

4、肺癌列聯(lián)表(單位:人)吸煙與患肺癌列聯(lián)表(單位:人)在吸煙者中患肺癌的比重是在吸煙者中患肺癌的比重是_._. 說明:吸煙者和不吸煙者患肺癌的可能性存在差異,說明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大吸煙者患肺癌的可能性大. .2.28%2.28%在不吸煙者中患肺癌的比重是在不吸煙者中患肺癌的比重是_,_, 0.54%0.54%通過圖形直觀判斷兩個分類變量是否相關(guān):通過圖形直觀判斷兩個分類變量是否相關(guān):等高等高條形圖條形圖 通過數(shù)據(jù)和圖形分析,得到結(jié)論是:吸煙與患通過數(shù)據(jù)和圖形分析,得到結(jié)論是:吸煙與患肺癌有關(guān)肺癌有關(guān). .那么這種判斷是否可靠呢?我們可以通過那么這種判

5、斷是否可靠呢?我們可以通過統(tǒng)計分析回答這個問題統(tǒng)計分析回答這個問題. .假設(shè)假設(shè)H H0 0:吸煙與患肺癌之間沒有關(guān)系:吸煙與患肺癌之間沒有關(guān)系, ,吸煙與患肺癌列聯(lián)表吸煙與患肺癌列聯(lián)表( (單位:人單位:人) ) 不患肺癌不患肺癌患肺癌患肺癌總計總計不吸煙不吸煙a ab ba+ba+b吸煙吸煙c cd dc+dc+d總計總計a+ca+cb+db+da+b+c+da+b+c+d 如果如果“吸煙與患肺癌沒有關(guān)系吸煙與患肺癌沒有關(guān)系”,那么吸煙樣,那么吸煙樣本中不患肺癌的比例應(yīng)該與不吸煙樣本中相應(yīng)的比本中不患肺癌的比例應(yīng)該與不吸煙樣本中相應(yīng)的比例差不多例差不多. .所所以以acac, ,a+bc+

6、da+bc+d所所以以 a c+dc a+b , a c+dc a+b ,adbc0.adbc即即,2 22 2n n(a ad d- -b bc c)K K = =( (a a+ +b b) )( (c c+ +d d) )( (a a+ +c c) )( (b b+ +d d) )引入一個隨機(jī)變量引入一個隨機(jī)變量 它是檢驗(yàn)在多大程度上可以認(rèn)為它是檢驗(yàn)在多大程度上可以認(rèn)為“兩個變量兩個變量有關(guān)系有關(guān)系”的標(biāo)準(zhǔn)的標(biāo)準(zhǔn). .ad-bcad-bc越小,越小,說明吸煙與患肺癌之間的關(guān)系越弱說明吸煙與患肺癌之間的關(guān)系越弱; ;ad-bcad-bc越大,越大,說明吸煙與患肺癌之間的關(guān)系越強(qiáng)說明吸煙與患肺

7、癌之間的關(guān)系越強(qiáng). . 其中其中n=a+b+c+dn=a+b+c+d為樣本容量為樣本容量. .不患肺癌不患肺癌患肺癌患肺癌總計總計不吸煙不吸煙7 7757 77542427 8177 817吸煙吸煙2 0992 09949492 1482 148總計總計9 8749 87491919 9659 965通過公式計算通過公式計算22Kk,9 965(7 77549422 099)k56.632.7 8172 148 9 87491上面探究中,的觀測值為吸煙與患肺癌列聯(lián)表(單位:人)吸煙與患肺癌列聯(lián)表(單位:人)已知在已知在 成立的情況下成立的情況下,0H2(6.635)0.01P K 即在即在 成

8、立的情況下,成立的情況下,K K2 2的觀測值大于的觀測值大于6.6356.635的概率非常小,近似為的概率非常小,近似為0.010.01,是一個小概率事件,是一個小概率事件. .0H思考:思考:這個值到底告訴我們什么呢?這個值到底告訴我們什么呢?現(xiàn)在現(xiàn)在K K2 2的觀測值的觀測值k k56.63256.632,遠(yuǎn)遠(yuǎn)大于,遠(yuǎn)遠(yuǎn)大于6.6356.635,所以有理由,所以有理由斷定斷定H H0 0不成立不成立,即認(rèn)為即認(rèn)為“吸煙與患肺癌有關(guān)系吸煙與患肺癌有關(guān)系”. .獨(dú)立性檢驗(yàn)的定義獨(dú)立性檢驗(yàn)的定義: :利用隨機(jī)變量利用隨機(jī)變量K K2 2來判斷來判斷“兩個分類變量有關(guān)系兩個分類變量有關(guān)系”的方

9、法的方法稱為獨(dú)立性檢驗(yàn)稱為獨(dú)立性檢驗(yàn). .獨(dú)立性檢驗(yàn)的一般步驟獨(dú)立性檢驗(yàn)的一般步驟: :(1 1)假設(shè)假設(shè)兩個分類變量兩個分類變量X X與與Y Y沒有關(guān)系沒有關(guān)系. .(2 2)計算出)計算出K K2 2的觀測值的觀測值k.k.(3 3)把)把k k的值與的值與臨界值臨界值比較確定比較確定X X與與Y Y有關(guān)的有關(guān)的程度或無關(guān)系程度或無關(guān)系. . 設(shè)有兩個分類變量設(shè)有兩個分類變量X X和和Y Y,它們的取值分別為,它們的取值分別為xx1 1,x,x2 2 和和yy1 1,y,y2 2 ,其樣本頻數(shù)列聯(lián)表其樣本頻數(shù)列聯(lián)表( (稱為稱為2 22 2列聯(lián)表列聯(lián)表) )為為y y1 1y y2 2總計

10、總計x x1 1a ab ba+ba+bx x2 2c cd dc+dc+d總計總計a+ca+cb+db+da+b+c+da+b+c+d22()()()()n adbcKab cd ac bd()臨界值表:臨界值表:20()P Kk 如如P(k10.828)= 0.001P(k10.828)= 0.001表示在表示在犯錯誤的概率不犯錯誤的概率不超過超過0.0010.001的前提下的前提下,認(rèn)為,認(rèn)為“X X與與Y Y有關(guān)系有關(guān)系”. . 如如P(k6.635)= 0.010P(k6.635)= 0.010表示在表示在犯錯誤的概率不超犯錯誤的概率不超過過0.0100.010的前提下的前提下,認(rèn)為

11、,認(rèn)為“X X與與Y Y有關(guān)系有關(guān)系”. .獨(dú)立性檢驗(yàn)的基本思想類似反證法獨(dú)立性檢驗(yàn)的基本思想類似反證法(1)(1)假設(shè)結(jié)論不成立假設(shè)結(jié)論不成立, ,即即“兩個分類變量沒有關(guān)系兩個分類變量沒有關(guān)系”. .(2)(2)在此假設(shè)下隨機(jī)變量在此假設(shè)下隨機(jī)變量K K2 2應(yīng)該很小應(yīng)該很小, ,如果由觀測數(shù)據(jù)如果由觀測數(shù)據(jù)計算得到計算得到K K2 2的觀測值的觀測值k k很大很大, ,則在一定程度上說明假則在一定程度上說明假設(shè)不合理設(shè)不合理. .(3)(3)根據(jù)隨機(jī)變量根據(jù)隨機(jī)變量K K2 2的含義的含義, ,可以通過評價該假設(shè)不合可以通過評價該假設(shè)不合理的程度理的程度, ,如由實(shí)際計算出的如由實(shí)際計算

12、出的k10.828.k10.828.說明假設(shè)不說明假設(shè)不合理的程度為合理的程度為99.9%,99.9%,即即“兩個分類變量有關(guān)系兩個分類變量有關(guān)系”這這一結(jié)論成立的可信度約為一結(jié)論成立的可信度約為99.9%.99.9%.探究點(diǎn)探究點(diǎn)2 2 獨(dú)立性檢驗(yàn)的初步應(yīng)用獨(dú)立性檢驗(yàn)的初步應(yīng)用 例例. .在某醫(yī)院在某醫(yī)院, ,因?yàn)榛夹呐K病而住院的因?yàn)榛夹呐K病而住院的665665名男性名男性病人中病人中, ,有有214214人禿頂人禿頂, ,而另外而另外772772名不是因?yàn)榛夹呐K病名不是因?yàn)榛夹呐K病而住院的男性病人中有而住院的男性病人中有175175人禿頂人禿頂.(1).(1)利用圖形判斷利用圖形判斷禿頂與

13、患心臟病是否有關(guān)系禿頂與患心臟病是否有關(guān)系;(2);(2)能否在犯錯誤的概率能否在犯錯誤的概率不超過不超過0.010.01的前提下認(rèn)為禿頂與患心臟病有關(guān)系?的前提下認(rèn)為禿頂與患心臟病有關(guān)系?患心臟病患心臟病患其他病患其他病總計總計禿頂禿頂214214175175389389不禿頂不禿頂4514515975971 0481 048總計總計6656657727721 4371 437(1)(1)相應(yīng)的等高條形圖如下所示,相應(yīng)的等高條形圖如下所示,禿頂禿頂不禿頂不禿頂不患心臟病不患心臟病患心臟病患心臟病解:解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:由圖可認(rèn)為禿頂與患心臟病有

14、關(guān)系由圖可認(rèn)為禿頂與患心臟病有關(guān)系21 437 (214 597 175 451)16.3736.635.389 1 048 665 772k 因此,在犯錯誤的概率不超過因此,在犯錯誤的概率不超過0.010.01的前提下,的前提下,認(rèn)為禿頂與患心臟病有關(guān)系認(rèn)為禿頂與患心臟病有關(guān)系. .(2)(2)根據(jù)列聯(lián)表中的數(shù)據(jù),得到根據(jù)列聯(lián)表中的數(shù)據(jù),得到y(tǒng) y1 1y y2 2總計總計x x1 1a ab ba+ba+bx x2 2c cd dc+dc+d總計總計a+ca+cb+db+da+b+c+da+b+c+d思考:思考:考察下表,考察下表,定義定義.acWa bcd根據(jù)獨(dú)立性檢驗(yàn)原理,如何用根據(jù)獨(dú)

15、立性檢驗(yàn)原理,如何用W W構(gòu)造一個判斷構(gòu)造一個判斷X X和和Y Y是是否有關(guān)系的規(guī)則,否有關(guān)系的規(guī)則,使得在該規(guī)則下把使得在該規(guī)則下把“X X和和Y Y沒有關(guān)系沒有關(guān)系”錯判成錯判成“X X和和Y Y有關(guān)系有關(guān)系”的概率不超過的概率不超過0.010.01? 由由W W的定義可以發(fā)現(xiàn):它越大,越有利于結(jié)論的定義可以發(fā)現(xiàn):它越大,越有利于結(jié)論“X X和和Y Y有關(guān)系有關(guān)系”;它越小,越有利于結(jié)論;它越小,越有利于結(jié)論“X X和和Y Y沒沒有關(guān)系有關(guān)系”. .因此可以建立如下的判斷規(guī)則:因此可以建立如下的判斷規(guī)則: 當(dāng)當(dāng)W W的觀測值的觀測值0 0時,就判斷時,就判斷“X X和和Y Y有關(guān)有關(guān)系系”

16、;否則,判斷;否則,判斷“X X和和Y Y沒有關(guān)系沒有關(guān)系”. .這里這里0 0為為正實(shí)數(shù),滿足如下條件:在正實(shí)數(shù),滿足如下條件:在“X X和和Y Y沒有關(guān)系沒有關(guān)系”的的前提下,前提下,0()0.01.P W 思考:思考:若在若在“X X和和Y Y沒有關(guān)系沒有關(guān)系”的情況下有:的情況下有:20P(Kk )0.01,可可以以通通過過來來確確定定嗎嗎?00k 22()(),()()事事實(shí)實(shí)上上, n ab cdKWac bd其其中中.nabcd200()(),()()因因此此,等等價價于于即即可可取取ac bdKkWkn ab cd.)()(00dcbandbcak.acWabcd,給出2 22

17、 2n n(a ad d- -b bc c)K K = =( (a a+ +b b) )( (c c+ +d d) )( (a a+ +c c) )( (b b+ +d d) )1.1.獨(dú)立性檢驗(yàn)中的統(tǒng)計假設(shè)就是假設(shè)兩個分類量獨(dú)立性檢驗(yàn)中的統(tǒng)計假設(shè)就是假設(shè)兩個分類量A A,B B ( () )A.A.互斥互斥 B.B.不互斥不互斥C.C.相互獨(dú)立相互獨(dú)立 D.D.不獨(dú)立不獨(dú)立C C2.2.下列說法中正確的是下列說法中正確的是( () )獨(dú)立性檢驗(yàn)的基本思想是帶有概率性質(zhì)的反證法;獨(dú)立性檢驗(yàn)的基本思想是帶有概率性質(zhì)的反證法;獨(dú)立性檢驗(yàn)就是在假設(shè)獨(dú)立性檢驗(yàn)就是在假設(shè)H H0 0下,如果出現(xiàn)一個與下

18、,如果出現(xiàn)一個與H H0 0相相矛盾的小概率事件,矛盾的小概率事件,就推斷就推斷H H0 0不成立,且該推斷犯錯不成立,且該推斷犯錯誤的概率不超過這個小概率誤的概率不超過這個小概率, ,則作出拒絕則作出拒絕H H0 0的推斷;的推斷;獨(dú)立性檢驗(yàn)一定能給出明確的結(jié)論獨(dú)立性檢驗(yàn)一定能給出明確的結(jié)論 A.A. B. B. C. C. D. D.A3 3有兩個分類變量有兩個分類變量X X與與Y Y的一組數(shù)據(jù),由其列聯(lián)表的一組數(shù)據(jù),由其列聯(lián)表計算得計算得K K2 24.5234.523,則,則認(rèn)為認(rèn)為X X與與Y Y有關(guān)系是錯誤的有關(guān)系是錯誤的可信度為可信度為( () )A A95% 95% B B90

19、% 90% C C5% 5% D D10%10%C4 4在對人們的休閑方式的一次調(diào)查中,共調(diào)查了在對人們的休閑方式的一次調(diào)查中,共調(diào)查了124124人,其中女性人,其中女性7070人,男性人,男性5454人,女性中有人,女性中有4343人人主要的休閑方式是看電視,另外主要的休閑方式是看電視,另外2727人主要的休閑方式人主要的休閑方式是運(yùn)動;男性中有是運(yùn)動;男性中有2121人主要的休閑方式是看電視,人主要的休閑方式是看電視,另外另外3333人主要的休閑方式是運(yùn)動人主要的休閑方式是運(yùn)動(1)(1)根據(jù)以上數(shù)據(jù)建立一個根據(jù)以上數(shù)據(jù)建立一個2 22 2的列聯(lián)表的列聯(lián)表. .(2)(2)判斷休閑方式與

20、性別是否有關(guān)系判斷休閑方式與性別是否有關(guān)系 性別性別看電視看電視運(yùn)動運(yùn)動總計總計女女434327277070男男212133335454總計總計64646060124124休閑方式休閑方式(2)(2)假設(shè)假設(shè)“休閑方式與性別無關(guān)休閑方式與性別無關(guān)” 計算計算K K2 212412443433333272721212 270705454646460606.201.6.201. 因?yàn)橐驗(yàn)镵 K2 25.0245.024,所以有理由認(rèn)為假設(shè),所以有理由認(rèn)為假設(shè)“休閑方式與性別休閑方式與性別 無關(guān)無關(guān)”是不合理的故是不合理的故在犯在犯錯誤的概率錯誤的概率不超過不超過 0.0250.025 的的 前提下

21、,前提下,認(rèn)為性別與休閑方式有關(guān)系認(rèn)為性別與休閑方式有關(guān)系 ( )獨(dú)立性檢驗(yàn)的一般步驟獨(dú)立性檢驗(yàn)的一般步驟: :(1 1)假設(shè)兩個分類變量)假設(shè)兩個分類變量X X與與Y Y沒有關(guān)系;沒有關(guān)系;(2 2)計算出)計算出K K2 2的觀測值的觀測值k k;(3 3)把)把k k的值與臨界值比較確定的值與臨界值比較確定X X與與Y Y有關(guān)的程度或有關(guān)的程度或無關(guān)系無關(guān)系. .獨(dú)立性檢驗(yàn)基本的思想類似獨(dú)立性檢驗(yàn)基本的思想類似反證法反證法( (1)1)假設(shè)結(jié)論不成立假設(shè)結(jié)論不成立, ,即即“兩個分類變量沒有關(guān)系兩個分類變量沒有關(guān)系”. .(2)(2)在此假設(shè)下隨機(jī)變量在此假設(shè)下隨機(jī)變量 K K2 2 應(yīng)

22、該很小應(yīng)該很小, ,如果由觀測數(shù)據(jù)如果由觀測數(shù)據(jù)計算得到計算得到K K2 2的觀測值的觀測值k k很大很大, ,則在一定程度上說明假設(shè)則在一定程度上說明假設(shè)不合理不合理. .(3)(3)根據(jù)隨機(jī)變量根據(jù)隨機(jī)變量K K2 2的含義的含義, ,可以通過可以通過評價該假設(shè)不合理的程度評價該假設(shè)不合理的程度, ,由實(shí)際計算出的由實(shí)際計算出的, ,說明假設(shè)合理的程度為說明假設(shè)合理的程度為99.9%,99.9%,即即“兩個分類變量有兩個分類變量有關(guān)系關(guān)系”這一結(jié)論成立的可信度為約為這一結(jié)論成立的可信度為約為99.9%.99.9%. 當(dāng)你無法從一樓蹦到三樓時,不要忘記走樓梯.要記住偉大的成功往往不是一蹴而就的,必須學(xué)會分解你的目標(biāo),逐步實(shí)施.課本課本P97練習(xí)、習(xí)題、練習(xí)、習(xí)題、。

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!