2018-2019年高中數(shù)學(xué) 第三章 統(tǒng)計(jì)案例 3.2 獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用 學(xué)案學(xué)案 新人教A版選修2-3.doc
3.2獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用教材研讀預(yù)習(xí)教材P9196,思考以下問題1分類變量與列聯(lián)表分別是如何定義的?2獨(dú)立性檢驗(yàn)的基本思想是怎樣的?要點(diǎn)梳理1與列聯(lián)表相關(guān)的概念(1)分類變量:變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量(2)列聯(lián)表:列出的兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)為:YXy1y2總計(jì)x1ababx2cdcd總計(jì)acbdabcd2.等高條形圖等高條形圖與表格相比,圖形更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高條形圖展示列表數(shù)據(jù)的頻率特征3獨(dú)立性檢驗(yàn)的基本思想(1)定義:利用隨機(jī)變量K2來判斷“兩個(gè)分類變量有關(guān)系”的方法稱為獨(dú)立性檢驗(yàn)(2)公式:K2,其中nabcd.(3)獨(dú)立性檢驗(yàn)的具體做法:根據(jù)實(shí)際問題的需要確定容許推斷“兩個(gè)分類變量有關(guān)系”犯錯(cuò)誤概率的上界,然后查表確定臨界值k0.利用公式計(jì)算隨機(jī)變量K2的觀測(cè)值k.如果kk0,就推斷“X與Y有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過;否則,就認(rèn)為在犯錯(cuò)誤的概率不超過的前提下不能推斷“X與Y有關(guān)系”,或者在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠證據(jù)支持結(jié)論“X與Y有關(guān)系”自我診斷判斷(正確的打“”,錯(cuò)誤的打“”)1分類變量中的變量與函數(shù)中的變量是同一概念()2列聯(lián)表頻率分析法、等高條形圖可初步分析兩分類變量是否有關(guān)系,而獨(dú)立性檢驗(yàn)中K2取值則可通過統(tǒng)計(jì)表從數(shù)據(jù)上說明兩分類變量的相關(guān)性的大小()3獨(dú)立性檢驗(yàn)的方法就是反證法()答案1.2.3.題型一用等高條形圖分析兩個(gè)分類變量間的關(guān)系 為了解鉛中毒病人與尿棕色素為陽(yáng)性是否有關(guān)系,分別對(duì)病人組和對(duì)照組的尿液作尿棕色素定性檢查,結(jié)果如下:組別陽(yáng)性數(shù)陰性數(shù)總計(jì)鉛中毒病人29736對(duì)照組92837總計(jì)383573試畫出列聯(lián)表的等高條形圖,分析鉛中毒病人和對(duì)照組的尿棕色素陽(yáng)性數(shù)有無差別,鉛中毒病人與尿棕色素為陽(yáng)性是否有關(guān)系?思路導(dǎo)引依據(jù)表中數(shù)據(jù),畫出等高條形圖,由圖形進(jìn)行分析解等高條形圖如圖所示:其中兩個(gè)淺色條的高分別代表鉛中毒病人和對(duì)照組樣本中尿棕色素為陽(yáng)性的頻率由圖可以直觀地看出鉛中毒病人與對(duì)照組相比,尿棕色素為陽(yáng)性的頻率差異明顯,因此鉛中毒病人與尿棕色素為陽(yáng)性有關(guān)系(1)判斷兩個(gè)分類變量是否有關(guān)系的兩種常用方法利用數(shù)形結(jié)合思想,借助等高條形圖來判斷兩個(gè)分類變量是否相關(guān)是判斷變量相關(guān)的常見方法一般地,在等高條形圖中,與相差越大,兩個(gè)分類變量有關(guān)系的可能性就越大(2)利用等高條形圖判斷兩個(gè)分類變量是否相關(guān)的步驟跟蹤訓(xùn)練在調(diào)查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分別利用圖形和獨(dú)立性檢驗(yàn)的方法來判斷色盲與性別是否有關(guān)?你所得到的結(jié)論在什么范圍內(nèi)有效?解根據(jù)題目所給的數(shù)據(jù)作出如下的列聯(lián)表:色盲不色盲總計(jì)男38442480女6514520總計(jì)449561000根據(jù)列聯(lián)表作出相應(yīng)的等高條形圖,如圖所示從等高條形圖來看,男性患色盲的頻率要高一些,因此直觀上可以認(rèn)為色盲與性別有關(guān)根據(jù)列聯(lián)表中所給的數(shù)據(jù)可以有a38,b442,c6,d514,ab480,cd520,ac44,bd956,n1000,由公式K2,得K2的觀測(cè)值k27.1>10.828.因此,在犯錯(cuò)誤的概率不超過0.001的前提下,認(rèn)為色盲與性別是有關(guān)的題型二用22列聯(lián)表分析兩個(gè)分類變量間的關(guān)系思考:下面是22列聯(lián)表.y1y2總計(jì)x1332154x2a1346總計(jì)b34100則表中a,b處的值應(yīng)為多少?提示:a461333,b33a333366. 為了探究學(xué)生選報(bào)文、理科是否與對(duì)外語(yǔ)的興趣有關(guān),某同學(xué)調(diào)查了361名高二在校學(xué)生,調(diào)查結(jié)果如下:理科對(duì)外語(yǔ)有興趣的有138人,無興趣的有98人,文科對(duì)外語(yǔ)有興趣的有73人,無興趣的有52人能否在犯錯(cuò)誤的概率不超過0.1的前提下,認(rèn)為“學(xué)生選報(bào)文、理科與對(duì)外語(yǔ)的興趣有關(guān)”?解根據(jù)題目所給的數(shù)據(jù)得到如下列聯(lián)表:理科文科總計(jì)有興趣13873211無興趣9852150總計(jì)236125361根據(jù)列聯(lián)表中數(shù)據(jù)由公式計(jì)算得隨機(jī)變量K2的觀測(cè)值k1.871104.因?yàn)?.871104<2.706,所以在犯錯(cuò)誤的概率不超過0.1的前提下,不能認(rèn)為“學(xué)生選報(bào)文、理科與對(duì)外語(yǔ)的興趣有關(guān)”獨(dú)立性檢驗(yàn)的步驟(1)確定分類變量,獲取樣本頻數(shù),得到列聯(lián)表(2)根據(jù)實(shí)際問題的需要確定容許推斷“兩個(gè)分類變量有關(guān)系”犯錯(cuò)誤概率的上界,然后查表確定臨界值k0.(3)利用公式K2計(jì)算隨機(jī)變量K2的觀測(cè)值k0.(4)作出判斷如果kk0,就推斷“X與Y有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過,否則就認(rèn)為在犯錯(cuò)誤的概率不超過的前提下不能推斷“X與Y的關(guān)系”,或者在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠證據(jù)支持結(jié)論“X與Y有關(guān)系”跟蹤訓(xùn)練在研究某種藥物對(duì)“H1N1”病毒的治療效果時(shí),進(jìn)行動(dòng)物試驗(yàn),得到以下數(shù)據(jù),對(duì)150只動(dòng)物服用藥物,其中132只動(dòng)物存活,18只動(dòng)物死亡,對(duì)照組150只動(dòng)物進(jìn)行常規(guī)治療,其中114只動(dòng)物存活,36只動(dòng)物死亡(1)根據(jù)以上數(shù)據(jù)建立一個(gè)22列聯(lián)表;(2)試問該種藥物對(duì)治療“H1N1”病毒是否有效?解(1)22列聯(lián)表如下:存活數(shù)死亡數(shù)總計(jì)服用該藥物13218150未服該藥物11436150總計(jì)24654300(2)由(1)知K27.317>6.635.故在犯錯(cuò)誤的概率不超過0.01的前提下認(rèn)為該種藥物對(duì)“H1N1”病毒有治療效果 某高校共有學(xué)生15000人,其中男生10500人,女生4500人,為調(diào)查該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的情況,采用分層抽樣的方法,收集300位學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的樣本數(shù)據(jù)(單位:小時(shí))(1)應(yīng)收集多少位女生的樣本數(shù)據(jù)?(2)根據(jù)這300個(gè)樣本數(shù)據(jù),得到學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的頻率分布直方圖(如圖所示),其中樣本數(shù)據(jù)的分組區(qū)間為:0,2,(2,4,(4,6,(6,8,(8,10,(10,12估計(jì)該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間超過4小時(shí)的概率(3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運(yùn)動(dòng)時(shí)間超過4小時(shí)請(qǐng)完成每周平均體育運(yùn)動(dòng)時(shí)間與性別的列聯(lián)表,并判斷是否有95%的把握認(rèn)為“該校學(xué)生的每周平均體育運(yùn)動(dòng)時(shí)間與性別有關(guān)”附:K2P(K2k0)0.100.050.0100.005k02.7063.8416.6357.879解(1)30090,所以應(yīng)收集90位女生的樣本數(shù)據(jù)(2)由頻率分布直方圖得2(0.1500.1250.0750.025)0.75,所以該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間超過4小時(shí)的概率的估計(jì)值為0.75.(3)由(2)知,300位學(xué)生中有3000.75225人的每周平均體育運(yùn)動(dòng)時(shí)間超過4個(gè)小時(shí),75人的每周平均體育運(yùn)動(dòng)時(shí)間不超過4個(gè)小時(shí)又因?yàn)闃颖緮?shù)據(jù)中有210份是關(guān)于男生的,90份是關(guān)于女生的,所以每周平均體育運(yùn)動(dòng)時(shí)間與性別的列聯(lián)表如下:平均體育運(yùn)動(dòng)時(shí)間與性別列聯(lián)表男生女生總計(jì)每周平均體育運(yùn)動(dòng)時(shí)間不超過4個(gè)小時(shí)453075每周平均體育運(yùn)動(dòng)時(shí)間超過4個(gè)小時(shí)16560225總計(jì)21090300結(jié)合列聯(lián)表可算得K2的觀測(cè)值k4.762>3.841.有95%的把握認(rèn)為“該校學(xué)生的每周平均體育運(yùn)動(dòng)時(shí)間與性別有關(guān)”(1)獨(dú)立性檢驗(yàn)問題是常與統(tǒng)計(jì)、概率相結(jié)合,解題時(shí)一定要認(rèn)真審題,找出各數(shù)據(jù)的聯(lián)系(2)解決獨(dú)立性檢驗(yàn)的應(yīng)用問題,一定要按照獨(dú)立性檢驗(yàn)的步驟得出結(jié)論跟蹤訓(xùn)練某中學(xué)將100名高一新生分成水平相同的甲、乙兩個(gè)“平行班”,每班50人陳老師采用A,B兩種不同的教學(xué)方式分別在甲、乙兩個(gè)班級(jí)進(jìn)行教改實(shí)驗(yàn)為了解教學(xué)效果,期末考試后,陳老師分別從兩個(gè)班級(jí)中各隨機(jī)抽取20名學(xué)生的成績(jī)進(jìn)行統(tǒng)計(jì),作出莖葉圖如圖記成績(jī)不低于90分者為“成績(jī)優(yōu)秀”.(1)在乙班樣本的20個(gè)個(gè)體中,從不低于86分的成績(jī)中隨機(jī)抽取2個(gè),求抽出的兩個(gè)均“成績(jī)優(yōu)秀”的概率;(2)由以上統(tǒng)計(jì)數(shù)據(jù)作出列聯(lián)表,并判斷能否在犯錯(cuò)誤的概率不超過0.1的前提下認(rèn)為:“成績(jī)優(yōu)秀”與教學(xué)方式有關(guān)解(1)由題意知本題是一個(gè)等可能事件的概率,試驗(yàn)發(fā)生包含的事件是從不低于86分的成績(jī)中隨機(jī)抽取兩個(gè)包含的基本事件是:(86,93),(86,96),(86,97),(86,99),(86,99),(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共有15種結(jié)果,符合條件的事件數(shù)(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共有10種結(jié)果,根據(jù)等可能事件的概率得到P.(2)由已知數(shù)據(jù)得甲班乙班總計(jì)成績(jī)優(yōu)秀156成績(jī)不優(yōu)秀191534總計(jì)202040根據(jù)列聯(lián)表中的數(shù)據(jù),計(jì)算得隨機(jī)變量K2的觀測(cè)值k3.137,由于3.137>2.706,所以在犯錯(cuò)誤的概率不超過0.1的前提下認(rèn)為:“成績(jī)優(yōu)秀”與教學(xué)方式有關(guān)1.本節(jié)課的重點(diǎn)是用22列聯(lián)表、等高條形圖分析兩個(gè)分類變量間的關(guān)系以及獨(dú)立性檢驗(yàn)2本節(jié)課要重點(diǎn)掌握的規(guī)律方法(1)用等高條形圖分析兩個(gè)分類變量間的關(guān)系,見典例1;(2)用22列聯(lián)表分析兩個(gè)分類變量間的關(guān)系,見典例2;(3)獨(dú)立性檢驗(yàn),見典例3.3解決一般的獨(dú)立性檢驗(yàn)問題的步驟(1)通過列聯(lián)表確定a,b,c,d,n的值,根據(jù)實(shí)際問題需要的可信程度確定臨界值k0;(2)利用K2求出K2的觀測(cè)值k;(3)如果kk0,就推斷“兩個(gè)分類變量有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過,否則就認(rèn)為在犯錯(cuò)誤的概率不超過的前提下不能推斷“兩個(gè)分類變量有關(guān)系”其中第(2)步易算錯(cuò)K2的值,是本節(jié)課的易錯(cuò)點(diǎn)