2018屆高三數(shù)學一輪復習: 第9章 第4節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計案例
《2018屆高三數(shù)學一輪復習: 第9章 第4節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計案例》由會員分享,可在線閱讀,更多相關(guān)《2018屆高三數(shù)學一輪復習: 第9章 第4節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計案例(13頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、 第四節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計案例 [考綱傳真] 1.會做兩個有關(guān)聯(lián)變量的數(shù)據(jù)的散點圖,并利用散點圖認識變量間的相關(guān)關(guān)系.2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程(線性回歸系數(shù)公式不要求記憶).3.了解回歸分析的基本思想、方法及其簡單應用.4.了解獨立性檢驗(只要求2×2列聯(lián)表)的思想、方法及其初步應用. 1.回歸分析 回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法;判斷相關(guān)性的常用統(tǒng)計圖是散點圖;統(tǒng)計量有相關(guān)系數(shù)與相關(guān)指數(shù). (1)在散點圖中,點散布在從左下角到右上角的區(qū)域,對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān).
2、 (2)在散點圖中,點散布在從左上角到右下角的區(qū)域,兩個變量的這種相關(guān)關(guān)系稱為負相關(guān). (3)如果散點圖中點的分布從整體上看大致在一條直線附近,稱兩個變量具有線性相關(guān)關(guān)系. 2.線性回歸方程 (1)最小二乘法:使得樣本數(shù)據(jù)的點到回歸直線的距離的平方和最小的方法叫做最小二乘法. (2)回歸方程:兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù):(x1,y1),(x2,y2),…,(xn,yn),其回歸方程為=x+,則==,=-.其中,是回歸方程的斜率,是在y軸上的截距. 3.殘差分析 (1)殘差:對于樣本點(x1,y1),(x2,y2),…,(xn,yn),它們的隨機誤差為ei=y(tǒng)i-bxi-
3、a,i=1,2,…,n,其估計值為i=y(tǒng)i-i=y(tǒng)i-xi-,i=1,2,…,n,i稱為相應于點(xi,yi)的殘差. (2)相關(guān)指數(shù):R2=1-. 4.獨立性檢驗 (1)利用隨機變量K2來判斷“兩個分類變量有關(guān)系”的方法稱為獨立性檢驗. (2)列聯(lián)表:列出的兩個分類變量的頻數(shù)表,稱為列聯(lián)表.假設(shè)有兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(2×2列聯(lián)表)為 y1 y2 總計 x1 a b a+b x2 c d c+d 總計 a+c b+d a+b+c+d 則隨機變量K2=(其中n=a+b+c+d為樣本容
4、量). 1.(思考辨析)判斷下列結(jié)論的正誤.(正確的打“√”,錯誤的打“×”) (1)“名師出高徒”可以解釋為教師的教學水平與學生的水平成正相關(guān)關(guān)系.( ) (2)某同學研究賣出的熱飲杯數(shù)y與氣溫x(℃)之間的關(guān)系,得回歸方程=-2.352x+147.767,則氣溫為2℃時,一定可賣出143杯熱飲.( ) (3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進行相關(guān)性檢驗.( ) (4)若事件X,Y關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的K2的觀測值越小.( ) [答案] (1)√ (2)× (3)× (4)× 2.(教材改編)已知變量x與y正相關(guān),且由觀測數(shù)
5、據(jù)算得樣本平均數(shù)=3,=3.5,則由該觀測數(shù)據(jù)算得的線性回歸方程可能是( ) A.=0.4x+2.3 B.=2x-2.4 C.=-2x+9.5 D.=-0.3x+4.4 A [因為變量x和y正相關(guān),排除選項C,D.又樣本中心(3,3.5)在回歸直線上,排除B,選項A滿足.] 3.(2015·全國卷Ⅱ)根據(jù)下面給出的2004年至2013年我國二氧化硫年排放量(單位:萬噸)柱形圖,以下結(jié)論中不正確的是( ) 圖9-4-1 A.逐年比較,2008年減少二氧化硫排放量的效果最顯著 B.2007年我國治理二氧化硫排放顯現(xiàn)成效 C.2006年以來我國二氧化硫年排放量呈減少趨
6、勢 D.2006年以來我國二氧化硫年排放量與年份正相關(guān) D [對于A選項,由圖知從2007年到2008年二氧化硫排放量下降得最多,故A正確.對于B選項,由圖知,由2006年到2007年矩形高度明顯下降,因此B正確.對于C選項,由圖知從2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正確.由圖知2006年以來我國二氧化硫年排放量與年份負相關(guān),故選D.] 4.為了評價某個電視欄目的改革效果,在改革前后分別從居民點抽取了100位居民進行調(diào)查,經(jīng)過計算K2≈0.99,根據(jù)這一數(shù)據(jù)分析,下列說法正確的是 ( ) A.有99%的人認為該電視欄目優(yōu)秀 B.有99%的人認為
7、該電視欄目是否優(yōu)秀與改革有關(guān)系 C.有99%的把握認為該電視欄目是否優(yōu)秀與改革有關(guān)系 D.沒有理由認為該電視欄目是否優(yōu)秀與改革有關(guān)系 D [只有K2≥6.635才能有99%的把握認為“該電視欄目是否優(yōu)秀與改革有關(guān)系”,而即使K2≥6.635也只是對“該電視欄目是否優(yōu)秀與改革有關(guān)系”這個論斷成立的可能性大小的結(jié)論,與是否有99%的人等無關(guān),故只有D正確.] 5.(2017·貴陽檢測)若8名學生的身高和體重數(shù)據(jù)如下表: 編號 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 體重/kg 48
8、 57 54 64 61 43 59 第3名學生的體重漏填,但線性回歸方程是=0.849x-85.712,則第3名學生的體重估計為________kg. 50 [設(shè)第3名學生的體重為a,則 (48+57+a+54+64+61+43+59)=0.849×(165+165+157+170+175+165+155+170)-85.712. 解得a≈50.] 相關(guān)關(guān)系的判斷 (1)(2015·湖北高考)已知變量x和y滿足關(guān)系y=-0.1x+1,變量y與z正相關(guān).下列結(jié)論中正確的是( ) A.x與y正相關(guān),x與z負相關(guān) B.x與y正相關(guān),x與z正相關(guān) C.x與
9、y負相關(guān),x與z負相關(guān) D.x與y負相關(guān),x與z正相關(guān) (2)x和y的散點圖如圖9-4-2所示,則下列說法中所有正確命題的序號為________. 圖9-4-2 ①x,y是負相關(guān)關(guān)系; ②在該相關(guān)關(guān)系中,若用y=c1ec2x擬合時的相關(guān)指數(shù)為R,用=x+擬合時的相關(guān)指數(shù)為R,則R>R; ③x,y之間不能建立線性回歸方程. (1)C (2)①② [(1)因為y=-0.1x+1的斜率小于0,故x與y負相關(guān).因為y與z正相關(guān),可設(shè)z=y(tǒng)+,>0,則z=y(tǒng)+=-0.1x++,故x與z負相關(guān). (2)在散點圖中,點散布在從左上角到右下角的區(qū)域,因此x,y是負相關(guān)關(guān)系,故①正確;由散點
10、圖知用y=c1ec2x擬合比用=x+擬合效果要好,則R>R,故②正確;x,y之間可以建立線性回歸方程,但擬合效果不好,故③錯誤.] [規(guī)律方法] 1.利用散點圖判斷兩個變量是否有相關(guān)關(guān)系是比較直觀簡便的方法.如果所有的樣本點都落在某一函數(shù)的曲線附近,變量之間就有相關(guān)關(guān)系.如果所有的樣本點都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系.若點散布在從左下角到右上角的區(qū)域,則正相關(guān),若點散布在左上角到右下角的區(qū)域,則負相關(guān). 2.利用相關(guān)系數(shù)判定,當|r|越趨近于1,相關(guān)性越強. 當殘差平方和越小,相關(guān)指數(shù)R2越大,相關(guān)性越強. [變式訓練1] 甲、乙、丙、丁四位同學各自對A,B兩變量的線性相
11、關(guān)性做試驗,并用回歸分析方法分別求得相關(guān)系數(shù)r與殘差平方和m如下表: 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103 則哪位同學的試驗結(jié)果體現(xiàn)A,B兩變量有更強的線性相關(guān)性( ) A.甲 B.乙 C.丙 D.丁 D [在驗證兩個變量之間的線性相關(guān)關(guān)系時,相關(guān)系數(shù)的絕對值越接近于1,相關(guān)性越強,在四個選項中只有丁的相關(guān)系數(shù)最大;殘差平方和越小,相關(guān)性越強,只有丁的殘差平方和最小,綜上可知丁的試驗結(jié)果體現(xiàn)了A,B兩變量有更強的線性相關(guān)性.] 線性回歸方程及應用 (2016·全國卷
12、Ⅲ)如圖9-4-3是我國2008年至2014年生活垃圾無害化處理量(單位:億噸)的折線圖. 圖9-4-3 注:年份代碼1~7分別對應年份2008~2014. (1)由折線圖看出,可用線性回歸模型擬合y與t的關(guān)系,請用相關(guān)系數(shù)加以說明; (2)建立y關(guān)于t的回歸方程(系數(shù)精確到0.01),預測2016年我國生活垃圾無害化處理量. 參考數(shù)據(jù):yi=9.32,tiyi=40.17,=0.55,≈2.646. 參考公式:相關(guān)系數(shù)r=,回歸方程=+t中斜率和截距的最小二乘估計公式分別為=,=-. [解] (1)由折線圖中的數(shù)據(jù)和附注中的參考數(shù)據(jù)得 =4, (ti-)2=28,=0.5
13、5,2分 (ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89, 所以r≈≈0.99. 因為y與t的相關(guān)系數(shù)近似為0.99,說明y與t的線性相關(guān)程度相當大,從而可以用線性回歸模型擬合y與t的關(guān)系.5分 (2)由=≈1.331及(1)得 ==≈0.103.8分 =-≈1.331-0.103×4≈0.92. 所以y關(guān)于t的回歸方程為=0.92+0.10t.10分 將2016年對應的t=9代入回歸方程得=0.92+0.10×9=1.82. 所以預測2016年我國生活垃圾無害化處理量約為1.82億噸.12分 [規(guī)律方法] 1.在分析實際中兩個變量的相關(guān)
14、關(guān)系時,可根據(jù)樣本數(shù)據(jù)作出散點圖來確定兩個變量之間是否具有相關(guān)關(guān)系,也可計算相關(guān)系數(shù)r進行判斷.若具有線性相關(guān)關(guān)系,則可通過線性回歸方程估計和預測變量的值. 2.(1)正確運用計算,的公式和準確的計算,是求線性回歸方程的關(guān)鍵.(2)回歸直線=x+必過樣本點的中心(,). [變式訓練2] (2014·全國卷Ⅱ)某地區(qū)2007年至2013年農(nóng)村居民家庭人均純收入y(單位:千元)的數(shù)據(jù)如下表: 年 份 2007 2008 2009 2010 2011 2012 2013 年份代號t 1 2 3 4 5 6 7 人均純收入y 2.9 3.3 3.6 4.4
15、 4.8 5.2 5.9 (1)求y關(guān)于t的線性回歸方程; (2)利用(1)中的回歸方程,分析2007年至2013年該地區(qū)農(nóng)村居民家庭人均純收入的變化情況,并預測該地區(qū)2015年農(nóng)村居民家庭人均純收入. 附:回歸直線的斜率和截距的最小二乘估計公式分別為: =,=-. [解] (1)由所給數(shù)據(jù)計算得=(1+2+3+4+5+6+7)=4, =(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, (ti-)2=9+4+1+0+1+4+9=28,3分 (ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.
16、5+2×0.9+3×1.6=14, ===0,5, =-=4.3-0.5×4=2.3, 所求回歸方程為=0.5t+2.3.6分 (2)由(1)知,=0.5>0,故2007年至2013年該地區(qū)農(nóng)村居民家庭人均純收入逐年增加,平均每年增加0.5千元.9分 將2015年的年份代號t=9代入(1)中的回歸方程,得 =0.5×9+2.3=6.8, 故預測該地區(qū)2015年農(nóng)村居民家庭人均純收入為6.8千元.12分 獨立性檢驗 (2017·鄭州調(diào)研)某高校共有學生15 000人,其中男生10 500人,女生4 500人.為調(diào)查該校學生每周平均體育運動時間的情況,采用分層抽樣的方法,收
17、集300位學生每周平均體育運動時間的樣本數(shù)據(jù)(單位:小時). (1)應收集多少位女生的樣本數(shù)據(jù)? (2)根據(jù)這300個樣本數(shù)據(jù),得到學生每周平均體育運動時間的頻率分布直方圖(如圖9-4-4所示),其中樣本數(shù)據(jù)的分組區(qū)間為:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估計該校學生每周平均體育運動時間超過4小時的概率; 【導學號:01772369】 圖9-4-4 (3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運動時間超過4小時,請完成每周平均體育運動時間與性別列聯(lián)表,并判斷是否有95%的把握認為“該校學生的每周平均體育運動時間與性別有關(guān)”. P(
18、K2≥k0) 0.10 0.05 0.010 0.005 k0 2.706 3.841 6.635 7.879 附:K2=. [解] (1)利用分層抽樣,300×=90,所以應收集90位女生的樣本數(shù)據(jù).4分 (2)由頻率分布直方圖得1-2×(0.025+0.100)=0.75.所以該校學生每周平均體育運動時間超過4小時的概率的估計值為0.75.8分 (3)由(2)知,300位學生中有300×0.75=225人的每周平均體育運動時間超過4小時,75人的每周平均體育運動時間不超過4小時.10分 又因為樣本數(shù)據(jù)中有210份是關(guān)于男生的,90份是關(guān)于女生的,所以每周平均體育
19、運動時間與性別列聯(lián)表如下: 每周平均體育運動時間與性別列聯(lián)表 男生 女生 總計 每周平均體育運動時間不超過4小時 45 30 75 每周平均體育運動時間超過4小時 165 60 225 總計 210 90 300 將2×2列聯(lián)表中的數(shù)據(jù)代入公式計算,得K2觀測值 k==≈4.762>3.841. 所以,有95%的把握認為“該校學生的每周平均體育運動時間與性別有關(guān)”.12分 [規(guī)律方法] 1.在2×2列聯(lián)表中,如果兩個變量沒有關(guān)系,則應滿足ad-bc≈0.|ad-bc|越小,說明兩個變量之間關(guān)系越弱;|ad-bc|越大,說明兩個變量之間關(guān)系越強. 2
20、.解決獨立性檢驗的應用問題,一定要按照獨立性檢驗的步驟得出結(jié)論.獨立性檢驗的一般步驟: (1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表; (2)根據(jù)公式K2=計算K2的觀測值k; (3)比較k與臨界值的大小關(guān)系,作統(tǒng)計推斷. [變式訓練3] (2017·濟南聯(lián)考)某市地鐵即將于2017年6月開始運營,為此召開了一個價格聽證會,擬定價格后又進行了一次調(diào)查,隨機抽查了50人,他們的收入與態(tài)度如下; 月收入(單位:百元) [15,25) [25,35) [35,45) [45,55) [55,65) [65,75] 贊成定價者人數(shù) 1 2 3 5 3 4 認為價格偏高者人數(shù)
21、 4 8 12 5 2 1 (1)若以區(qū)間的中點值為該區(qū)間內(nèi)的人均月收入,求參與調(diào)查的人員中“贊成定價者”與“認為價格偏高者”的月平均收入的差距是多少(結(jié)果保留2位小數(shù)); (2)由以上統(tǒng)計數(shù)據(jù)填下面2×2列聯(lián)表,分析是否有99%的把握認為“月收入以55百元為分界點對地鐵定價的態(tài)度有差異”. 月收入不低于55百元的人數(shù) 月收入低于55百元的人數(shù) 總計 認為價格偏高者 贊成定價者 總計 附:K2=. P(K2≥k0) 0.05 0.01 k0 3.841 6.635 [解] (1)“贊成定價者”的月平均收入為
22、x1= ≈50.56. “認為價格偏高者”的月平均收入為 x2= =38.75, ∴“贊成定價者”與“認為價格偏高者”的月平均收入的差距是x1-x2=50.56-38.75=11.81(百元).5分 (2)根據(jù)條件可得2×2列聯(lián)表如下: 月收入不低于 55百元的人數(shù) 月收入低于 55百元的人數(shù) 總計 認為價格偏高者 3 29 32 贊成定價者 7 11 18 總計 10 40 50 K2=≈6.27<6.635, ∴沒有99%的把握認為“月收入以55百元為分界點對地鐵定價的態(tài)度有差異”.12分 [思想與方法] 1.回歸分析是處理變量
23、相關(guān)關(guān)系的一種數(shù)學方法.主要解決:(1)確定特定量之間是否有相關(guān)關(guān)系,如果有就找出它們之間貼近的數(shù)學表達式;(2)根據(jù)一組觀察值,預測變量的取值及判斷變量取值的變化趨勢;(3)求出線性回歸方程. 2.根據(jù)K2的值可以判斷兩個分類變量有關(guān)的可信程度. [易錯與防范] 1.回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性時,求出的線性回歸方程才有實際意義,否則,求出的線性回歸方程毫無意義.根據(jù)回歸方程進行預報,僅是一個預報值,而不是真實發(fā)生的值. 2.獨立性檢驗中統(tǒng)計量K2的觀測值k的計算公式很復雜,在解題中易混淆一些數(shù)據(jù)的意義,代入公式時出錯,而導致整個計算結(jié)果出錯.
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 市教育局冬季運動會安全工作預案
- 2024年秋季《思想道德與法治》大作業(yè)及答案3套試卷
- 2024年教師年度考核表個人工作總結(jié)(可編輯)
- 2024年xx村兩委涉案資金退還保證書
- 2024年憲法宣傳周活動總結(jié)+在機關(guān)“弘揚憲法精神推動發(fā)改工作高質(zhì)量發(fā)展”專題宣講報告會上的講話
- 2024年XX村合作社年報總結(jié)
- 2024-2025年秋季第一學期初中歷史上冊教研組工作總結(jié)
- 2024年小學高級教師年終工作總結(jié)匯報
- 2024-2025年秋季第一學期初中物理上冊教研組工作總結(jié)
- 2024年xx鎮(zhèn)交通年度總結(jié)
- 2024-2025年秋季第一學期小學語文教師工作總結(jié)
- 2024年XX村陳規(guī)陋習整治報告
- 2025年學校元旦迎新盛典活動策劃方案
- 2024年學校周邊安全隱患自查報告
- 2024年XX鎮(zhèn)農(nóng)村規(guī)劃管控述職報告