《高中數(shù)學 第三章 統(tǒng)計案例章末高效整合課件 新人教A版選修2-3》由會員分享,可在線閱讀,更多相關《高中數(shù)學 第三章 統(tǒng)計案例章末高效整合課件 新人教A版選修2-3(57頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第 三 章 統(tǒng)計案例 章 末 高 效 整 合 知能整合提升 1兩個基本思想(1)回歸分析的基本思想回歸分析包括線性回歸分析和非線性回歸分析兩種,而非線性回歸分析往往可以通過變量代換轉(zhuǎn)化為線性回歸分析,因此,回歸分析的思想主要是指線性回歸分析的思想 注意理解以下幾點:確定線性相關關系線性相關關系有兩層含義:一是具有相關關系,如廣告費用與銷售量的關系等在一定條件下具有相關關系,而氣球的體積與半徑的關系是函數(shù)關系,而不是相關關系;二是具有線性相關關系 判斷是否線性相關的依據(jù)是觀察樣本點的散點圖;引起預報誤差的因素對于線性回歸模型ybxae,引起預報變量y的誤差的因素有兩個:一個是解釋變量x,另一個是
2、隨機誤差e;回歸方程的預報精度判斷回歸方程的預報精度是通過計算殘差平方和來進行的,殘差平方和越小,方程的預報精度越高 簡單來說,線性回歸分析就是通過建立回歸直線方程對變量進行預報,用回歸方程預報時,需對函數(shù)值明確理解,它表示當x取值時,真實值在函數(shù)值附近或平均值在函數(shù)值附近,不能認為就是真實值; 回歸模型的擬合效果判斷回歸模型的擬合效果的過程也叫殘差分析,殘差分析的方法有兩種,一是通過殘差圖直觀判斷,二是通過計算相關指數(shù)R2的大小判斷 (2)獨立性檢驗的基本思想獨立性檢驗的基本思想類似于反證法要確認兩個分類變量有關系的可信程度,先假設兩個分類變量沒有關系,再計算隨機變量K2的觀測值,最后由K2
3、的觀測值很大在一定程度上說明兩個分類變量有關系 進行獨立性檢驗要注意理解以下三個問題:獨立性檢驗適用于兩個分類變量;兩個分類變量是否有關系的直觀判斷:一是根據(jù)22列聯(lián)表計算|adbc|,值越大關系越強;二是觀察等高條形圖,兩個深色條的高度相差越大關系越強獨立性檢驗是對兩個分類變量有關系的可信程度的判斷,而不是對其是否有關系的判斷獨立性檢驗的結(jié)論只能是有多大的把握確認兩個分類變量有關系,而不能是兩個分類變量一定有關系或沒有關系 2兩個重要參數(shù)(1)相關指數(shù)R2相關指數(shù)R2是用來刻畫回歸模型的回歸效果的,其值越接近1,殘差平方和越小,模型的擬合效果越好(2)隨機變量K2隨機變量K2是用來判斷兩個分
4、類變量在多大程度上相關的變量獨立性檢驗即計算K2的觀測值,并與教材中所給表格中的數(shù)值進行比較,從而得到兩個分類變量在多大程度上相關 3兩種重要圖形(1)散點圖散點圖是進行線性回歸分析的主要手段,其作用如下:一是判斷兩個變量是否具有線性相關關系,如果樣本點呈條狀分布,則可以斷定兩個變量有較好的線性相關關系;二是判斷樣本中是否存在異常 (2)殘差圖殘差圖可以用來判斷模型的擬合效果,其作用如下:一是判斷模型的精度,殘差點所分布的帶狀區(qū)域越窄,說明模型的擬合精度越高,回歸方程的預報精度越高;二是確認樣本點在采集中是否有人為的錯誤 熱點考點例析 線性回歸分析的應用點撥:回歸分析的基本步驟為:(1)確定研
5、究對象,明確哪個變量是解釋變量,哪個變量是預報變量;(2)畫出確定好的解釋變量和預報變量的散點圖,觀察它們之間的關系; (3)由經(jīng)驗確定回歸方程的類型;(4)按一定規(guī)則估計回歸方程中的參數(shù);(5)得檢查回歸模型的擬合程度,如分析殘差圖、求相關指數(shù)R2等 一個車間為了規(guī)定工時定額,需確定加工零件所花費的時間,為此進行了10次試驗,測得的數(shù)據(jù)如下表:零件數(shù)x(個) 10 20 30 40 50 60 70 80 90 100加工時間y(min) 62 72 75 81 85 95 103 108 112 127 (1)畫出散點圖,并初步判斷是否線性相關;(2)若線性相關,求回歸直線方程;(3)求出
6、相關指數(shù);(4)作出殘差圖;(5)進行殘差分析;(6)試制訂加工200個零件的用時規(guī)定 思維點擊明確各相關概念求出回歸直線方程是解題關鍵注意正確使用公式和準確計算 (1)散點圖如圖所示由圖可知,x,y線性相關 將數(shù)據(jù)代入相應公式可得數(shù)據(jù)表: (3)利用所求回歸方程求出下列數(shù)據(jù): 1為了研究3月下旬的平均氣溫(x)與4月20日前棉花害蟲化蛹高峰日(y)的關系,某地區(qū)觀察了2007年至2011年的情況得到下面數(shù)據(jù):年份2006 2007 2008 2009 2010 2011x(C) 24.4 29.6 32.7 28.7 30.3 28.9y(天) 19 6 1 10 1 8 點撥:非線性回歸問
7、題的處理技巧一般地,有些非線性回歸模型通過變換可以轉(zhuǎn)化為線性回歸模型,即借助于線性回歸模型研究呈非線性回歸關系的兩個變量之間的關系(1)如果散點圖中的點分布在一個直線狀帶形區(qū)域,可以選用線性回歸模型來建模;(2)如果散點圖中的點的分布在一個曲線狀帶形區(qū)域,要先對變量作適當?shù)淖儞Q,再利用線性回歸模型來建模非線性回歸問題 xi 0.05 0.06 0.25 0.31 0.07 0.10yi 0.10 0.14 1.00 1.12 0.23 0.37xi 0.38 0.43 0.14 0.20 0.47yi 1.19 1.25 0.59 0.79 1.29 ui 20.000 16.667 4.00
8、0 3.226 14.286 10.000vi2.3031.966 0 0.1131.4700.994ui 2.632 2.326 7.143 5.000 2.128vi 0.174 0.2230.5280.236 0.255 2電容器充電后,電壓達到100 V,然后開始放電,由經(jīng)驗知道,此后電壓U隨時間t變化的規(guī)律公式UAebt(b0)表示,觀測得時間t(s)時的電壓U(V)如下表所示:試求電壓U對時間t的回歸方程t 0 1 2 3 4 5 6 7 8 9 10U 100 75 55 40 30 20 15 10 10 5 5 解析:對UAebt兩邊取自然對數(shù)得ln Uln Abt,令yln
9、 U,aln A,即ybta,由所給數(shù)據(jù)可得t 0 1 2 3 4 5 6 7 8 9 10ln U(y) 4.6 4.3 4.0 3.7 3.4 3.0 2.7 2.3 2.3 1.6 1.6 其散點圖為: 點撥:1.獨立性檢驗的一般步驟:(1)提出假設H0:和沒有關系;(2)根據(jù)22列聯(lián)表計算K2的觀測值;(3)根據(jù)K2的觀測值與臨界值的大小關系作統(tǒng)計推斷獨立性檢驗 2可以用反證法的原理來解釋獨立性檢驗原理.反證法原理獨立性檢驗原理在一個已知假設下,如果推出一個矛盾,就證明了這個假設不成立在一個已知假設下,如果出現(xiàn)一個與該假設矛盾的小概率事件發(fā)生,就推斷這個假設不成立,且該推斷犯錯誤的概率
10、不超過這個小概率 從上述對比中可以看出,假設檢驗的原理和反證法原理類似不同之處:一是獨立性檢驗中用有利于H0的小概率事件的發(fā)生代替了反證法中的矛盾;二是獨立性檢驗中接受原假設的結(jié)論相當于反證法中沒有找到矛盾把獨立性檢驗的基本思想具體化到獨立性檢驗中,就可以通過隨機變量K2的值的大小來研究兩個分類變量是否有相關關系 調(diào)查某醫(yī)院某段時間內(nèi)嬰兒出生的時間與性別的關系,得到下面的數(shù)據(jù)表,試問嬰兒的性別與出生的時間是否有關系?出生時間性別晚上白天總計男嬰15 31 46女嬰8 26 34總計23 57 80 思維點擊根據(jù)列聯(lián)表,將相應數(shù)據(jù)代入公式求K2. 3為了探究患慢性氣管炎是否與吸煙有關,調(diào)查了33
11、9名50歲以上的人,調(diào)查如下表所示:試問:50歲以上的人患慢性氣管炎與吸煙習慣是否有關系?患慢性氣管炎未患慢性氣管炎合計吸煙43 162 205不吸煙13 121 134合計56 283 339 解析:5是斜率的估計值,說明x每增加一個單位,y平均減少5個單位答案:B 4若由一個22列聯(lián)表中的數(shù)據(jù)計算得K26.630,則判斷“這兩個分類變量有關系”時,犯錯誤的最大概率是()A0.025 B0.01C0.005 D0.001解析:P(K25.024)0.025,又K26.6305.024,犯錯誤的最大概率為0.025.答案:A 5若由一個22列聯(lián)表中的數(shù)據(jù)計算得K24.073,那么在犯錯誤的概率
12、不超過_的前提下認為兩變量有關系,已知P(K23.841)0.05,P(K25.024)0.025.解析:查表可知K2的觀測值k4.0733.841,因此在犯錯誤的概率不超過5%的前提下認為兩變量有關系答案:5% 7某產(chǎn)品的廣告費支出x與銷售額y(單位:百萬元)之間有如下對應數(shù)據(jù):請畫出散點圖并用散點圖粗略地判斷x,y是否線性相關x 2 4 5 6 8y 30 40 60 50 70 解析:散點圖如圖從散點圖可以看出散點呈條狀分布,所以x,y具有較強的線性相關關系 8某研究者欲考察某一高考試題的得分情況是否與性別有關系,統(tǒng)計結(jié)果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人試根據(jù)這些數(shù)據(jù)判斷這一高考試題的得分情況與性別是否有關系 解析:根據(jù)題中數(shù)據(jù)得如下列聯(lián)表:及格不及格總計男生290 160 450女生100 350 450總計390 510 900