金版教程高考數(shù)學文二輪復習講義:第二編 專題整合突破 專題七概率與統(tǒng)計 第二講 統(tǒng)計與統(tǒng)計案例 Word版含解析
第二講統(tǒng)計與統(tǒng)計案例必記公式數(shù)據(jù)x1,x2,x3,xn的數(shù)字特征(1)眾數(shù):在樣本數(shù)據(jù)中,出現(xiàn)次數(shù)最多的那個數(shù)據(jù)中位數(shù):樣本數(shù)據(jù)中,將數(shù)據(jù)按大小排列,位于最中間的數(shù)據(jù)如果數(shù)據(jù)的個數(shù)為偶數(shù),就取中間兩個數(shù)據(jù)的平均數(shù)作為中位數(shù);(2)樣本平均數(shù)(x1x2xn)xi;(3)樣本方差s2(x1)2(x2)2(xn)2 (xi)2;(4)樣本標準差s.重要結論1直方圖的三個有用結論(1)小長方形的面積組距頻率;(2)各小長方形的面積之和等于1;(3)小長方形的高,所有小長方形高的和為.2回歸直線方程一組具有線性相關關系的數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)其回歸方程x,其過樣本點中心(,)3獨立性檢驗K2(其中nabcd為樣本容量).失分警示1混淆簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣,不能正確地選擇抽樣方法2不能正確地從頻率分布直方圖中提取相關的信息,忽略了頻數(shù)與頻率的差異3混淆條形圖與直方圖,條形圖是離散隨機變量,縱坐標刻度為頻數(shù)或頻率,直方圖是連續(xù)隨機變量,縱坐標刻度為頻率/組距,這是密度,連續(xù)隨機變量在某一點上是沒有頻率的4回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的方法只有在散點圖大致呈線性時,求出的回歸直線方程才有實際意義考點抽樣方法典例示法典例1(1)為了解某地區(qū)的中小學生的視力情況,擬從該地區(qū)的中小學生中抽取部分學生進行調查,事先已了解到該地區(qū)小學、初中、高中三個學段學生的視力情況有較大差異,而男女生視力情況差異不大在下面的抽樣方法中,最合理的抽樣方法是()A簡單隨機抽樣 B按性別分層抽樣C按學段分層抽樣 D系統(tǒng)抽樣解析因為男女生視力情況差異不大,而學段的視力情況有較大差異,所以應按學段分層抽樣答案C(2)2014廣東高考已知某地區(qū)中小學生人數(shù)和近視情況分別如圖1和圖2所示為了解該地區(qū)中小學生的近視形成原因,用分層抽樣的方法抽取2%的學生進行調查,則樣本容量和抽取的高中生近視人數(shù)分別為()A200,20 B100,20C200,10 D100,10解析由題圖可知,樣本容量等于(350045002000)2%200;抽取的高中生近視人數(shù)為20002%50%20,故選A.答案A系統(tǒng)抽樣與分層抽樣的求解方法(1)系統(tǒng)抽樣的最基本特征是“等距性”,每組內所抽取的號碼需要依據(jù)第一組抽取的號碼和組距唯一確定每組抽取樣本的號碼依次構成一個以第一組抽取的號碼m為首項,組距d為公差的等差數(shù)列an,第k組抽取樣本的號碼akm(k1)d.(2)分層抽樣的關鍵是根據(jù)樣本特征的差異進行分層,實質是等比例抽樣,求解此類問題需先求出抽樣比樣本容量與總體容量的比,則各層所抽取的樣本容量等于該層個體總數(shù)與抽樣比的乘積在每層抽樣時,應采用簡單隨機抽樣或系統(tǒng)抽樣進行針對訓練1.2016浙江杭州模擬某校150名教職工中,有老年人20名,中年人50名,青年人80名,從中抽取30名作為樣本采用隨機抽樣法:抽簽取出30個樣本;采用系統(tǒng)抽樣法:將教職工編號為00,01,149,然后平均分組抽取30個樣本;采用分層抽樣法:從老年人、中年人、青年人中抽取30個樣本下列說法中正確的是 ()A無論采用哪種方法,這150名教職工中每個人被抽到的概率都相等B兩種抽樣方法,這150名教職工中每個人被抽到的概率都相等;并非如此C兩種抽樣方法,這150名教職工中每個人被抽到的概率都相等;并非如此D采用不同的抽樣方法,這150名教職工中每個人被抽到的概率是各不相同的答案A解析三種抽樣方法中,每個人被抽到的概率都等于,故選A.22016江西南昌一模一所中學共有4000名學生,為了引導學生樹立正確的消費觀,需抽樣調查學生每天使用零花錢的數(shù)量(取整數(shù)元)情況,分層抽取容量為300的樣本,作出頻率分布直方圖如圖所示,請估計在全校所有學生中,一天使用零花錢在6元14元的學生大約有_人答案2720解析根據(jù)頻率分布直方圖得:一天使用零花錢在6元14元的學生頻率是1(0.020.030.03)410.320.68,對應的頻數(shù)是40000.682720,估計全校學生中,一天使用零花錢在6元14元的大約有2720人考點用樣本估計總體典例示法題型1用樣本數(shù)字特征估計總體典例22014湖南高考某企業(yè)有甲、乙兩個研發(fā)小組,為了比較他們的研發(fā)水平,現(xiàn)隨機抽取這兩個小組往年研發(fā)新產品的結果如下:(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),(a,),(,),(a,b),(a,),(,b),(a,b),其中a,分別表示甲組研發(fā)成功和失敗;b,分別表示乙組研發(fā)成功和失敗(1)若某組成功研發(fā)一種新產品,則給該組記1分,否則記0分試計算甲、乙兩組研發(fā)新產品的成績的平均數(shù)和方差,并比較甲、乙兩組的研發(fā)水平;(2)若該企業(yè)安排甲、乙兩組各自研發(fā)一種新產品,試估計恰有一組研發(fā)成功的概率解(1)甲組研發(fā)新產品的成績?yōu)?,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均數(shù)為甲;方差為s.乙組研發(fā)新產品的成績?yōu)?,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均數(shù)為乙;方差為s.因為甲>乙,s<s,所以甲組的研發(fā)水平優(yōu)于乙組(2)記E恰有一組研發(fā)成功在所抽得的15個結果中,恰有一組研發(fā)成功的結果是(a,),(,b),(a,),(,b),(a,),(a,),(,b),共7個,故事件E發(fā)生的頻率為.將頻率視為概率,即得所求概率為P(E).題型2用頻率分布直方圖估計總體典例32015廣東高考某城市100戶居民的月平均用電量(單位:度),以160,180),180,200),200,220),220,240),240,260),260,280),280,300分組的頻率分布直方圖如圖(1)求直方圖中x的值;(2)求月平均用電量的眾數(shù)和中位數(shù);(3)在月平均用電量為220,240),240,260),260,280),280,300的四組用戶中,用分層抽樣的方法抽取11戶居民,則月平均用電量在220,240)的用戶中應抽取多少戶?解(1)由已知得,20(0.0020.00950.0110.0125x0.0050.0025)1,解得x0.0075.(2)由題圖可知,面積最大的矩形對應的月平均用電量區(qū)間為220,240),所以月平均用電量的眾數(shù)的估計值為230;因為20(0.0020.00950.011)0.45<0.5,20(0.0020.009 50.0110.0125)0.7>0.5,所以中位數(shù)在區(qū)間220,240)內,設中位數(shù)為m,則20(0.0020.00950.011)0.0125(m220)0.5,解得m224.所以月平均用電量的中位數(shù)為224.(3)由題圖知,月平均用電量為220,240)的用戶數(shù)為(240220)0.012510025,同理可得,月平均用電量為240,260),260,280),280,300的用戶數(shù)分別為15,10,5.故用分層抽樣的方式抽取11戶居民,月平均用電量在220,240)的用戶中應抽取115(戶)1用樣本估計總體的兩種方法(1)用樣本的頻率分布(頻率分布表、頻率分布直方圖、莖葉圖等)估計總體的頻率分布. (2)用樣本的數(shù)字特征(眾數(shù)、中位數(shù)、平均數(shù)、方差、標準差)估計總體的數(shù)字特征2方差的計算與含義計算方差首先要計算平均數(shù),然后再按照方差的計算公式進行計算,方差和標準差是描述一個樣本和總體的波動大小的特征數(shù),方差、標準差大說明波動大3眾數(shù)、中位數(shù)、平均數(shù)與頻率分布直方圖的關系(1)眾數(shù)為頻率分布直方圖中最高矩形的底邊中點的橫坐標(2)中位數(shù)為平分頻率分布直方圖面積且垂直于橫軸的直線與橫軸交點的橫坐標(3)平均數(shù)等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和考點線性回歸分析與獨立性檢驗典例示法題型1線性回歸分析典例42016全國卷下圖是我國2008年至2014年生活垃圾無害化處理量(單位:億噸)的折線圖(1)由折線圖看出,可用線性回歸模型擬合y與t的關系,請用相關系數(shù)加以說明;(2)建立y關于t的回歸方程(系數(shù)精確到0.01),預測2016年我國生活垃圾無害化處理量附注:參考數(shù)據(jù):yi9.32,tiyi40.17, 0.55,2.646.參考公式:相關系數(shù)r,回歸方程t中斜率和截距的最小二乘估計公式分別為:, .解(1)由折線圖中數(shù)據(jù)和附注中參考數(shù)據(jù)得4, (ti)228, 0.55, (ti)(yi)tiyiyi40.1749.322.89,r0.99.因為y與t的相關系數(shù)近似為0.99,說明y與t的線性相關程度相當高,從而可以用線性回歸模型擬合y與t的關系(2)由1.331及(1)得0.103,1.3310.10340.92.所以,y關于t的回歸方程為0.920.10t.將2016年對應的t9代入回歸方程得0.920.1091.82.所以預測2016年我國生活垃圾無害化處理量約為1.82億噸題型2獨立性檢驗典例52016長春質檢近年來我國電子商務行業(yè)迎來蓬勃發(fā)展的新機遇,2015年雙11期間,某平臺的銷售業(yè)績高達918億人民幣與此同時,相關管理部門也推出了針對電商的商品和服務評價體系現(xiàn)從評價系統(tǒng)中隨機選出200次成功的交易,并對其評價結果進行統(tǒng)計,對商品的好評率為,對服務的好評率為,其中對商品和服務都做出好評的交易為80次(1)是否可以在犯錯誤概率不超過0.1%的前提下,認為商品好評與服務好評有關?(2)若針對商品的好評率,采用分層抽樣的方式從這200次交易中取出5次交易,并從中選擇2次交易進行客戶回訪,求只有一次好評的概率P(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828解(1)由題意可得關于商品和服務評價的22列聯(lián)表:對服務好評對服務不滿意合計對商品好評8040120對商品不滿意701080合計15050200K211.111>10.828,可以在犯錯誤概率不超過0.1%的前提下,認為商品好評與服務好評有關(2)若針對商品的好評率,采用分層抽樣的方式從這200次交易中取出5次交易,則好評的交易次數(shù)為3,不滿意的次數(shù)為2,令好評的交易為A,B,C,不滿意的交易為a,b,從5次交易中,取出2次的所有取法為(A,B)、(A,C)、(A,a)、(A、b)、(B,C)、(B,a)、(B,b)、(C,a)、(C,b)、(a,b),共計10種情況,其中只有一次好評的情況是(A,a)、(A,b)、(B,a)、(B,b)、(C,a)、(C,b),共計6種,因此,只有一次好評的概率為.1進行線性回歸分析時應注意的問題(1)正確理解計算、的公式和準確的計算,是求線性回歸方程的關鍵(2)在分析兩個變量的相關關系時,可根據(jù)樣本數(shù)據(jù)作出散點圖來確定兩個變量之間是否具有相關關系,若具有線性相關關系,則可通過線性回歸方程估計和預測變量的值2進行獨立性檢驗的步驟(1)假設兩個分類變量X與Y無關;(2)找相關數(shù)據(jù),列出22列聯(lián)表;(3)由公式K2(其中nabcd)計算出K2的值;(4)將K2的值與臨界值進行對比,進而做出統(tǒng)計推斷提醒:K2的觀測值越大,對應假設事件成立的概率越小,假設事件不成立的概率越大全國卷高考真題調研12015全國卷根據(jù)下面給出的2004年至2013年我國二氧化硫年排放量(單位:萬噸)柱形圖,以下結論中不正確的是()A逐年比較,2008年減少二氧化硫排放量的效果最顯著B2007年我國治理二氧化硫排放顯現(xiàn)成效C2006年以來我國二氧化硫年排放量呈減少趨勢D2006年以來我國二氧化硫年排放量與年份正相關答案D解析根據(jù)柱形圖可觀察兩個變量的相關性,易知A、B、C正確,2006年以來我國二氧化硫年排放量與年份負相關,選項D錯誤故選D.22015全國卷某公司為確定下一年度投入某種產品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響對近8年的年宣傳費xi和年銷售量yi(i1,2,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值 (xi)2 (wi)2 (xi)(yi) (wi)(yi)46.65636.8289.81.61469108.8表中wi,wi.(1)根據(jù)散點圖判斷,yabx與ycd哪一個適宜作為年銷售量y關于年宣傳費x的回歸方程類型?(給出判斷即可,不必說明理由)(2)根據(jù)(1)的判斷結果及表中數(shù)據(jù),建立y關于x的回歸方程;(3)已知這種產品的年利潤z與x,y的關系為z0.2yx.根據(jù)(2)的結果回答下列問題:年宣傳費x49時,年銷售量及年利潤的預報值是多少?年宣傳費x為何值時,年利潤的預報值最大?附:對于一組數(shù)據(jù)(u1,v1),(u2,v2),(un,vn),其回歸直線vu的斜率和截距的最小二乘估計分別為,解(1)由散點圖可以判斷,ycd適宜作為年銷售量y關于年宣傳費x的回歸方程類型(2)令w,先建立y關于w的線性回歸方程由于68,563686.8100.6,所以y關于w的線性回歸方程為100.668w,因此y關于x的回歸方程為100.668.(3)由(2)知,當x49時,年銷售量y的預報值100.668576.6,年利潤z的預報值576.60.24966.32.根據(jù)(2)的結果知,年利潤z的預報值0.2(100.668)xx13.620.12.所以當6.8,即x46.24時,取得最大值故年宣傳費為46.24千元時,年利潤的預報值最大其它省市高考題借鑒32016山東高考某高校調查了200名學生每周的自習時間(單位:小時),制成了如圖所示的頻率分布直方圖,其中自習時間的范圍是17.5,30,樣本數(shù)據(jù)分組為17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根據(jù)直方圖,這200名學生中每周的自習時間不少于22.5小時的人數(shù)是()A56 B60C120 D140答案D解析由頻率分布直方圖可知,這200名學生每周的自習時間不少于22.5小時的頻率為(0.160.080.04)2.50.7,故這200名學生中每周的自習時間不少于22.5小時的人數(shù)為2000.7140.故選D.42015湖南高考在一次馬拉松比賽中,35名運動員的成績(單位:分鐘)的莖葉圖如圖所示.若將運動員按成績由好到差編為135號,再用系統(tǒng)抽樣方法從中抽取7人,則其中成績在區(qū)間139,151上的運動員人數(shù)是_答案4解析35人抽取7人,則n5,而在139,151上共有20人,應抽取4人52014安徽高考某高校共有學生15000人,其中男生10500人,女生4500人為調查該校學生每周平均體育運動時間的情況,采用分層抽樣的方法,收集300位學生每周平均體育運動時間的樣本數(shù)據(jù)(單位:小時)(1)應收集多少位女生的樣本數(shù)據(jù)?(2)根據(jù)這300個樣本數(shù)據(jù),得到學生每周平均體育運動時間的頻率分布直方圖(如圖所示),其中樣本數(shù)據(jù)的分組區(qū)間為:0,2,(2,4,(4,6,(6,8,(8,10,(10,12估計該校學生每周平均體育運動時間超過4小時的概率;(3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運動時間超過4小時,請完成每周平均體育運動時間與性別列聯(lián)表,并判斷是否有95%的把握認為“該校學生的每周平均體育運動時間與性別有關”附:K2P(K2k0)0.100.050.0100.005k02.7063.8416.6357.879解(1)30090,所以應收集90位女生的樣本數(shù)據(jù)(2)由頻率分布直方圖得12(0.1000.025)0.75,所以該校學生每周平均體育運動時間超過4小時的概率的估計值為0.75.(3)由(2)知,300位學生中有3000.75225人的每周平均體育運動時間超過4小時,75人的每周平均體育運動時間不超過4小時又因為樣本數(shù)據(jù)中有210份是關于男生的,90份是關于女生的,所以每周平均體育運動時間與性別列聯(lián)表如下: 每周平均體育運動時間與性別列聯(lián)表男生女生總計每周平均體育運動時間不超過4小時453075每周平均體育運動時間超過4小時16560225總計21090300結合列聯(lián)表可算得K24.762>3.841.所以,有95%的把握認為“該校學生的每周平均體育運動時間與性別有關”一、選擇題12016蘭州雙基測試某鄉(xiāng)政府調查A、B、C、D四個村的村民外出打工的情況,擬采用分層抽樣的方法從四個村中抽取一個容量為500的樣本進行調查已知A、B、C、D四個村的人數(shù)之比為4556,則應從C村中抽取的村民人數(shù)為()A100 B125C150 D175答案B解析由題意可知,應從C村中抽取500125名村民22016湖北武漢第二次調研如圖是依據(jù)某城市年齡在20歲到45歲的居民上網(wǎng)情況調查而繪制的頻率分布直方圖,現(xiàn)已知年齡在30,35),35,40),40,45)的上網(wǎng)人數(shù)呈現(xiàn)遞減的等差數(shù)列分布,則年齡在35,40)的網(wǎng)民出現(xiàn)的頻率為()A0.04 B0.06C0.2 D0.3答案C解析由頻率分布直方圖的知識得,年齡在20,25)的頻率為0.0150.05,25,30)的頻率為0.0750.35,設年齡在30,35),35,40),40,45的頻率為x,y,z,又x,y,z成等差數(shù)列,所以可得解得y0.2,所以年齡在35,40)的網(wǎng)民出現(xiàn)的頻率為0.2.故選C.32016開封一模下列說法錯誤的是()A自變量取值一定時,因變量的取值帶有一定隨機性的兩個變量之間的關系叫做相關關系B在線性回歸分析中,相關系數(shù)r的值越大,變量間的相關性越強C在殘差圖中,殘差點分布的帶狀區(qū)域的寬度越狹窄,其模型擬合的精度越高D在回歸分析中,R2為0.98的模型比R2為0.80的模型擬合的效果好答案B解析根據(jù)相關關系的概念知A正確;當r>0時,r越大,相關性越強,當r<0時,r越大,相關性越弱,故B不正確;對于一組數(shù)據(jù)的擬合程度的好壞的評價,一是殘差點分布的帶狀區(qū)域越窄,擬合效果越好二是R2越大,擬合效果越好,所以R2為0.98的模型比R2為0.80的模型擬合的效果好,C,D正確,故選B.42016河南鄭州二模某工廠為了對新研發(fā)的一種產品進行合理定價,將該產品按事先擬定的價格進行試銷,得到如下數(shù)據(jù):單價(元)456789銷量(件)908483807568由表中數(shù)據(jù),求得線性回歸方程4xa,若在這些樣本點中任取一點,則它在回歸直線左下方的概率為()A. B.C. D.答案B解析由表中數(shù)據(jù)得6.5,80.由(,)在直線4xa上,得a106.即線性回歸方程為4x106.經(jīng)過計算只有(5,84)和(9,68)在直線的下方,故所求概率為,選B.52016湖南永州一模為大力提倡“厲行節(jié)約,反對浪費”,某市通過隨機詢問100名性別不同的居民是否能做到“光盤”行動,得到如下的列聯(lián)表:做不到“光盤”能做到“光盤”男4510女3015附:P(K2k)0.100.050.025k2.7063.8415.024K2.參照附表,得到的正確結論是()A在犯錯誤的概率不超過1%的前提下,認為“該市居民能否做到光盤與性別有關”B在犯錯誤的概率不超過1%的前提下,認為“該市居民能否做到光盤與性別無關”C有90%以上的把握認為“該市居民能否做到光盤與性別有關”D有90%以上的把握認為“該市居民能否做到光盤與性別無關”答案C解析由題設知,a45,b10,c30,d15,所以K23.0303.2706<3.0303<3.841.由附表可知,有90%以上的把握認為“該市居民能否做到光盤與性別有關”,故選C.二、填空題62016石家莊質檢二將高三(1)班參加體檢的36名學生,編號為:1,2,3,36,若采用系統(tǒng)抽樣的方法抽取一個容量為4的樣本,已知樣本中含有編號為6、24、33的學生,則樣本中剩余一名學生的編號是_答案15解析根據(jù)系統(tǒng)抽樣的特點可知抽取的4名學生的編號依次成等差數(shù)列,故剩余一名學生的編號是15.72015豫北十校聯(lián)考2015年的NBA全明星賽于北京時間2015年2月14日舉行如圖是參加此次比賽的甲、乙兩名籃球運動員以往幾場比賽得分的莖葉圖,則甲、乙兩人這幾場比賽得分的中位數(shù)之和是_答案64解析應用莖葉圖的知識得,甲、乙兩人這幾場比賽得分的中位數(shù)分別為28,36,因此甲、乙兩人這幾場比賽得分的中位數(shù)之和是64.82016吉林通化月考某產品的廣告費用x(萬元)與銷售額y(萬元)的統(tǒng)計數(shù)據(jù)如下表:廣告費用x(萬元)3456銷售額y(萬元)25304045根據(jù)上表可得回歸方程x中的為7.據(jù)此模型預測廣告費用為10萬元時銷售額為_萬元答案73.5解析由題表可知,4.5,35,代入回歸方程7x,得3.5,所以回歸方程為7x3.5.所以當x10時,7103.573.5.三、解答題92016河北三市二聯(lián)下表是高三某位文科生連續(xù)5次月考的歷史、政治的成績,結果統(tǒng)計如下:月份91011121歷史(x分)7981838587政治(y分)7779798283(1)求該生5次月考歷史成績的平均分和政治成績的方差;(2)一般來說,學生的歷史成績與政治成績有較強的線性相關關系,根據(jù)上表提供的數(shù)據(jù),求兩個變量x、y的線性回歸方程x.附:, 解(1)(7981838587)83,(7779798283)80,s(7780)2(7980)2(7980)2(8280)2(8380)24.8.(2)(xi)(yi)30,(xi)240,0.75, 17.75.則所求的線性回歸方程為0.75x17.75.102016江淮十校一聯(lián)某學校在高一、高二兩個年級學生中各抽取100人的樣本,進行普法知識調查,其結果如下表:高一高二總數(shù)合格人數(shù)70x150不合格人數(shù)y2050總數(shù)100100200(1)求x,y的值;(2)有沒有99%的把握認為“高一、高二兩個年級這次普法知識調查結果有差異”;(3)用分層抽樣的方法從樣本的不合格同學中抽取5人的輔導小組,在5人中隨機選2人,這2人中,正好高一、高二各1人的概率為多少?參考公式:225.0246.6357.87910.82897.5%99%99.5%99.9%解(1)x80,y30.(2)由(1)得22.67<6.635,所以沒有99%的把握認為“高一、高二兩個年級這次普法知識調查結果有差異”(3)由分層抽樣得從高一抽取3人,設為A,B,C,從高二抽取2人,設為1,2.從5人中選2人,有(AB),(AC),(A1),(A2),(BC),(B1),(B2),(C1),(C2),(12),共10種選法其中正好高一、高二各1人,有(A1),(A2),(B1),(B2),(C1),(C2),共6種選法所以所求概率為P.112016重慶測試從甲、乙兩部門中各任選10名員工進行職業(yè)技能測試,測試成績(單位:分)數(shù)據(jù)的莖葉圖如圖1所示:(1)分別求出甲、乙兩組數(shù)據(jù)的中位數(shù),并比較兩組數(shù)據(jù)的分散程度(只需給出結論);(2)甲組數(shù)據(jù)頻率分布直方圖如圖2所示,求a、b、c的值;(3)從甲、乙兩組數(shù)據(jù)中各任取一個,求所取兩數(shù)之差的絕對值大于20的概率解(1)甲組數(shù)據(jù)的中位數(shù)為78.5,乙組數(shù)據(jù)的中位數(shù)為78.5.從莖葉圖可以看出,甲組數(shù)據(jù)比較集中,乙組數(shù)據(jù)比較分散(2)由圖易知a0.05,b0.02,c0.01.(3)從甲、乙兩組數(shù)據(jù)中各任取一個,得到的所有基本事件共有100個,其中滿足“兩數(shù)之差的絕對值大于20”的基本事件有16個,故所求概率P.12為了調查學生星期天晚上學習時間的利用問題,某校從高二年級1000名學生(其中走讀生450名,住宿生550名)中,采用分層抽樣的方法抽取n名學生進行問卷調查根據(jù)問卷取得了這n名同學星期天晚上學習時間(單位:分鐘)的數(shù)據(jù),按照以下區(qū)間分為八組:0,30),30,60),60,90),90,120),120,150),150, 180),180,210),210, 240),得到頻率分布直方圖如圖,已知抽取的學生中星期天晚上學習時間少于60分鐘的人數(shù)為5人(1)求n的值并補全頻率分布直方圖;(2)如果把“學生晚上學習時間達到兩小時”作為是否充分利用時間的標準,對抽取的n名學生,完成下列22列聯(lián)表:利用時間充分利用時間不充分總計走讀生住宿生10總計據(jù)此資料,是否有95%的把握認為學生“利用時間是否充分”與走讀、住宿有關?(3)若在第組、第組共抽出2人調查影響有效利用時間的原因,求抽出的2人中第組、第組各有1人的概率參考數(shù)據(jù):P(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828解(1)設第i組的頻率為Pi(i1,2,8),由圖可知P130,P230,學習時間少于60分鐘的頻率為P1P2,由題意得n5,n100.又P330,P530,P630,P730,P830,P41(P1P2P3P5P6P7P8),第組的高度為h,頻率分布直方圖如圖(2)由頻率分布直方圖可知,在抽取的100人中,“住宿生”有55人,“走讀生”有45人,利用時間不充分的有100(P1P2P3P4)25人,從而22列聯(lián)表如下:利用時間充分利用時間不充分總計走讀生301545住宿生451055總計7525100將22列聯(lián)表中的數(shù)據(jù)代入公式計算,得K23.030.3.030<3.841,沒有理由認為學生“利用時間是否充分”與走讀、住宿有關(3)由題可知第組人數(shù)為100P12(人),第組人數(shù)為100P23(人),記第組的2人為A1,A2,第組的3人為B1,B2,B3,則“從5人中抽取2人”所構成的基本事件有A1A2,A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,B1B2,B1B3,B2B3”,共10個基本事件;記“抽取2人中第組、第組各有1人”記作事件A,則事件A所包含的基本事件有A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,共6個基本事件,P(A),即抽出的2人中第組、第組各有1人的概率為.典題例證2016全國卷某公司計劃購買1臺機器,該種機器使用三年后即被淘汰機器有一易損零件,在購進機器時,可以額外購買這種零件作為備件,每個200元在機器使用期間,如果備件不足再購買,則每個500元現(xiàn)需決策在購買機器時應同時購買幾個易損零件,為此搜集并整理了100臺這種機器在三年使用期內更換的易損零件數(shù),得下面柱狀圖:記x表示1臺機器在三年使用期內需更換的易損零件數(shù),y表示1臺機器在購買易損零件上所需的費用(單位:元),n表示購機的同時購買的易損零件數(shù)(1)若n19,求y與x的函數(shù)解析式;(2)若要求“需更換的易損零件數(shù)不大于n”的頻率不小于0.5,求n的最小值;(3)假設這100臺機器在購機的同時每臺都購買19個易損零件,或每臺都購買20個易損零件,分別計算這100臺機器在購買易損零件上所需費用的平均數(shù),以此作為決策依據(jù),購買1臺機器的同時應購買19個還是20個易損零件?審題過程讀懂題意與柱狀圖,用分段函數(shù)表示y與x的函數(shù)關系把頻率問題轉化為頻數(shù)問題,即可求出n的最小值,分別求出n19,n20時的平均數(shù),比較大小即可得出結論.(1)當x19時,y3800;當x>19時,y3800500(x19)500x5700.所以y與x的函數(shù)解析式為y(xN)(2)由柱狀圖知,需更換的零件數(shù)不大于18的頻率為0.46,不大于19的頻率為0.7,故n的最小值為19. (3)若每臺機器在購機同時都購買19個易損零件,則這100臺機器中有70臺在購買易損零件上的費用為3800,20臺的費用為4300,10臺的費用為4800,因此這100臺機器在購買易損零件上所需費用的平均數(shù)為(380070430020480010)4000.若每臺機器在購機同時都購買20個易損零件,則這100臺機器中有90臺在購買易損零件上的費用為4000,10臺的費用為4500,因此這100臺機器在購買易損零件上所需費用的平均數(shù)為(400090450010)4050.比較兩個平均數(shù)可知,購買1臺機器的同時應購買19個易損零件模型歸納求解統(tǒng)計與概率綜合問題的模型示意圖如下: