《2019-2020年高考數(shù)學二輪復習 專題7 概率與統(tǒng)計 第2講 統(tǒng)計與統(tǒng)計案例 文.doc》由會員分享,可在線閱讀,更多相關《2019-2020年高考數(shù)學二輪復習 專題7 概率與統(tǒng)計 第2講 統(tǒng)計與統(tǒng)計案例 文.doc(10頁珍藏版)》請在裝配圖網(wǎng)上搜索。
2019-2020年高考數(shù)學二輪復習 專題7 概率與統(tǒng)計 第2講 統(tǒng)計與統(tǒng)計案例 文
抽樣方法
1.(xx新課標全國卷Ⅰ)為了解某地區(qū)的中小學生的視力情況,擬從該地區(qū)的中小學生中抽取部分學生進行調(diào)查,事先已了解到該地區(qū)小學、初中、高中三個學段學生的視力情況有較大差異,而男女生視力情況差異不大.在下面的抽樣方法中,最合理的抽樣方法是( C )
(A)簡單隨機抽樣 (B)按性別分層抽樣
(C)按學段分層抽樣 (D)系統(tǒng)抽樣
解析:由于三個學段學生的視力情況差異較大,故需按學段分層抽樣.故選C.
2.(xx青島模擬)高三(3)班共有學生56人,座號分別為1,2,3,…,56,現(xiàn)根據(jù)座號,用系統(tǒng)抽樣的方法,抽取一個容量為4的樣本.已知3號、17號、45號同學在樣本中,那么樣本中還有一個同學的座號是( B )
(A)30 (B)31 (C)32 (D)33
解析:k==14,則樣本中4名同學的座號依次構成以4為首項,14為公差的等差數(shù)列,故樣本中還有一個同學的座號是31.
3.某校對高三年級1600名男女學生的視力狀況進行調(diào)查,現(xiàn)用分層抽樣的方法抽取一個容量是200的樣本,已知樣本中女生比男生少10人,則該校高三年級的女生人數(shù)是 .
解析:抽樣比為200∶1600=1∶8,樣本中女生人數(shù)為=95,
所以該校高三年級的女生人數(shù)為958=760.
答案:760
4.假設要考查某公司生產(chǎn)的500克袋裝牛奶的三聚氰胺是否超標,現(xiàn)從800袋牛奶中抽取60袋進行檢驗,利用隨機數(shù)表抽取樣本時,先將800袋牛奶按000,001,
…,799進行編號,如果從隨機數(shù)表第7行第8列的數(shù)開始向右讀,則得到第4個樣本個體的編號是 .(下面摘取了隨機數(shù)表第7行至第9行)
84421753315724550688770474476721763350258392120676
63016378591695566719981050717512867358074439523879
33211234297864560782524207443815510013429966027954
解析:找到第7行第8列的數(shù)開始向右讀,
第一個符合條件的數(shù)是331,
第二個數(shù)是572,
第三個數(shù)是455,
第四個數(shù)是068.
答案:068
樣本估計總體
5.某校100名學生期中考試數(shù)學成績的頻率分布直方圖如圖所示,其中成績分組區(qū)間是[50,60),[60,70),[70,80),[80,90),[90,100],則圖中a的值為( B )
(A)0.006 (B)0.005
(C)0.0045 (D)0.0025
解析:由題意知,a=
=0.005.
6.如圖是xx年某大學自主招生面試環(huán)節(jié)中,七位評委為某考生打出的分數(shù)的莖葉統(tǒng)計圖,去掉一個最高分和一個最低分后,所剩數(shù)據(jù)的平均數(shù)和眾數(shù)依次為( A )
(A)85,84 (B)84,85 (C)86,84 (D)84,86
解析:由圖可知,去掉一個最高分和一個最低分后,所剩數(shù)據(jù)為84,84,84,86,87.
所以平均數(shù)為=85,眾數(shù)為84.
7.(xx江蘇卷)已知一組數(shù)據(jù)4,6,5,8,7,6,那么這組數(shù)據(jù)的平均數(shù)為 .
解析:由已知得,所求平均數(shù)為=6.
答案:6
回歸方程及其應用
8.某產(chǎn)品的廣告費用x與銷售額y的統(tǒng)計數(shù)據(jù)如表:根據(jù)如表可得回歸方程=x+中的=10.6,據(jù)此模型預報廣告費用為10萬元時銷售額為( D )
廣告費用x(萬元)
4
2
3
5
銷售額y(萬元)
49
26
39
58
(A)112.1萬元 (B)113.1萬元
(C)113.9萬元 (D)111.9萬元
解析:因為==3.5,==43,將(3.5,43)代入=10.6x+中得=5.9,
=10.6x+5.9,當x=10時,=111.9.
9.(xx新課標全國卷Ⅱ)某地區(qū)xx年至xx年農(nóng)村居民家庭人均純收入y(單位:千元)的數(shù)據(jù)如下表:
年份
xx
xx
xx
xx
xx
xx
xx
年份代號t
1
2
3
4
5
6
7
人均純收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)求y關于t的線性回歸方程;
(2)利用(1)中的回歸方程,分析xx年至xx年該地區(qū)農(nóng)村居民家庭人均純收入的變化情況,并預測該地區(qū)xx年農(nóng)村居民家庭人均純收入.
附:回歸直線的斜率和截距的最小二乘法估計公式分別為
=,=-
解:(1)由所給數(shù)據(jù)計算得
=(1+2+3+4+5+6+7)=4,
=(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-)2=9+4+1+0+1+4+9=28,
(ti-)(yi-)=(-3)(-1.4)+(-2)(-1)+(-1)(-0.7)+00.1+10.5+20.9+31.6=14,
===0.5,
=-=4.3-0.54=2.3,
所求回歸方程為=0.5t+2.3.
(2)由(1)知,=0.5>0.故xx年至xx年該地區(qū)農(nóng)村居民家庭人均純收入逐年增加,平均每年增加0.5千元.
將xx年的年份代號t=9代入(1)中的回歸方程,得
=0.59+2.3=6.8,故預測該地區(qū)xx年農(nóng)村居民家庭人均純收入為6.8千元.
一、選擇題
1.(xx四川卷)在“世界讀書日”前夕,為了了解某地5000名居民某天的閱讀時間,從中抽取了200名居民的閱讀時間進行統(tǒng)計分析.在這個問題中,5000名居民的閱讀時間的全體是( A )
(A)總體
(B)個體
(C)樣本的容量
(D)從總體中抽取的一個樣本
解析:5000名居民的閱讀時間的全體是總體,每名居民的閱讀時間是個體,200名居民的閱讀時間是樣本,故選A.
2.(xx陜西卷)某中學初中部共有110名教師,高中部共有150名教師,其性別比例如圖所示,則該校女教師的人數(shù)為( C )
(A)93 (B)123 (C)137 (D)167
解析:因為該校女教師的人數(shù)為11070%+150(1-60%)=77+60=137,所以選C.
3.某公司在甲、乙、丙、丁四個地區(qū)分別有150,120,180,150個銷售點.公司為了調(diào)查產(chǎn)品銷售情況,需從這600個銷售點中抽取一個容量為100的樣本,記這項調(diào)查為①;在丙地區(qū)有20個大型銷售點,要從中抽取7個調(diào)查其銷售收入和售后服務等情況,記這項調(diào)查為②,則完成①,②這兩項調(diào)查宜采用的抽樣方法依次是( B )
(A)分層抽樣法,系統(tǒng)抽樣法
(B)分層抽樣法,簡單隨機抽樣法
(C)系統(tǒng)抽樣法,分層抽樣法
(D)簡單隨機抽樣法,分層抽樣法
解析:①甲、乙、丙、丁四個地區(qū)會存在差異,采用分層抽樣法較好.②抽取的樣本個數(shù)較少,采用簡單隨機抽樣法.
4.xx年春節(jié)期間,“厲行節(jié)約,反對浪費”之風悄然吹開,某市通過隨機詢問100名性別不同的居民是否能做到“光盤”行動,得到列聯(lián)表:
做不到“光盤”
能做到“光盤”
男
45
10
女
30
15
則下面的正確結論是( A )
(A)有90%以上的把握認為“該市居民能否做到′光盤′與性別有關”
(B)在犯錯誤的概率不超過1%的前提下,認為“該市居民能否做到′光盤′與性別
無關”
(C)在犯錯誤的概率不超過1%的前提下,認為“該市居民能否做到′光盤′與性別
有關”
(D)有90%以上的把握認為“該市居民能否做到′光盤′與性別無關”
解析:由22列聯(lián)表得到a=45,b=10,c=30,d=15,則a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,計算得K2的觀測值k=≈3.030.因為2.706<3.030<3.841,所以有90%以上的把握認為“該市居民能否做到′光盤′與性別有關”,故選A.
5.(xx遼寧模擬)對于一組數(shù)據(jù)xi(i=1,2,3,…,n),如果將它們改變?yōu)閤i+C(i=1,2,3,…,n),其中C≠0,則下列結論正確的是( B )
(A)平均數(shù)與方差均不變 (B)平均數(shù)變,方差保持不變
(C)平均數(shù)不變,方差變 (D)平均數(shù)與方差均發(fā)生變化
解析:由平均數(shù)的定義可知每個個體增加C,則平均數(shù)也增加C,方差不變,故選B.
6.如圖是Ⅰ,Ⅱ兩組各7名同學體重(單位:kg)數(shù)據(jù)的莖葉圖.設Ⅰ,Ⅱ兩組數(shù)據(jù)的平均數(shù)依次為和,標準差依次為s1和s2,那么( D )
(A)>,s1>s2 (B)>,s1
s2 (D)<,s10,b>0 (B)a>0,b<0
(C)a<0,b>0 (D)a<0,b<0
解析:由表中數(shù)據(jù)畫出散點圖,如圖,
由散點圖可知b<0,a>0,選B.
8.甲、乙兩人在一次射擊比賽中各射靶5次,兩人成績的條形統(tǒng)計圖如圖所示,則( C )
(A)甲的成績的平均數(shù)小于乙的成績的平均數(shù)
(B)甲的成績的中位數(shù)等于乙的成績的中位數(shù)
(C)甲的成績的方差小于乙的成績的方差
(D)甲的成績的極差小于乙的成績的極差
解析:甲的平均數(shù)是=6,中位數(shù)是6,極差是4,方差是=2;乙的平均數(shù)是=6,中位數(shù)是5,極差是4,方差是=,故選C.
9.某學校從高二甲、乙兩個班中各選6名同學參加數(shù)學競賽,他們?nèi)〉玫某煽?滿分100分)的莖葉圖如圖,其中甲班學生成績的眾數(shù)是85,乙班學生成績的平均分為81,則x+y的值為( D )
(A)6 (B)7 (C)8 (D)9
解析:由眾數(shù)的定義知x=5,由乙班的平均分為81得=81,解得y=4,故x+y=9.
10.某教研機構隨機抽取某校20個班級,調(diào)查各班關注漢字聽寫大賽的學生人數(shù),根據(jù)所得數(shù)據(jù)的莖葉圖,以組距為5將數(shù)據(jù)分組成[0,5),[5,10),[10,15),[15,20),
[20,25),[25,30),[30,35),[35,40]時,所作的頻率分布直方圖如圖所示,則原始莖葉圖可能是( A )
解析:由頻率分布直方圖可知:[0,5)的頻數(shù)為200.015=1個,[5,10)的頻數(shù)為200.015=1個,[10,15)的頻數(shù)為200.045=4個,[15,20)的頻數(shù)為200.025=2個,[20,25)的頻數(shù)為200.045=4個,[25,30)的頻數(shù)為200.035=3個,[30,35)的頻數(shù)為200.035=3個,[35,40]的頻數(shù)為200.025=2個,則對應的莖葉圖可能為A,故選A.
11.(xx河南模擬)在檢驗某產(chǎn)品直徑尺寸的過程中,將某尺寸分成若干組,[a,b)是其中的一組,抽查出的個體數(shù)在該組上的頻率為m,該組在頻率分布直方圖上的高為h,則|a-b|等于( A )
(A) (B)
(C)mh (D)與h,m無關
解析:根據(jù)頻率分布直方圖的概念可知|a-b|h=m,由此可知|a-b|=.
12.(xx福建卷)為了解某社區(qū)居民的家庭年收入與年支出的關系,隨機調(diào)查了該社區(qū)5戶家庭,得到如下統(tǒng)計數(shù)據(jù)表:
收入x(萬元)
8.2
8.6
10.0
11.3
11.9
支出y(萬元)
6.2
7.5
8.0
8.5
9.8
根據(jù)上表可得回歸直線方程=x+,其中=0.76,=-.據(jù)此估計,該社區(qū)一戶年收入為15萬元家庭的年支出為( B )
(A)11.4萬元 (B)11.8萬元
(C)12.0萬元 (D)12.2萬元
解析:由統(tǒng)計數(shù)據(jù)表可得
==10.0,
==8.0,
則=8.0-0.7610.0=0.4,所以回歸直線方程為=0.76x+0.4,當x=15時,=0.7615+0.4=11.8,故估計年收入為15萬元家庭的年支出為11.8萬元.
故選B.
二、填空題
13.某學校共有師生3200人,現(xiàn)用分層抽樣的方法,從所有師生中抽取一個容量為160的樣本,已知從學生中抽取的人數(shù)為150,那么該學校的教師人數(shù)是 .
解析:設該學校的教師人數(shù)為x,
由分層抽樣的特點知=,
所以x=200.
答案:200
14.為了解某班學生喜愛打籃球是否與性別有關,對該班50名學生進行了問卷調(diào)查,得到了如下的22列聯(lián)表:
喜愛打籃球
不喜愛打籃球
總計
男生
20
5
25
女生
10
15
25
總計
30
20
50
則在犯錯誤的概率不超過 的前提下認為喜愛打籃球與性別有關(請用百分數(shù)表示).
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
解析:由公式K2=可計算K2的觀測值k=≈8.333>7.879.因此在犯錯誤的概率不超過0.5%的前提下認為喜愛打籃球與性別有關.
答案:0.5%
15.(xx大同三模)為了解某校教師使用多媒體進行教學的情況,現(xiàn)采用簡單隨機抽樣的方法,從該校200名授課教師中抽取20名教師,調(diào)查了他們上學期使用多媒體進行教學的次數(shù),結果用莖葉圖表示如圖所示.據(jù)此可估計該校200名教師中,上學期使用多媒體進行教學次數(shù)在[15,25)內(nèi)的人數(shù)約為 .
解析:由莖葉圖可得在[15,25)內(nèi)的人數(shù)分布的頻率為=,于是可估計該校200名教師中,上學期使用多媒體進行教學次數(shù)在[15,25)內(nèi)的人數(shù)約為200=60.
答案:60
16.(xx湖南卷)在一次馬拉松比賽中,35名運動員的成績(單位:分鐘)的莖葉圖如圖所示.
若將運動員按成績由好到差編為1~35號,再用系統(tǒng)抽樣方法從中抽取7人,則其中成績在區(qū)間[139,151]上的運動員人數(shù)是 .
解析:由系統(tǒng)抽樣方法知,應把35人分成7組,每組5人,每組按規(guī)則抽取1人,
因為成績在區(qū)間[139,151]上的共有4組,
故成績在區(qū)間[139,151]上的運動員人數(shù)是4.
答案:4
統(tǒng)計、統(tǒng)計案例與概率的綜合問題
訓練提示:(1)統(tǒng)計與古典概型的綜合問題;(2)回歸分析與概率的綜合問題;(3)獨立性檢驗與古典概型的綜合問題.
1.(xx錦州質(zhì)檢)如圖所示的莖葉圖記錄了甲、乙兩組各四名同學的投籃命中次數(shù),乙組記錄中有一個數(shù)據(jù)模糊,無法確認,在圖中以x表示.
(1)如果乙組同學投籃命中次數(shù)的平均數(shù)為,求x及乙組同學投籃命中次數(shù)的
方差;
(2)在(1)的條件下,分別從甲、乙兩組投籃命中次數(shù)低于10次的同學中,各隨機選取一名,求這兩名同學的投籃命中次數(shù)之和為17的概率.
解:(1)依題意得==,解得x=8,
方差s2=[2(8-)2+(9-)2+(10-)2]
=.
(2)記甲組投籃命中次數(shù)低于10次的同學為A1,A2,他們的命中次數(shù)分別為9,7.乙組投籃命中次數(shù)低于10次的同學為B1,B2,B3,他們的命中次數(shù)分別為8,8,9.
依題意,不同的選取方法有(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3)共6種.
設“這兩名同學的投籃命中次數(shù)之和為17”為事件C,則C中恰含有(A1,B1),(A1,B2)共2種,
所以P(C)==.
2.(xx遵義市高三聯(lián)考)從某學校的1600名男生中隨機抽取50名測量身高,被測學生身高全部介于155 cm和195 cm之間,將測量結果按如下方式分成八組:第一組[155,160),第二組[160,165),…,第八組[190,195],如圖是按上述分組方法得到的頻率分布直方圖的一部分,第六組的人數(shù)為4人.
(1)求第七組的頻率;
(2)估計該校1600名男生中身高在180 cm以上(含180 cm)的人數(shù);
(3)若從身高屬于第六組和第八組的所有男生中隨機抽取兩名男生,設他們的身高分別為x,y,記事件E={(x,y)||x-y|≤5},求事件E的概率.
解:(1)第六組的頻率為=0.08.
所以第七組的頻率為
1-0.08-5(0.0082+0.016+0.042+0.06)=0.06;
(2)由直方圖得后三組頻率為0.06+0.08+0.0085=0.18,所以估計該校1600名男生中身高在180 cm以上(含180 cm)的人數(shù)為0.181600=288人.
(3)第六組[180,185)的人數(shù)為4人,設為a,b,c,d,第八組[190,195]的人數(shù)為2人,設為A,B,則有ab,ac,ad,bc,bd,cd,aA,bA,cA,dA,aB,bB,cB,dB,AB,共15種情況.
因事件E={(x,y)||x-y|≤5}發(fā)生當且僅當隨機抽取的兩名男生在同一組,所以事件E包含的基本事件為ab,ac,ad,bc,bd,cd,AB共7種情況,故P(E)=.
3.(xx黑龍江高三模擬)某興趣小組欲研究晝夜溫差大小與患感冒人數(shù)多少之間的關系,他們分別到氣象局與某醫(yī)院抄錄了1至6月份每月10號的晝夜溫差情況與因患感冒而就診的人數(shù),得到如下資料:
日期
1月
10日
2月
10日
3月
10日
4月
10日
5月
10日
6月
10日
晝夜溫差x(℃)
10
11
13
12
8
6
就診人數(shù)y(個)
22
25
29
26
16
12
該興趣小組確定的研究方案是:先從這六組數(shù)據(jù)中選取2組,用剩下的4組數(shù)據(jù)求線性回歸方程,再用被選取的2組數(shù)據(jù)進行檢驗.
(1)求選取的2組數(shù)據(jù)恰好是相鄰兩個月的概率;
(2)若選取的是1月與6月的兩組數(shù)據(jù),請根據(jù)2至5月份的數(shù)據(jù),求出y關于x的線性回歸方程=x+;
(3)若由線性回歸方程得到的估計數(shù)據(jù)與所選出的檢驗數(shù)據(jù)的誤差均不超過2人,則認為得到的線性回歸方程是理想的,試問(2)中所得線性回歸方程是否理想?
解:(1)設抽到相鄰兩個月的數(shù)據(jù)為事件A,因為從6組數(shù)據(jù)中選取2組數(shù)據(jù)共有15種情況,每種情況都是等可能出現(xiàn)的,其中,抽到相鄰兩個月的數(shù)據(jù)的情況有5種,
所以P(A)==.
(2)由數(shù)據(jù)求得=11,=24,
由公式求得=,
再由=-=-,
所以y關于x的線性回歸方程為=x-.
(3)當x=10時,=,︱-22︱<2;
同樣,當x=6時,=, ︱-12︱<2,
所以,該小組所得線性回歸方程是理想的.
【教師備用】 在某醫(yī)學實驗中,某實驗小組為了分析某藥物用藥量與血液中某種抗體水平的關系,選取六只實驗動物進行血檢,得到如下資料:
動物編號
1
2
3
4
5
6
用藥量x(單位)
1
3
4
5
6
8
抗體指標y(單位)
3.4
3.7
3.8
4.0
4.2
4.3
記s為抗體指標標準差,若抗體指標落在(-s,+s)內(nèi),則稱該動物為有效動物,否則稱為無效動物.研究方案規(guī)定先從六只動物中選取兩只,用剩下的四只動物的數(shù)據(jù)求線性回歸方程,再對被選取的兩只動物數(shù)據(jù)進行檢驗.
(1)求選取的兩只動物都是有效動物的概率;
(2)若選取的是編號為1和6的兩只動物,且利用剩余四只動物的數(shù)據(jù)求出y關于x的線性回歸方程為=0.17x+a,試求出a的值;
(3)若根據(jù)回歸方程估計出的1號和6號動物抗體指標數(shù)據(jù)與檢驗結果誤差都不超過抗體指標標準差,則認為得到的線性回歸方程是可靠的.試判斷(2)中所得線性回歸方程是否可靠.
解:(1)=3.9,s≈0.31.故1,6號為無效動物,2,3,4,5號為有效動物.
記從六只動物中選取兩只動物都是有效動物為事件A.
所有可能結果為(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),
(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)共15種.
事件A包含的結果有(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)共6種.
故P(A)==.
(2)對于2,3,4,5號動物,=4.5,=3.925,
代入=0.17x+得=3.16.
(3)由=0.17x+3.16得=3.33,=4.52.
誤差e1=0.07,e6=0.22,均比標準差s≈0.31小,
故(2)中所得線性回歸方程可靠.
4.(xx赤峰市高三模擬)某高校共有15000人,其中男生10500人,女生4500人,為調(diào)查該校學生每周平均體育運動時間的情況,采用分層抽樣的方法,收集300位學生每周平均體育運動時間的樣本數(shù)據(jù)(單位:小時).
(1)應收集多少位女生樣本數(shù)據(jù)?
(2)根據(jù)這300個樣本數(shù)據(jù),得到學生每周平均體育運動時間的頻率分布直方圖(如圖所示),其中樣本數(shù)據(jù)分組區(qū)間為[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估計該校學生每周平均體育運動時間超過4個小時的概率.
(3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運動時間超過4個小時.請完成每周平均體育運動時間與性別的列聯(lián)表,并判斷是否有95%的把握認為“該校學生的每周平均體育運動時間與性別有關”.
P(K2≥k0)
0.10
0.05
0.010
0.005
k0
2.706
3.841
6.635
7.879
附:K2=
解:(1)300=90,所以應收集90位女生的樣本數(shù)據(jù).
(2)由頻率分布直方圖得每周平均體育運動時間超過4小時的頻率為1-2(0.100+0.025)=0.75,
所以該校學生每周平均體育運動時間超過4小時的概率的估計值為0.75.
(3)由(2)知,300位學生中有3000.75=225(人)的每周平均體育運動時間超過4小時,75人的每周平均體育運動時間不超過4小時.又因為樣本數(shù)據(jù)中有210份是關于男生的,90份是關于女生的,所以每周平均體育運動時間與性別的列聯(lián)表如表:
男生
女生
總計
每周平均體育運動時間不超過4小時
45
30
75
每周平均體育運動時間超過4小時
165
60
225
總計
210
90
300
結合列聯(lián)表可算得K2的觀測值
k=≈4.762>3.841.
所以有95%的把握認為“該校學生的每周平均體育運動時間與性別有關”.
鏈接地址:http://m.italysoccerbets.com/p-2723548.html