《高一數(shù)學(xué)《用樣本的數(shù)字特征估計總體的數(shù)字特征》.ppt》由會員分享,可在線閱讀,更多相關(guān)《高一數(shù)學(xué)《用樣本的數(shù)字特征估計總體的數(shù)字特征》.ppt(37頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、2.2 用樣本估計總體,.2.2用樣本的數(shù)字特征估計總體的 數(shù)字特征,問題提出,1.對一個未知總體,我們常用樣本的頻率分布估計總體的分布,其中表示樣本數(shù)據(jù)的頻率分布的基本方法有哪些?,2.美國NBA在20062007年度賽季中,甲、乙兩名籃球運動員在隨機抽取的12場比賽中的得分情況如下: 甲運動員得分:12,15,20,25,31,31, 36,36,37,39,44,49. 乙運動員得分:8,13,14,16,23,26, 28,38,39,51,31,29.,如果要求我們根據(jù)上面的數(shù)據(jù),估計、比較甲,乙兩名運動員哪一位發(fā)揮得比較穩(wěn)定,就得有相應(yīng)的數(shù)據(jù)作為比較依據(jù),即通過樣本數(shù)據(jù)對
2、總體的數(shù)字特征進(jìn)行研究,用樣本的數(shù)字特征估計總體的數(shù)字特征.,甲運動員得分:12,15,20,25,31,31, 36,36,37,39,44,49. 乙運動員得分:8,13,14,16,23,26, 28,38,39,51,31,29.,用樣本數(shù)字特征,估計總體數(shù)字特征,知識探究(一):眾數(shù)、中位數(shù)和平均數(shù),思考1:在初中我們學(xué)過眾數(shù)、中位數(shù)和平均數(shù)的概念,這些數(shù)據(jù)都是反映樣本信息的數(shù)字特征,對一組樣本數(shù)據(jù)如何求眾數(shù)、中位數(shù)和平均數(shù)?,思考2:在城市居民月均用水量樣本數(shù)據(jù)的頻率分布直方圖中,你認(rèn)為眾數(shù)應(yīng)在哪個小矩形內(nèi)?由此估計總體的眾數(shù)是什么?,,思考3:在頻率分布直方圖中,每個小
3、矩形的面積表示什么?中位數(shù)左右兩側(cè)的直方圖的面積應(yīng)有什么關(guān)系?,思考4:在城市居民月均用水量樣本數(shù)據(jù)的頻率分布直方圖中,從左至右各個小矩形的面積分別是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估計總體的中位數(shù)是什么?,,0.5-0.04-0.08-0.15-0.22=0.01,0.010.5=0.02,中位數(shù)是2+0.02=2.02.,思考5:平均數(shù)是頻率分布直方圖的“重心”,在城市居民月均用水量樣本數(shù)據(jù)的頻率分布直方圖中,各個小矩形的重心在哪里?從直方圖估計總體在各組數(shù)據(jù)內(nèi)的平均數(shù)分別為多少?,0.25,0.75,1.25,1.75,2.2
4、5, 2.75,3.25,3.75,4.25.,思考6:根據(jù)統(tǒng)計學(xué)中數(shù)學(xué)期望原理,將頻率分布直方圖中每個小矩形的面積與小矩形底邊中點的橫坐標(biāo)之積相加,就是樣本數(shù)據(jù)的估值平均數(shù). 由此估計總體的平均數(shù)是什么?,0.250.04+0.750.08+1.250.15+1.750.22+2.250.25+2.750.14+3.25 0.06+3.750.04+4.250.02=2.02(t). 平均數(shù)是2.02.,平均數(shù)與中位數(shù)相等,是必然還是巧合?,思考7:從居民月均用水量樣本數(shù)據(jù)可知,該樣本的眾數(shù)是2.3,中位數(shù)是2.0,平均數(shù)是1.973,這與我們從樣本頻率分布直方圖得出的結(jié)論有偏差,你能解釋
5、一下原因嗎?,頻率分布直方圖損失了一些樣本數(shù)據(jù),得到的是一個估計值,且所得估值與數(shù)據(jù)分組有關(guān).,注:在只有樣本頻率分布直方圖的情況下,我們可以按上述方法估計眾數(shù)、中位數(shù)和平均數(shù),并由此估計總體特征.,思考8:一組數(shù)據(jù)的中位數(shù)一般不受少數(shù)幾個極端值的影響,這在某些情況下是一個優(yōu)點,但它對極端值的不敏感有時也會額成為缺點,你能舉例說明嗎?樣本數(shù)據(jù)的平均數(shù)大于(或小于)中位數(shù)說明什么問題?你怎樣理解“我們單位的收入水平比別的單位高”這句話的含義?,,如:樣本數(shù)據(jù)收集有個別差錯不影響中位數(shù);大學(xué)畢業(yè)生憑工資中位數(shù)找單位可能收入較低. 平均數(shù)大于(或小于)中位數(shù),說明樣本數(shù)據(jù)中存在許多較大(或較小)的
6、極端值. 這句話具有模糊性甚至蒙騙性,其中收入水平是員工工資的某個中心點,它可以是眾數(shù)、中位數(shù)或平均數(shù).,知識探究(二):標(biāo)準(zhǔn)差,樣本的眾數(shù)、中位數(shù)和平均數(shù)常用來表示樣本數(shù)據(jù)的“中心值”,其中眾數(shù)和中位數(shù)容易計算,不受少數(shù)幾個極端值的影響,但只能表達(dá)樣本數(shù)據(jù)中的少量信息. 平均數(shù)代表了數(shù)據(jù)更多的信息,但受樣本中每個數(shù)據(jù)的影響,越極端的數(shù)據(jù)對平均數(shù)的影響也越大.當(dāng)樣本數(shù)據(jù)質(zhì)量比較差時,使用眾數(shù)、中位數(shù)或平均數(shù)描述數(shù)據(jù)的中心位置,可能與實際情況產(chǎn)生較大的誤差,難以反映樣本數(shù)據(jù)的實際狀況,因此,我們需要一個統(tǒng)計數(shù)字刻畫樣本數(shù)據(jù)的離散程度.,思考1:在一次射擊選拔賽中,甲、乙兩名運動員各射擊10次,
7、每次命中的環(huán)數(shù)如下: 甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7 甲、乙兩人本次射擊的平均成績分別為多少環(huán)?,,,思考2:甲、乙兩人射擊的平均成績相等,觀察兩人成績的頻率分布條形圖,你能說明其水平差異在那里嗎?,環(huán)數(shù),甲的成績比較分散,極差較大,乙的成績相對集中,比較穩(wěn)定.,環(huán)數(shù),思考3:對于樣本數(shù)據(jù)x1,x2,,xn,設(shè)想通過各數(shù)據(jù)到其平均數(shù)的平均距離來反映樣本數(shù)據(jù)的分散程度,那么這個平均距離如何計算?,,思考4:反映樣本數(shù)據(jù)的分散程度的大小,最常用的統(tǒng)計量是標(biāo)準(zhǔn)差,一般用s表示.假設(shè)樣本數(shù)據(jù)x1,x2,,xn的平均數(shù)為,則標(biāo)準(zhǔn)差的計算公式是:,
8、,那么標(biāo)準(zhǔn)差的取值范圍是什么?標(biāo)準(zhǔn)差為0的樣本數(shù)據(jù)有何特點?,s0,標(biāo)準(zhǔn)差為0的樣本數(shù)據(jù)都相等.,標(biāo)準(zhǔn)差越大離散程度越大,數(shù)據(jù)較分散;標(biāo)準(zhǔn)差越小離散程度越小,數(shù)據(jù)較集中在平均數(shù)周圍.,知識遷移,s甲=2,s乙=1.095.,2.2 用樣本估計總體,.2.2用樣本的數(shù)字特征估計總體的 數(shù)字特征2,知識回顧,1.如何根據(jù)樣本頻率分布直方圖,分別估計總體的眾數(shù)、中位數(shù)和平均數(shù)?,(1)眾數(shù):最高矩形下端中點的橫坐標(biāo).,(2)中位數(shù):直方圖面積平分線與橫軸交點的橫坐標(biāo).,(3)平均數(shù):每個小矩形的面積與小矩形底邊中點的橫坐標(biāo)的乘積之和.,2.對于樣本數(shù)據(jù)x1,x2,,xn,其標(biāo)準(zhǔn)差如何計算?,樣本數(shù)字
9、特征例題分析,知識補充,1.標(biāo)準(zhǔn)差的平方s2稱為方差,有時用方差代替標(biāo)準(zhǔn)差測量樣本數(shù)據(jù)的離散度.方差與標(biāo)準(zhǔn)差的測量效果是一致的,在實際應(yīng)用中一般多采用標(biāo)準(zhǔn)差.,2.現(xiàn)實中的總體所包含的個體數(shù)往往很多,總體的平均數(shù)與標(biāo)準(zhǔn)差是未知的,我們通常用樣本的平均數(shù)和標(biāo)準(zhǔn)差去估計總體的平均數(shù)與標(biāo)準(zhǔn)差,但要求樣本有較好的代表性.,,,3.對于城市居民月均用水量樣本數(shù)據(jù),其平均數(shù) ,標(biāo)準(zhǔn)差s=0.868. 在這100個數(shù)據(jù)中, 落在區(qū)間( -s, +s)=1.105,2.841外的有28個; 落在區(qū)間( -2s, +2s)=0.237,3.709外的只有4個; 落在區(qū)間( -3s, +3s)=-0.631,
10、4.577外的有0個.,,,一般地,對于一個正態(tài)總體,數(shù)據(jù)落在區(qū)間( -s, +s)、 ( -2s, +2s)、( -3s, +3s)內(nèi)的百分比分別為68.3%、95.4%、99.7%,這個原理在產(chǎn)品質(zhì)量控制中有著廣泛的應(yīng)用(參考教材P79“閱讀與思考”).,例題分析,例1 畫出下列四組樣本數(shù)據(jù)的條形圖, 說明他們的異同點. (1) ,,,,,,,,; (2) ,,,,,,,,;,,,,,,,(3) ,,,,,,,,; (4) ,,,,,,,,.,,,,,,,,,,例2 甲、乙兩人同時生產(chǎn)內(nèi)徑為25.40mm的一種零件,為了對兩人的生產(chǎn)質(zhì)量進(jìn)行評比,從他們生產(chǎn)的零件中各隨機抽取20件,量得
11、其內(nèi)徑尺寸如下(單位:mm):,甲 : 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39,乙: 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48,從生產(chǎn)零件內(nèi)徑的尺寸看,誰生產(chǎn)的零件質(zhì)量較高?,,,,,甲生產(chǎn)的零件內(nèi)徑更
12、接近內(nèi)徑標(biāo)準(zhǔn),且穩(wěn)定程度較高,故甲生產(chǎn)的零件質(zhì)量較高.,說明:1.生產(chǎn)質(zhì)量可以從總體的平均數(shù)與標(biāo)準(zhǔn)差兩個角度來衡量,但甲、乙兩個總體的平均數(shù)與標(biāo)準(zhǔn)差都是不知道的,我們就用樣本的平均數(shù)與標(biāo)準(zhǔn)差估計總體的平均數(shù)與標(biāo)準(zhǔn)差. 2.問題中25.40mm是內(nèi)徑的標(biāo)準(zhǔn)值,而不是總體的平均數(shù).,例3 以往招生統(tǒng)計顯示,某所大學(xué)錄取的新生高考總分的中位數(shù)基本穩(wěn)定在550分,若某同學(xué)今年高考得了520分,他想報考這所大學(xué)還需收集哪些信息?,要點:(1)查往年錄取的新生的平均分?jǐn)?shù).若平均數(shù)小于中位數(shù)很多,說明最低錄取線較低,可以報考; (2)查往年錄取的新生高考總分的標(biāo)準(zhǔn)差.若標(biāo)準(zhǔn)差較大,說明新生的錄取分?jǐn)?shù)較分散
13、,最低錄取線可能較低,可以考慮報考.,例4 在去年的足球甲A聯(lián)賽中,甲隊每場比賽平均失球數(shù)是1.5,全年比賽失球個數(shù)的標(biāo)準(zhǔn)差為1.1;乙隊每場比賽平均失球數(shù)是2.1,全年比賽失球個數(shù)的標(biāo)準(zhǔn)差為0.4.你認(rèn)為下列說法是否正確,為什么? (1)平均來說甲隊比乙隊防守技術(shù)好; (2)乙隊比甲隊技術(shù)水平更穩(wěn)定; (3)甲隊有時表現(xiàn)很差,有時表現(xiàn)又非常 好; (4)乙隊很少不失球.,例5 有20種不同的零食,它們的熱量含量如下: 110 120 123 165 432 190 174 235 428 318 249 280 162 146 210 120 123 120 150 140,(1)以上
14、20個數(shù)據(jù)組成總體,求總體平均數(shù)與總體標(biāo)準(zhǔn)差; (2)設(shè)計一個適當(dāng)?shù)碾S機抽樣方法,從總體中抽取一個容量為7的樣本,計算樣本的平均數(shù)和標(biāo)準(zhǔn)差.,(1)總體平均數(shù)為199.75,總體標(biāo)準(zhǔn)差為95.26.,(1)以上20個數(shù)據(jù)組成總體,求總體平均數(shù)與總體標(biāo)準(zhǔn)差; (2)設(shè)計一個適當(dāng)?shù)碾S機抽樣方法,從總體中抽取一個容量為7的樣本,計算樣本的平均數(shù)和標(biāo)準(zhǔn)差.,(2)可以用抽簽法抽取樣本,樣本的平均數(shù)和標(biāo)準(zhǔn)差與抽取的樣本有關(guān).,小結(jié)作業(yè),1.對同一個總體,可以抽取不同的樣本,相應(yīng)的平均數(shù)與標(biāo)準(zhǔn)差都會發(fā)生改變.如果樣本的代表性差,則對總體所作的估計就會產(chǎn)生偏差;如果樣本沒有代表性,則對總體作出錯誤估計的可能性就非常大,由此可見抽樣方法的重要性.,2.在抽樣過程中,抽取的樣本是具有隨機性的,如從一個包含6個個體的總體中抽取一個容量為3的樣本就有20中可能抽樣,因此樣本的數(shù)字特征也有隨機性. 用樣本的數(shù)字特征估計總體的數(shù)字特征,是一種統(tǒng)計思想,沒有惟一答案.,3.在實際應(yīng)用中,調(diào)查統(tǒng)計是一個探究性學(xué)習(xí)過程,需要做一系列工作,我們可以把學(xué)到的知識應(yīng)用到自主研究性課題中去.,作業(yè): 學(xué)法大視野第8課時,