《用樣本的數(shù)字特征估計總體的數(shù)字特征 課件.ppt》由會員分享,可在線閱讀,更多相關(guān)《用樣本的數(shù)字特征估計總體的數(shù)字特征 課件.ppt(26頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、2.2.2 用樣本的數(shù)字特征估計總體的數(shù)字特征 一 、復(fù)習(xí)眾數(shù)、中位數(shù)、平均數(shù)的概念 2、中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個數(shù)據(jù)(或最中間兩個數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù) 1、眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù) 眾數(shù)、中位數(shù)、平均數(shù)都是描述一組數(shù)據(jù)的集中趨勢的特征數(shù),只是描述的角度不同,其中以平均數(shù)的應(yīng)用最為廣泛. 3、平均數(shù): 一般地,如果n個數(shù) ,那么, 叫做這n個數(shù)的平均數(shù)。 1 2, ,., nx x x1 21 ( . )nx x x xn 1、求下列各組數(shù)據(jù)的眾數(shù)(1)、1 ,2,3,3,3,5,5,8,8,8,9,9眾數(shù)是:3和8
2、(2)、1 ,2,3,3,3,5,5,8,8,9,9眾數(shù)是:32、求下列各組數(shù)據(jù)的中位數(shù)(1)、1 ,2,3,3,3,4,6,8,8,8,9,9(2)1 ,2,3,3,3,4,8,8,8,9,9中位數(shù)是:5中位數(shù)是:4 3、在一次中學(xué)生田徑運動會上,參加男子跳高的17名運動員的成績?nèi)缦卤硭荆撼煽?米) 150 160 165 170 175 180 185 190人數(shù)2 3 2 3 4 1 1 1分別求這些運動員成績的眾數(shù),中位數(shù)與平均數(shù) 。解:在17個數(shù)據(jù)中,1.75出現(xiàn)了4次,出現(xiàn)的次數(shù)最多,即這組數(shù)據(jù)的眾數(shù)是1.75上面表里的17個數(shù)據(jù)可看成是按從小到大的順序排列的,其中第9個數(shù)據(jù)1.
3、70是最中間的一個數(shù)據(jù),即這組數(shù)據(jù)的中位數(shù)是1.70;答:17名運動員成績的眾數(shù)、中位數(shù)、平均數(shù)依次是1.75(米)、1.70(米)、1.69(米)。 這組數(shù)據(jù)的平均數(shù)是 1 (1.50 2 1.60 3 . 1.90 1) 1.6917x 米 二 、怎么由頻率分布直方圖求眾數(shù),中位數(shù)和平均數(shù)? 例如,在上一節(jié)抽樣調(diào)查的100位居民的月均用水量的數(shù)據(jù)中,我們得知這一組樣本數(shù)據(jù)的 ,并畫出過這組數(shù)據(jù)的頻率分布直方圖.眾數(shù) =2.3(t)中位數(shù)=2.0(t)平均數(shù)=2.0(t)現(xiàn)在,觀察這組數(shù)據(jù)的頻率分布直方圖,能否得出這組數(shù)據(jù)的眾數(shù)、中位數(shù)和平均數(shù)?眾數(shù)、中位數(shù)和平均數(shù) 0.5 2.521.51
4、 43.53 4.5 頻率組距 歸納總結(jié)得: 因為在頻率分布直方圖中,各小長方形的面積表示相應(yīng)各組的頻率,也顯示出樣本數(shù)據(jù)落在各小組的比例的大小,所以從圖中可以看到,在區(qū)間2,2.5)的小長方形的面積最大,即這組的頻率是最大的,也就是說月均用水量在區(qū)間2,2.5)內(nèi)的居民最多,即眾數(shù)就是在區(qū)間2,2.5)內(nèi)。 眾數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,就是最高矩形的中點的橫坐標(biāo)。 0.5 2.521.51 43.53 4.5 頻率組距 2.25 0.5 2.521.51 43.53 4.5 頻率組距 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 提示:中位數(shù)
5、左邊的數(shù)據(jù)個數(shù)與右邊的數(shù)據(jù)個數(shù)是相等的。 0.5 2.521.51 43.53 4.5 頻率組距 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 前四個小矩形的面積和=0.49后四個小矩形的面積和=0.26 2.02 歸納總結(jié)得: 在樣本中,有50的個體小于或等于中位數(shù),也有50的個體大于或等于中位數(shù),因此,在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等,由此可以估計中位數(shù)的值。在這個頻率分布直方圖中,左邊的直方圖的面積代表50個單位,右邊的直方圖也是代表50個單位,它們的分界線與x軸交點的橫坐標(biāo)就是中位數(shù)。 中位數(shù)在樣本數(shù)據(jù)的頻率分布直方
6、圖中,就是把頻率分布直方圖劃分左右兩個面積相等的分界線與x軸交點的橫坐標(biāo)。 思考討論以下問題:1、2.02這個中位數(shù)的估計值,與樣本的中位數(shù)值2.0不一樣,你能解釋其中原因嗎?答:2.02這個中位數(shù)的估計值,與樣本的中位數(shù)值2.0不一樣,這是因為樣本數(shù)據(jù)的頻率分布直方圖,只是直觀地表明分布的形狀,但是從直方圖本身得不出原始的數(shù)據(jù)內(nèi)容,直方圖已經(jīng)損失一些樣本信息。所以由頻率分布直方圖得到的中位數(shù)估計值往往與樣本的實際中位數(shù)值不一致. 0.5 2.521.51 43.53 4.5 頻率組距 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 提示:在頻率分布直
7、方圖中,各個組的平均數(shù)如何找? 0.5 2.521.51 43.53 4.5 頻率組距 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02. . . . .0.75 1.75 2.25 2.75 3.25 3.75 4.251.250.5 提示:與小長方形面積的比例有關(guān)嗎? 0.5 2.521.51 43.53 4.5 頻率組距 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.022.02. . . . .0.75 1.75 2.25 2.75 3.25 3.75 4.251.250.5 總結(jié)歸納得: 平均數(shù)是頻率分布直
8、方圖的“重心”,是直方圖的平衡點。 先找出每個小長方形的“重心”,即每小組的平均數(shù),再按比例算出直方圖的平均數(shù)。 平均數(shù)在樣本數(shù)據(jù)的頻率分布直方圖中,等于頻率分布圖中每個小長方形面積乘以小矩形底邊中點的橫坐標(biāo)之和。 總結(jié):眾數(shù):最高矩形的中點的橫坐標(biāo)中位數(shù):在頻率分布直方圖中,中位數(shù)的左右兩邊的直方圖的面積相等,都為0.5平均數(shù):每個小矩形的面積乘以中點的橫坐標(biāo)之和 三 、三種數(shù)字特征的優(yōu)缺點 1、眾數(shù)體現(xiàn)了樣本數(shù)據(jù)的最大集中點,但它對其它數(shù)據(jù)信息的忽視使得無法客觀地反映總體特征。 2、中位數(shù)是樣本數(shù)據(jù)所占頻率的等分線,它不受少數(shù)幾個極端值的影響,這在某些情況下是優(yōu)點,但它對極端值的不敏感有時
9、也會成為缺點。 3、平均數(shù)與每一個樣本的數(shù)據(jù)有關(guān),與眾數(shù)、中位數(shù)比較起來,平均數(shù)可以反映出更多的關(guān)于樣本數(shù)據(jù)全體的信息,但平均數(shù)受數(shù)據(jù)中的極端值的影響較大,而且越極端,對平均數(shù)的影響就越大。當(dāng)樣本數(shù)據(jù)質(zhì)量較差時,用平均數(shù)來估計,可靠性不高,可能會與實際情況產(chǎn)生較大的誤差。 四、思考討論以下問題:1、樣本中位數(shù)不受少數(shù)極端值的影響,這在某些情況下是一個優(yōu)點,但它對極端值的不敏感有時也會成為缺點。你能舉例說明嗎?答:優(yōu)點:對極端數(shù)據(jù)不敏感的方法能夠有效地預(yù)防錯誤數(shù)據(jù)的影響。對極端值不敏感有利的例子:例如當(dāng)樣本數(shù)據(jù)質(zhì)量比較差,即存在一些錯誤數(shù)據(jù)(如數(shù)據(jù)錄入錯誤、測量錯誤等)時,用抗極端數(shù)據(jù)強的中位數(shù)
10、表示數(shù)據(jù)的中心值更準(zhǔn)確。 缺點:(1)出現(xiàn)錯誤的數(shù)據(jù)也不知道;(2)對極端值不敏感有弊的例子:某人具有初級計算機專業(yè)技術(shù)水平,想找一份收入好的工作。這時如果采用各個公司計算機專業(yè)技術(shù)人員收入的中位數(shù)作為選擇工作的參考指標(biāo)就會冒這樣的風(fēng)險:很可能所選擇公司的初級計算機專業(yè)技術(shù)水平人員的收入很低,其原因是中位數(shù)對極小的數(shù)據(jù)不敏感。這里更好的方法是同時用平均工資和中位數(shù)作為參考指標(biāo),選擇平均工資較高且中位數(shù)較大的公司就業(yè). 思考討論以下問題:3、“用數(shù)據(jù)說話”,這是我們經(jīng)常聽到的一句話。但是,數(shù)據(jù)有時也會被利用,從而產(chǎn)生誤導(dǎo)。例如,一個企業(yè)中,絕大多數(shù)人是一線工人,他們的年收入可能是一萬元左右,另有
11、一些經(jīng)理層次的人,年收入過到幾十萬元。這時年收入的平均數(shù)比中位數(shù)大得多。盡管這時的中位數(shù)比平均數(shù)更合理些,但是這個企業(yè)的老板到人力市場去招聘工人時,也許更可能用平均數(shù)來回答有關(guān)工次待遇的指問。 你認(rèn)為“我們單位的收入水平比別的單位高”這句話應(yīng)當(dāng)怎么解釋? 答: 我認(rèn)為這句話是這樣解釋的:這個企業(yè)的老板以員工平均工資收入水平去描述他們單位的收入情況。我覺得這是不合理的,因為這些員工當(dāng)中,少數(shù)經(jīng)理層次的收入與大多數(shù)一般員工收入的差別比較大,所以平均數(shù)不能反映該單位員工的收入水平。這個老板的話有誤導(dǎo)與蒙騙行為。 課后練習(xí) 假設(shè)你是一名交通部門的工作人員,你打算向市長報告國家對本市26個公路項目投資的
12、平均資金數(shù)額,其中一條新公路的建設(shè)投資為2000萬元人民幣,另外25個項目的投資是20100萬元。中位數(shù)是25萬元,平均數(shù)是100萬元,眾數(shù)是20萬元。你會選擇哪一種數(shù)據(jù)特征來表示國家對每一個項目投資的平均金額?你選擇這種數(shù)字特征的缺點是什么? 答: 這里應(yīng)該采用平均數(shù)來表示每一個國家項目的平均金額,因為這能反映所有項目的信息。但平均數(shù)會受到極端數(shù)據(jù)2000萬元的影響,所以大多數(shù)項目投資金額都和平均數(shù)相差比較大。 四.小結(jié)1.學(xué)習(xí)利用頻率直方圖估計總體的眾數(shù) 、中位數(shù)和平均數(shù)的方法。2.介紹眾數(shù)、中位數(shù)和平均數(shù)這三個特征數(shù)的優(yōu)點和缺點。3.學(xué)習(xí)如何利用眾數(shù)、中位數(shù)和平均數(shù)的特征去分析解決實際問題。