《高中數(shù)學從普查到抽樣》由會員分享,可在線閱讀,更多相關《高中數(shù)學從普查到抽樣(32頁珍藏版)》請在裝配圖網上搜索。
1、 數(shù) 字 化 的 時 代 產品的合格率 農作物的產量 從普查到抽樣 產品的銷售量 某地的氣溫 自然資源 就業(yè)狀況 電視臺的收視率 0 5 10 15 20 25 30 上海 南京 天津 沈陽 哈爾濱 缺水量/ 我國是世界上的第 13個 貧水國 ,人均淡水占量排 世界第 109位 我國土地沙漠化非常嚴重 ,全國沙漠化土地面積已超過 174000平方公里 ,并以每年 3400平方公里的速度擴張 . 你知道這些數(shù)據(jù)是怎么來的嗎? 通過調查獲得的 . 怎么調查? 是對考察對象進行全面調查還是抽樣調查? 媽媽 :“兒子,幫媽媽買盒火柴去?!?媽媽 :“這次注意點,上次你買的火柴好多劃不著。 ” 兒子高興
2、地跑回來。 孩子:“媽媽,這次的火柴全劃得著,我 每根 都試 過了。” 這個調查具有 破壞性 ,不可能 每根 試過 ,不能 展開全面調查。 看一看 要了解全國高中生的視力情況: ( 1)對全國所有的高中生進行視力測試; ( 2)對某一所著名中學的高中生進行視力測試; ( 3)在全國按東、南、西、北、中分片,每個區(qū)域各抽所 中學,對這 15所中學的全部高中生進行視力測試。 你認為哪種調查方式較適合? 人們在研究某個自然現(xiàn)象或社會現(xiàn)象時,會遇到 不方便、 不可能 或 不必要 對所有對象作調查的情況, 往往采用抽樣調 查的方法。 議一議 屬于普查,工作量太大,不方便,沒有必要 這種方法缺乏普遍性,不
3、合適。 這種調查具有可操作性及代表性。 議一議 同學們覺得在什么時候用 普查 方式較好 ?什么 時候用 抽樣調查 方式較好呢 ? ( 1)當調查的對象個數(shù)較少,調查容易進行時,我們一般采 用普查的方式進行。 ( 2)當調查的結果對調查對象具有破壞性時,或者會產生一 定的危害性時,或不大經濟可行我們通常采用抽樣調查的方式 進行調查。 ( 3)當調查對象的個數(shù)較多,調查不易進行時,我們常采用 抽樣調查的方式進行調查。 例如,為了了解一批計算器的壽命,我們能將它 們逐一測試嗎?很明顯,這既不可能也沒必要。實踐 中,由于所考察的總體中的個體數(shù)往往很多,而且許 多考察帶有破壞性,因此,我們通常只考察 總
4、體 中的 一個 樣本 ,通過樣本來了解總體的情況。 進一步,從節(jié)約費用的角度考慮,在保證樣本估 計總體達到一定的精度的前提下,樣本中包含的個體 數(shù)越少越好 。 于是,如何設計抽樣方法,使抽取的樣本能夠真 正代表總體,就成為我們要關注的一個關鍵問題。否 則,如果樣本的代表性不好,那么對總體的判斷就會 出現(xiàn)錯誤。因此科學合理地采集樣本才能作出客觀的 統(tǒng)計推斷。 那么,怎樣從總體中抽取樣本呢?如何表示樣本數(shù)據(jù)? 如何從樣本數(shù)據(jù)中提取基本信息(樣本分布、樣本數(shù)字特征 等),來推斷總體的情況呢?這些正是本章要解決的問題。 數(shù)理統(tǒng)計所要解決的問題是如何根據(jù)樣本來推斷總體。 首先必須清楚地知道要收集的數(shù)據(jù)是
5、什么;其次,我們檢驗 樣本的目的是為了了解總體的情況;再次,我們要知道如何 才能收集到高質量的樣本數(shù)據(jù)。 在抽樣調查中要注意什么問題? 要了解 全國高中生的視力 情況,第三種調查方法:在全國 按東、西、南、北、中分片, 每個區(qū)域各抽 3所中學, 對這 15所中學的全部高中生 15000人進行視力測試。 考察對象是什么 ? 在統(tǒng)計中,我們把所要考察的對象的全體叫做總體 全國每位高中學生的 視力情況。 把組成總體的每一個考察的對象叫 做個體 這 15000名學生的視力情 況又組成一個集體 從總體中取出的一部分個體的集體 叫做這個總體的一個樣本。 15000 樣本中的個體的數(shù)目叫做樣本 的容量。 、
6、如何刻畫一批袋裝牛奶的質量是否合格? 以下變量都可以作為衡量產品質量的指標: ()袋裝牛奶的細菌含量;()袋裝牛奶的重量; ()袋裝牛奶的蛋白含量;()袋裝牛奶的脂肪含量; ()袋裝牛奶的鈣含量 、怎樣檢驗“一批袋裝牛奶的細菌含量是否超標?”是普 查還 是抽樣調查?各有什么優(yōu)缺點?應該采用哪種方法? 普查的優(yōu)點:在普查的過程中不出錯的情況下可以得到這批 袋裝牛奶的真實細菌含量。 普查的弊?。?、需要打開每一袋牛奶進行檢驗,結果使得這批牛奶不能 出售,失去了調查這批牛奶的質量的意義; 、普查需要大量的人力、物力和財力; 、當普查的過程中出現(xiàn)很多數(shù)據(jù)測量、錄入等錯誤時,也 會產生錯誤的結論。 抽樣
7、調查的優(yōu)點:容易操作,節(jié)省人力、物力和財力。 抽樣調查的缺點:估計結果有誤差。 議一議 為什么說一個好的抽樣調查勝過一次蹩腳的普查? 品嘗一勺湯 ,就可以知道一鍋湯的味道 ,你知道其中蘊 涵的道理嗎 ? 生活中的 “ 數(shù)學 ” 高質量的樣本數(shù)據(jù)來自“攪拌均勻”的總體。如果我們 能夠設法將總體“攪拌均勻”,那么從中任意抽取一部分 個體的樣本,它們含有與總體基本相同的信息。 范例 在 1936年美國總統(tǒng)選舉前,一份頗有名氣的雜志的工 作人員做了一次民意測驗,調查 Alf Landon 和 Franklin Delano Roosevelt中誰將當選下一屆總統(tǒng)。為了了解公眾 意向,調查者通過電話簿和
8、車輛登記簿上的名單給一大批 人發(fā)了調查表( 注意在 1936年電話和汽車只有少數(shù)富人擁 有 ),通過分析收回的調查表,顯示 Alf Landon非常受歡 迎。于是此雜志預測 Alf Landon將在選舉中獲勝。 實際選舉結果正好相反,最后 Franklin Delano Roosevelt在選舉中獲勝。其數(shù)據(jù)如下: 候選人 預測結果 選舉結果 Landon 57 38 Roosevelt 43 62 思 考 你認為預期結果出錯的原因是什么? 原因是:用于統(tǒng)計推斷的樣本來自少數(shù)富人,只能代 表富人的觀點,不能代表全體選民的觀點(樣本不具有代 表性)。 像本例中這樣容易得到的樣本稱為方便樣本。如果
9、使 用“方便樣本”,那么得出與事實不符的結論的可能性就 會大大增加。 結論:在抽樣時不能只圖方便。如果只從一些容易得 到的個體中抽取樣本,那么所得到的樣本只是一個“方便 樣本”,“方便樣本”的代表性差,基本這種方便樣本得 出的結論就會與事實相左。 中央電視臺需要在我市調查“春節(jié)聯(lián)歡晚會”的收視率。 ( 1)每個看電視的人都要被問到嗎? ( 2)對我校學生的調查結果能否作為該節(jié)目的收視率? ( 3)你認為對不同社區(qū)、年齡層次、文化背景的人所做調查的結 果會一樣嗎? 答 ( 1) 中央電視臺在調查時不可能問到每一個看電視的人 。 ( 2) 對一所中學學生的調查結果不能作為該節(jié)目的收視率 , 因為只
10、有中學生 , 缺乏代表性 。 ( 3) 不同社區(qū) 、 年齡層次 、 文化背景的人所做調查的結果 不一樣 , 因為他們的興趣 、 愛好等方面情況相距甚遠 。 為了了解學生對學?;锸车臐M意程度,小紅訪問了名女生; 小聰訪問了名男生;小明訪問了名男生和名女生, 其中高一、高二和高三的男生和女生各 8名。你認為小紅、小聰、 小明三人的不同抽樣方法那一種最好?為什么? 答:小明的方法最好。小明抽得樣本既有男生,又有女生,而 均勻分布在各年級,這樣的抽樣較具有代表性,反映的情況具 有普遍意義。 1.我們常常根據(jù)樣本得到結果來推測總體的結果。不同 的抽樣可能得到不同的結果。 2.為了使結果更具準確性,抽樣時
11、,樣本的容量要合 理,樣本的個體要有代表性。 練習 1.下列調查工作適合采用普查方式的是 ( ) A.環(huán)保部門對淮河水域的水 污染調查 B.電視臺對正在播出的某電視節(jié)目收視率的調查 C.檢查一批電視機的使用壽命 D.學校給全校學生訂做校服前 ,進行尺寸大小的調查 2.為了解全校 4500名學生的課外閱讀時間情況 ,從中 抽取 200名學生進行調查,下列說法正確的 ( ) A.總體是 4500名學生 ; B.個體是每個學生 C.樣本是 200名學生 ; D. 樣本容量是 200. 每個個體在整個抽樣過程 中被抽取的概率是否相等? 思考 分析: 每部分抽取的個體數(shù) 樣本容量該部分的個體總數(shù) 總體中
12、的個體數(shù) 應用舉例 例 1 填空 : 1 、統(tǒng)計的基本思想方法是 ________________。 抽樣調查常用的方法有 ______________________________。 樣本容量是指 ________________________. 、簡單隨機抽樣適用的范圍是 _________________. 系統(tǒng)抽樣適用的范圍是 ____________________. 分層抽樣適用的范圍是 _______________________. 3、為了了解某地區(qū)參加數(shù)學競賽的 1005名學生的數(shù)學 成績 ,打算從中抽取一個容量為 50的樣本 ,現(xiàn)用系統(tǒng)抽樣 的方法 ,需要從總體中剔除
13、 5個個體 ,在整個過程中 ,每個 個體被剔除的概率和每個個體被抽取的概率分別為 _______. 三種抽樣方法的應用 用樣本估計總體 簡單隨機抽樣 ,系統(tǒng)抽樣 ,分層抽樣 樣本中包含的個體的個數(shù) 總體中的個體數(shù)較少 總體中的個體數(shù)較多 總體由差異明顯的幾部分組成 A 10 05 50, 10 05 5 .A 1000 50, 1005 1000 .D 10 05 50, 10 05 10 00 .B 10 00 50, 10 05 5 .C 例 2:下列抽取樣本的方式是屬于哪種抽樣方法 ? (1)某市為了了解職工的家庭生產狀況 ,先將職工所在的國民經濟 行業(yè)分成 13類 ,然后每個行業(yè)抽 1
14、/100的職工家庭進行調查 ,這 種抽樣方法是 ____________________. 分層抽樣 (2)某學校高二年級有 15名男籃運動員 ,要從中選出 3人調查學習 負擔情況 ,這種抽樣方法是 ____________________. 簡單隨機抽樣 (3)某工廠生產的產品 ,用傳送帶將產品送入包裝車間 ,質檢員每隔 5分鐘從傳送帶某一位置取一產品進行檢測 ,則這種抽樣方法是 _________________. 系統(tǒng)抽樣 (4)學校會議廳有 32排座位 ,每排有 40個座位 (座位號為 140 ),一 次報告會坐滿了聽眾 .會后為聽取意見 ,留下了座位號為 18的 所有的 32名聽眾進
15、行座談 ,則這種抽樣方法是 ____________. 系統(tǒng)抽樣 (5)在某一地區(qū)搞一市場調查 ,規(guī)定在商場門口隨機地對一個人進 行詢問調查 ,直到調查到事先規(guī)定的調查人數(shù)為止 ,則這種抽 樣方法是 ______________________. 偶遇抽樣 說明 :這樣的調查與所學的三種抽樣方法的區(qū)別在于 :事先不知 總體且不能保證每個個體按事先規(guī)定的概率入樣 . 例 3:填空題 : (1)一個總體的個數(shù)為 n,用簡單隨機抽樣的方法 ,抽取一個容量 為 2的樣本 ,個體 a第一次未被抽到的概率為 _______;個體 a 第一次未被抽到但第二次被抽到的概率為 _______;整個抽 樣過程中個
16、體 a被抽到的概率為 _______. (n-1)/n 1/n 2/n (2)一個總體的 80個個體編號為 0,1,2,79, 并依次將其分成 8個 小組,組號為 0, 1,2,7, 要用 (錯位 )系統(tǒng)抽樣方法抽取一 個容量為 8的樣本 ,即規(guī)定先在第 0組隨機抽取一個號碼 ,記為 m,依次錯位地得到后面各組的號碼 ,即第 k組中抽取的號碼的 個位數(shù)為 m+k或 m+k-10(若 m+k10).則在 m=6時 ,所抽到的 8個號碼是 __________________________________. 注 :簡單隨機抽樣中每一個個體的入樣概率為 M/n. 6,17,28,39,40,51,
17、62,73. (3)某縣三個鎮(zhèn)共有高中生 2000名 ,且這三個鎮(zhèn)的高中生人數(shù)之 比為 2:3:5,若學生甲被抽到的概率為 1/10,則這三個鎮(zhèn)被抽到 的高中生人數(shù)分別是 ______________________. 40,60,100. 例 4:某公司下屬四個公司 ,且各分公司有員工 180人 ,150人 ,150人 , 120人 ,由于各分公司地域的差異而影響經營效益與員工的消費 水平 ,現(xiàn)要從各分公司抽取 60名員工調查消費情況 ,用什么方法抽 樣較好 ,各分公司分別抽多少人 ? 解 :用分層抽樣的方法較好 . 設各分公司分別抽取 (人 ),抽取總數(shù) n=60人 ,各公 司員工總數(shù)為
18、N=180+150+150+120=600人 . 4321 , nnnn .1260 600 120 1560 600 150 1560 600 150 ;1860 600 180 43 21 人人; 人;人 nn nn 例 5:從 2004名同學中抽取一個容量為 20的樣本 ,試敘述系統(tǒng)抽樣 的步驟 . 解 :(1)采用隨機的方式給個體編號 :1,2,2004. (2)剔除 4個個體 . (3)分段 :由于 20:2000=1:100,故將總體分為 20個部分 ,其中每 一部分 100個個體 . (4)在第一部分隨機抽取一個號碼 ,比如 66號 ; (5)起始號加上各段中所含的個體數(shù) ,如
19、166,266,. 注 :從 N個編號中抽取 n個號碼入樣 ,考慮用系統(tǒng)抽樣的方式抽樣 , 則抽樣的間隔為 N/n. 練習 1:從 50名學生中抽取 10名學生對他們的身高進行檢測 ,應采 用哪種方法抽樣 ?寫出抽樣過程 . 解 :用簡單隨機抽樣較好 . 將 50名學生的學號寫在形狀、大小相同的號簽上 ,然后將這些 號簽放在同一盒子中進行均勻攪拌 ,抽簽時 ,每次抽出一個號簽 , 連續(xù)抽取 10次 ,則所抽得的 10個號簽上的學生學號所對應著選 出的 10個學生 . 練習 2:某高校有一萬名大學生 ,從中抽取 100名學生進行健康檢查 , 采用哪種方法抽樣較好 ?寫出抽樣過程 . 解 :由于總
20、體個數(shù)為 10000,數(shù)量較大 ,因而采用系統(tǒng)抽樣法 . 具體過程如下 : (1)采用隨機的方式將總體中的個體編號 1,2,3,10000. (2)把整個總體分成 10000/100=100組 ; (3)在第一組中用簡單隨機抽樣確定一個起始個體編號 m; (4)將 m+100,m+200,m+9900 分別到第 2,3,100 個編號從 而獲得整個樣本 . 練習 3:一個地區(qū)有 5個鄉(xiāng)鎮(zhèn) ,人口 3萬 ,其人口比例為 3:2:5:2:3,要 從 3萬人中抽取 300人進行某種疾病的發(fā)病分析 .已知這種 疾病與不同的地理位置及水土有關 ,問應采用哪種抽樣方 法 ?并寫出具體過程 . 解 :因為疾
21、病與不同的地理位置及水土有關 ,因而不同鄉(xiāng)鎮(zhèn)的發(fā)病 情況差異明顯 ,因而采用分層抽樣方法 . 具體過程如下 : (1)將 3萬人分成 5層 ,每個鄉(xiāng)鎮(zhèn)一層 ; (2)按照樣本容量與總體容量的比例及各鄉(xiāng)鎮(zhèn)的人口比例隨機 抽取各鄉(xiāng)鎮(zhèn)應抽取的樣本 ,通過計算 ,易知各鄉(xiāng)鎮(zhèn)應抽取的 樣本數(shù)分別為 60,40,100,40,60個 . (3)將 300個人組成一起 ,即得到一組樣本 . 練習 4:光明中學有高一學生 400人 ,高二學生 320人 ,高三學生 400 人 ,以每人被抽取的概率為 0.2,向該中學抽取一個容量為 n 的樣本 ,則 n=________________. 224 2)我們所學
22、的三種抽樣方法都是事先規(guī)定每個個體的入樣概率相等 (一般的分層抽樣可規(guī)定不同層有不同的入樣概率 ,我們所學的分層 抽樣嚴格地講 ,稱為按比例分層抽樣 ).這體現(xiàn)了這三種抽樣方法的客 觀性和公平性 . 3)簡單隨機抽樣是系統(tǒng)抽樣與分層抽樣的基礎 ;系統(tǒng)抽樣與分層 抽樣是簡單隨機抽樣的發(fā)展 . 例 5:某中學有學生 2000名 ,為了了解學生的學習情況 ,抽 5%的學 生進行調查 ,你將如何設計抽樣方法 ? 解 :根據(jù)不同的要求可有不同的抽樣方法 . 現(xiàn)在抽 5%的學生 ,一般來說 ,一個班級的人數(shù)在 5060, 用系統(tǒng) 抽樣方法每個班可抽到 2 3人 ,可以采用系統(tǒng)抽樣 . 若抽樣比例少于 2%,而學校有文、理分班或快、慢分班等學生 學習程度不一致的情形 ,應采用分層抽樣 .