《《獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用》》由會(huì)員分享,可在線閱讀,更多相關(guān)《《獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用》(19頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、 問(wèn) 題 : 數(shù) 學(xué) 家 龐 加 萊 每 天 都 從 一 家面 包 店 買 一 塊 1000g 的 面 包 , 并 記錄 下 買 回 的 面 包 的 實(shí) 際 質(zhì) 量 。 一 年后 , 這 位 數(shù) 學(xué) 家 發(fā) 現(xiàn) , 所 記 錄 數(shù) 據(jù)的 均 值 為 950g。 于 是 龐 加 萊 推 斷 這家 面 包 店 的 面 包 分 量 不 足 。 假 設(shè) “ 面 包 分 量 足 ” , 則 一 年 購(gòu) 買 面 包 的 質(zhì) 量數(shù) 據(jù) 的 平 均 值 應(yīng) 該 不 少 于 1000g ; “ 這 個(gè) 平 均 值 不 大 于 950g”是 一 個(gè) 與 假 設(shè) “ 面 包分 量 足 ” 矛 盾 的 小 概 率 事
2、 件 ; 這 個(gè) 小 概 率 事 件 的 發(fā) 生 使 龐 加 萊 得 出 推 斷 結(jié) 果 。 假 設(shè) 檢 驗(yàn) 問(wèn) 題 由 兩 個(gè) 互 斥 的 假 設(shè) 構(gòu) 成 , 其 中 一 個(gè)叫 做 原 假 設(shè) , 用 H 0表 示 ; 另 一 個(gè) 叫 做 備 擇 假 設(shè) ,用 H 1表 示 。例 如 , 在 前 面 的 例 子 中 , 原 假 設(shè) 為 : H 0: 面 包 分 量 足 ,備 擇 假 設(shè) 為 H 1: 面 包 分 量 不 足 。這 個(gè) 假 設(shè) 檢 驗(yàn) 問(wèn) 題 可 以 表 達(dá) 為 : H 0: 面 包 分 量 足 H 1: 面 包 分 量 不 足 考 慮 假 設(shè) 檢 驗(yàn) 問(wèn) 題 : H 0: 面
3、 包 分 量 足 H 1: 面 包 分 量 不 足1. 在 H 0成 立 的 條 件 下 , 構(gòu) 造 與 H 0矛 盾 的 小 概率 事 件 ;2. 如 果 樣 本 使 得 這 個(gè) 小 概 率 事 件 發(fā) 生 , 就 能以 一 定 把 握 斷 言 H 1成 立 ; 否 則 , 斷 言 沒(méi) 有發(fā) 現(xiàn) 樣 本 數(shù) 據(jù) 與 H 0相 矛 盾 的 證 據(jù) 。求 解 思 路 : 三 :二 個(gè) 概 念這 種 變 量 的 不 同 取 “ 值 ” 表 示 個(gè) 體 所 屬 的 不同 類 別 , 這 類 變 量 稱 為 分 類 變 量1.分 類 變 量 對(duì) 于 性 別 變 量 , 取 值 為 : 男 、 女 分
4、類 變 量 在 現(xiàn) 實(shí) 生 活 中 是 大 量 存 在 的 , 如 是否 吸 煙 , 是 否 患 肺 癌 , 宗 教 信 仰 , 國(guó) 別 , 年 齡 ,出 生 月 份 等 等 。利 用 隨 機(jī) 變 量 K2來(lái) 確 定 在 多 大 程 度 上 可 以 認(rèn) 為 ”兩 個(gè) 分 類 變 量 有 關(guān) 系 ” 的 方 法 稱 為 兩 個(gè) 分 類 變量 的 獨(dú) 立 性 檢 驗(yàn) .(為 假 設(shè) 檢 驗(yàn) 的 特 例 ) 吸 煙 與 肺 癌 列 聯(lián) 表不 患 肺 癌 患 肺 癌 總 計(jì)不 吸 煙 7775 42 7817吸 煙 2099 49 2148總 計(jì) 9874 91 9965為 了 調(diào) 查 吸 煙 是 否
5、 對(duì) 肺 癌 有 影 響 , 某 腫 瘤 研 究 所 隨 機(jī)地 調(diào) 查 了 9965人 , 得 到 如 下 結(jié) 果 ( 單 位 : 人 )在 不 吸 煙 者 中 患 肺 癌 的 比 重 是 在 吸 煙 者 中 患 肺 癌 的 比 重 是 說(shuō) 明 : 吸 煙 者 和 不 吸 煙 者 患 肺 癌 的 可 能 性 存 在 差 異 ,吸 煙 者 患 肺 癌 的 可 能 性 大 0.54%2.28% 1)通 過(guò) 圖 形 直 觀 判 斷 兩 個(gè) 分 類 變 量 是 否 相 關(guān) : 2) 通 過(guò) 圖 形 直 觀 判 斷 兩 個(gè) 分 類 變 量 是 否 相 關(guān) : 3)通 過(guò) 圖 形 直 觀 判 斷 兩 個(gè)
6、分 類 變 量 是 否 相 關(guān) :患 肺 癌比 例不 患 肺 癌比 例 獨(dú) 立 性 檢 驗(yàn)H0: 吸 煙 和 患 肺 癌 之 間 沒(méi) 有 關(guān) 系 H1: 吸 煙 和 患肺 癌 之 間 有 關(guān) 系 通 過(guò) 數(shù) 據(jù) 和 圖 表 分 析 , 得 到結(jié) 論 是 : 吸 煙 與 患 肺 癌 有 關(guān)用 A 表 示 “ 不 吸 煙 ” , B 表 示 “ 不 患 肺 癌 ”則 H0: 吸 煙 和 患 肺 癌 之 間 沒(méi) 有 關(guān) 系 “ 吸 煙 ” 與 “ 患 肺 癌 ” 獨(dú) 立 ,即 A與 B獨(dú) 立P(AB)=P(A)P(B)等 價(jià) 于等 價(jià) 于 吸 煙 與 肺 癌 列 聯(lián) 表不 患 肺 癌 患 肺 癌 總
7、 計(jì)不 吸 煙 a b a+b吸 煙 c d c+d 總 計(jì) a+c b+d a+b+c+d a + b a + c aP(A) ,P(B) ,P(AB)n n n其 中 n = a + b + c + d a c ,a+b c+d a c+d c a+b ,ad bc a a+b a+c n n n 22 n( ad-bc)K =(a+b)(c+d)(a+c)(b+d) 獨(dú) 立 性 檢 驗(yàn) 0.ad bc ad-bc 越 小 , 說(shuō) 明 吸 煙 與 患 肺 癌 之 間 的 關(guān) 系 越 弱 ,ad-bc 越 大 , 說(shuō) 明 吸 煙 與 患 肺 癌 之 間 的 關(guān) 系 越 強(qiáng)引 入 一 個(gè) 隨
8、機(jī) 變 量作 為 檢 驗(yàn) 在 多 大 程 度 上 可 以 認(rèn) 為 “ 兩 個(gè) 變 量有 關(guān) 系 ” 的 標(biāo) 準(zhǔn) 。 1)如 果 P(m10.828)= 0.001表 示 有 99.9%的 把 握 認(rèn) 為 ” X與 Y” 有 關(guān)系 ;2)如 果 P(m7.879)= 0.005表 示 有 99.5%的 把 握 認(rèn) 為 ” X與 Y” 有 關(guān) 系 ;3)如 果 P(m6.635)= 0.01表 示 有 99%的 把 握 認(rèn) 為 ” X與 Y” 有 關(guān) 系 ;4)如 果 P(m5.024)= 0.025表 示 有 97.5%的 把 握 認(rèn) 為 ” X與 Y” 有 關(guān) 系 ;5)如 果 P(m3.84
9、1)= 0.05表 示 有 95%的 把 握 認(rèn) 為 ” X與 Y” 有 關(guān) 系 ;6)如 果 P(m2.706)= 0.10表 示 有 90%的 把 握 認(rèn) 為 ” X與 Y” 有 關(guān) 系 ;7)如 果 P(m2.706),就 認(rèn) 為 沒(méi) 有 充 分 的 證 據(jù) 顯 示 ” X與 Y” 有 關(guān) 系 ;設(shè) 有 兩 個(gè) 分 類 變 量 X和 Y它 們 的 值 域 分 別 為 x1,x2和y1,y2其 樣 本 頻 數(shù) 列 表 (稱 為 2 2列 聯(lián) 表 ) 為 y1 y2 總 計(jì)x1 a b a+bx2 c d c+d總 計(jì) a+c b+d a+b+c+d2 2列 聯(lián) 表 22 ( )( )( )
10、( )n ad bcK a b c d a c b d ( )2P(k m) 獨(dú) 立 性 檢 驗(yàn) 吸 煙 與 肺 癌 列 聯(lián) 表不 患 肺 癌 患 肺 癌 總 計(jì)不 吸 煙 7775 42 7817吸 煙 2099 49 2148總 計(jì) 9874 91 9965通 過(guò) 公 式 計(jì) 算 22 42 2099 56.6327817 2148 9874 91K 9965(7775 49 ) 獨(dú) 立 性 檢 驗(yàn)已 知 在 成 立 的 情 況 下 ,0H2( 6.635) 0.01P K 即 在 成 立 的 情 況 下 , K2 大 于 6.635概 率 非 常小 , 近 似 為 0.010H現(xiàn) 在 的
11、 K2=56.632的 觀 測(cè) 值 遠(yuǎn) 大 于 6.635 分 類 變 量 之 間 關(guān) 系條 形 圖 柱 形 圖 列 聯(lián) 表獨(dú) 立 性 檢 驗(yàn)背 景 分 析 例 1.在 某 醫(yī) 院 ,因 為 患 心 臟 病 而 住 院 的 665名 男 性 病 人 中 ,有 214人 禿 頂 ,而 另 外 772名不 是 因 為 患 心 臟 病 而 住 院 的 男 性 病 人 中 有175人 禿 頂 .分 別 利 用 圖 形 和 獨(dú) 立 性 檢 驗(yàn) 方法 判 斷 是 否 有 關(guān) ?你 所 得 的 結(jié) 論 在 什 么 范 圍內(nèi) 有 效 ? 例 2.為 考 察 高 中 生 性 別 與 是 否 喜 歡 數(shù) 學(xué) 課
12、程 之間 的 關(guān) 系 ,在 某 城 市 的 某 校 高 中 生 中 隨 機(jī) 抽 取300名 學(xué) 生 ,得 到 如 下 列 聯(lián) 表 : 性 別 與 喜 歡 數(shù) 學(xué) 課 程 列 聯(lián) 表喜 歡 數(shù) 學(xué) 課 程 不 喜 歡 數(shù) 學(xué) 課 程 總 計(jì) 男 37 85 122 女 35 143 178 總 計(jì) 72 228 300由 表 中 數(shù) 據(jù) 計(jì) 算 得 ,高 中 生 的性 別 與 是 否 喜 歡 數(shù) 學(xué) 課 程 之 間 是 否 有 關(guān) 系 ?為 什 么 ? 2K 4.513ac db 獨(dú) 立 性 檢 驗(yàn) 基 本 的 思 想 類 似 反 證 法(1)假 設(shè) 結(jié) 論 不 成 立 ,即 “ 兩 個(gè) 分 類 變 量 沒(méi) 有 關(guān) 系 ” .(2)在 此 假 設(shè) 下 隨 機(jī) 變 量 K2 應(yīng) 該 很 能 小 ,如 果 由 觀 測(cè) 數(shù) 據(jù)計(jì) 算 得 到 K2的 觀 測(cè) 值 k很 大 ,則 在 一 定 程 度 上 說(shuō) 明 假 設(shè)不 合 理 .(3)根 據(jù) 隨 機(jī) 變 量 K2的 含 義 ,可 以 通 過(guò)評(píng) 價(jià) 該 假 設(shè) 不 合 理 的 程 度 ,由 實(shí) 際 計(jì) 算 出 的 ,說(shuō) 明 假 設(shè) 合 理 的 程 度 為 99.9%,即 “ 兩 個(gè) 分 類 變 量 有 關(guān)系 ” 這 一 結(jié) 論 成 立 的 可 信 度 為 約 為 99.9%.