分類變量資料的統(tǒng)計分析 ppt課件
《分類變量資料的統(tǒng)計分析 ppt課件》由會員分享,可在線閱讀,更多相關(guān)《分類變量資料的統(tǒng)計分析 ppt課件(37頁珍藏版)》請在裝配圖網(wǎng)上搜索。
>計數(shù)資料的統(tǒng)計分析統(tǒng)計資料的類型數(shù)值變量 : 計量資料分類變量 : 計數(shù)資料 有序分類 : 變量之間有程度的差別 , 且排列有序 . (等級變量 )無序分類 : 二項分類多項分類變量的轉(zhuǎn)換 : 定量 定性連續(xù)型計量資料離散型計量資料第十章 分類變量資料的統(tǒng)計分析第一節(jié) 統(tǒng)計描述一 .描述指標 (相對數(shù) )1. 率 (rate) :單位 : %,‰,萬分率 ,10萬分率2. 構(gòu)成比 (constituent ratio) 單位 : % 特點 :3. 相對比 (relative ratio)常用率比 ? 例 10-1某研究者 2000年對某校的初中生進行了近視患病情況調(diào)查 ,試計算各年級近視患病率和構(gòu)成比及三年級和一年級患病率的相對比 .年級 檢查人數(shù) 患病人數(shù) 患病率 構(gòu)成比 相對比一 年級 442 67 二年級 428 68三年級 405 74 合計 1275 209 16.39 100.015.16 32.0615.89 32.53 18.27 35.41 1.2二 . 應(yīng)用相對數(shù)時注意事項1. 分母 不宜太小2. 率和構(gòu)成比的區(qū)別3. 樣本含量不等的 幾個率的平均值 不等于 幾個率的算數(shù)平均值4. 對率或構(gòu)成比進行比較時 ,應(yīng)注意 資料的可比性5. 率的標準化6. 兩樣本率進行比較時應(yīng)進行 假設(shè)檢驗三 .率的標準化1.基本思想 : 為消除內(nèi)部構(gòu)成不同對指標的影響, 采用統(tǒng)一的內(nèi)部構(gòu)成計算標準化率 ,使得出的標準化率具有可比性 .2.計算方法 : 直接法 : 已知各年齡組的實際發(fā)病率 ,用標準人口數(shù)或標準人口構(gòu)成進行計算間接法 : 標準化死亡比 (SMR), 實際死亡數(shù)與預(yù)期死亡數(shù)的比3. 率的標準化應(yīng)注意的問題第三節(jié) 率的標準化法 (standardization)西醫(yī)組 中西醫(yī)結(jié)合組 病型 病例數(shù) 治愈數(shù) 治愈率 (%) 病例數(shù) 治愈數(shù) 治愈率 (%) 普通型 60 36 60 20 13 65重型 20 8 40 60 27 45 爆發(fā)型 20 4 20 20 5 25合計 100 48 48 100 45 45例 : 某病兩種療法治愈率的比較西醫(yī)標準化治愈率 P'= 88÷200 = 44%中西醫(yī)標準化治愈率 P'= 98÷200 = 49%例 : 某病兩種療法治愈率的比較西醫(yī)組 中西醫(yī)結(jié)合組 病型 病例數(shù) 原治愈率 (%) 預(yù)期治愈數(shù) 原治愈率 (%) 預(yù)期治愈數(shù) 普通型 80 60 48 65 52重型 80 40 32 45 36 爆發(fā)型 40 20 8 25 10合計 200 88 98率的標準化1.基本思想 : 為消除 內(nèi)部構(gòu)成不同 對指標的影響 , 采用 統(tǒng)一的內(nèi)部構(gòu)成 計算標準化率 ,使得出的標準化率具有可比性 .2.計算方法 : 直接法 : 已知各年齡組的實際發(fā)病率 ,用標準人口數(shù)或標準人口構(gòu)成進行計算間接法 : 標準化死亡比 (SMR), 實際死亡數(shù)與預(yù)期死亡數(shù)的比 3. 率的標準化應(yīng)注意的問題? 由于內(nèi)部構(gòu)成不同 ,影響到要比較的總率 ,需要標準化處理?? 標準化率只用于比較,已經(jīng)不代表實際的水平。? 各分組率有交叉 ,不能用標準化率比較? 抽樣得到的標準化率的比較 ,也應(yīng)該進行假設(shè)檢驗 .第二節(jié) 計數(shù)資料統(tǒng)計推斷一 . 率的抽樣誤差和標準誤樣本率和總體率或樣本率之間存在的差異 ,稱抽樣誤差 .率的抽樣誤差用率的標準誤表示 .(?p or Sp).( p =陽性率 , 1- p=陰性率 )二 . 總體率的區(qū)間估計2. 查表法 : 當 n ≤50, 樣本率 p 接近與 0或 1時 ,該資料服從二項分布 ,用查表法估計樣本含量p ? u?× Sp1. 正態(tài)近似法 :np 和 n(1-p)>5條件 : n 足夠大 ,樣本率 p 或 1-p均不太小時 , 即例 10-5為了解某地乙肝表面抗原攜帶情況 ,某研究者在該地人群中隨機檢測了該地 200人 ,乙肝表面抗原陽性 7人 ,乙肝表面抗原攜帶率為 3.5%, 試計算標準誤并估計 95% 和 99% 可信區(qū)間 .95% 可信區(qū)間 : 3.5% ? 1.96 Sp99% 可信區(qū)間 : 3.5% ? 2.58 Spn=200 X=7, P=3.5% 三 . 兩個率比較的 u 檢驗當 np和 n(1-p) ≧ 5 時 樣本率的分布近似正態(tài)分布 — u 檢驗(一 ) 檢驗步驟 : 1. 建立假設(shè) , 確定檢驗水準 αH0: H1:α =0.052. 選擇檢驗方法 , 計算 u 值3. 確定 P 值 , 判斷結(jié)果(二 )資料類型1. 樣本率與總體率的比較 (例 10-6)計算公式 :2. 兩個樣本率的比較 (例 10-7)計算公式 :第三節(jié) X2 檢驗 (chi-square test)基本思想檢驗實際頻數(shù)與理論頻數(shù)的吻合程度 ,實際頻數(shù)與理論頻數(shù)越相近 , X2 值越小 ; 反之 ,實際數(shù)與理論數(shù)相差越大 , X2值越大 .計算公式 :理論頻數(shù)的計算 : TRC= nRnC / ndf=(行數(shù) -1)(列數(shù) -1)例 10-8 某醫(yī)生用 A,B兩種藥物治療急性下呼吸道感染 .A藥治療 74例 ,有效 68例 ;B藥治療 63例 ,有效 52例 .問兩種藥物的有效率是否有差別 ?處理 有效 無效 合計 有效率(%)A 藥 68 6 74 91.89B 藥 52 11 63 82.54合計 120 17 137 87.59例 10-8 某醫(yī)生用 A,B兩種藥物治療急性下呼吸道感染 .A藥治療 74例 ,有效 68例 ;B藥治療 63例 ,有效 52例 .問兩種藥物的有效率是否有差別 ?處理 有效 無效 合計 有效率(%)A 藥 68 (64.82) 6 (9.18) 74 91.89B 藥 52 (55.18) 11(7.82) 63 82.54合計 120 17 137 87.59二 . Χ2 檢驗的基本步驟?建立檢驗假設(shè) ,確定檢驗水準H0: ?1= ?2H1: ?1 ? ?2?=0.052. 計算 Χ2 值資料類型不同 ,計算公式不同3. 確定 P 值 , 判斷結(jié)果根據(jù)查 Χ2 界值表 , 確定 P值三 . 四格表資料的 Χ2 檢驗1. 四格表資料的 Χ2 檢驗的 專用公式df =(R-1)(C-1)=1?四格表資料的 Χ2 檢驗的校正-- Yates 連續(xù)校正校正公式 :校正的目的 :英國統(tǒng)計學家 (Yates)認為 ?2分布是一種連續(xù)性分布 ,而四格表中的資料屬離散性分布 ,得到的 ?2統(tǒng)計量的抽樣分布也是離散的 .因此 ,為改善 ?2統(tǒng)計量分布的連續(xù)性 ,建議進行校正 .連續(xù)性校正應(yīng)遵循的條件 :1. T ? 5, 且 N ? 40時 , 用非校正的公式2. 1? T 40:當 b+c<40 時 , 用校正公式 . (McNemar 檢驗 )4. 行 ×列表資料的 ?2檢驗 (R ×C 表資料 )基本公式 : A — 每個格子的實際頻數(shù) nR – A所對應(yīng)的行合計nC – A所對應(yīng)的列合計例 10-12. 某研究者欲比較甲、乙、丙三家醫(yī)院住院患者院內(nèi)感染情況,隨機抽查同一時期住院患者感染情況,結(jié)果如下:試比較三家醫(yī)院院內(nèi)感染率有無差別。表 10-12 三家醫(yī)院住院患者的院內(nèi)感染率比較醫(yī)院 感染 未感染 合計合計 77 509 586甲 43 188 231乙 19 170 189丙 15 151 166H0:三家醫(yī)院院內(nèi)感染率相同H1:三家醫(yī)院院內(nèi)感染率不相同或不全相同α= 0.05 df=(行數(shù) -1)(列數(shù) -1)= (3- 1)(2- 1) =2查 X2界值表: X20.05(2)=5.99 X20.01(2)=9.21 按 α = 0.05,拒絕 H0,接受 H1,差別有統(tǒng)計學意義,即可認為三家醫(yī)院住院病人的院內(nèi)感染率有差別。然而,三者之間誰和誰有差別,還不知道。應(yīng)該進一步進行兩兩比較兩兩比較,可采用 X2分割行 ?列表資料 ?2檢驗應(yīng)注意事項1. 行 ?列表資料 ?2檢驗公式的應(yīng)用條件 :不能有 1/5以上 的格子的 理論數(shù) <5,或者 ,不能有 1個格子 的 理論數(shù) <12. 如果資料不能滿足上述條件 ,則可以通過(1) 在可能的情況下再增加樣本量 ;(2)專業(yè)上允許的情況下 ,合并相鄰的行或列;(3) 刪去理論數(shù)太小的行和列3. 假設(shè)檢驗結(jié)果有差別 ,只能認為總的率或構(gòu)成比有差別4. 單向有序變量(等級資料)的行 × 列表,不能用 X2檢驗比較組間效應(yīng),如果作 X2,只能說明個處理組間的效應(yīng)在構(gòu)成比上有無差別。表 10-12 中藥和西藥對某病的療效比較藥物 治愈 好轉(zhuǎn) 無效 合計合計 163 102 70 335中藥 78 42 32 152西藥 85 60 38 183小結(jié)計數(shù)資料的統(tǒng)計描述指標 : 率、構(gòu)成比、相對比計數(shù)資料的統(tǒng)計推斷總體參數(shù)估計: P±uαSp率的假設(shè)檢驗: 樣本率與總體率的比較 -- u檢驗兩個大樣本率的比較 -- u檢驗兩個樣本率的比較 -- χ2檢驗配 對設(shè)計資 料的兩個率比 較 -- χ2檢驗多個 樣 本率的比 較 -- R×C表的 χ2檢驗假 設(shè)檢驗 的基本步 驟 完全相同統(tǒng)計資料處理的基本思路資料的整理 : 統(tǒng)計圖,統(tǒng)計表統(tǒng)計資料的描述 (描述指標)統(tǒng)計學推斷總體參數(shù)的估計(可信區(qū)間)假設(shè)檢驗 統(tǒng)計資料類型的判斷例 1. 某研究者欲比較甲乙兩藥治療高血壓的效果 ,進行了隨機對照試驗 .甲乙藥組各選擇了 50名病人 ,甲藥組血壓平均下降了 10.67mmHg,標準差是 3.27mmHg, 乙藥組平均下降了 13.20mmHg,標準差是 4.33mmHg. 問兩藥降壓效果是否不同 ?例 2. 為調(diào)查 2型糖尿病發(fā)病易感因素 ,某研究者進行了一項以醫(yī)院為基礎(chǔ)的病例對照研究 .結(jié)果發(fā)現(xiàn) ,在 200名糖尿病病例中 , 100人有糖尿病遺傳家族史 ;而 200名對照者中只有 50人有糖尿病家族史 .問糖尿病家族史是否在兩組中分布不同 ?例 3. 為比較 A,B,C,D四種藥物治療小細胞肺癌的效果 ,將 160人隨機分配進入四個治療組 .每組 40人 .治療結(jié)果見下表 ,試比較四種藥物治療效果有無差別 ?處理組 有效 無效 合計 . A 藥 15 25 40B 藥 10 30 40C 藥 13 27 40D 藥 8 32 40合計 46 114 160 .例 4. 用 A、 B兩種不同的方法對 58例系統(tǒng)紅斑狼瘡患者血清中的抗體進行測定,資料見下表,問兩種檢測結(jié)果有無差別 ?A 法 + -B 法 合計+ 11 12 23- 2 33 35合計 13 45 58 .例 5. 為研究鉛作業(yè)與工人尿鉛含量的關(guān)系 ,隨機抽查了 3種作業(yè)工人的尿鉛結(jié)果,見下表 .問 3種作業(yè)工人的尿鉛含量是否不同 ?鉛 作業(yè)組 調(diào)離鉛作業(yè)組 非鉛作業(yè)組 .0.01 0.11 0.090.16 0.23 0.020.24 0.18 0.050.18 0.14 0.020.28 0.20 0.010.14 0.12 0.10- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
20 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 分類 變量 資料 統(tǒng)計分析 ppt 課件
鏈接地址:http://m.italysoccerbets.com/p-278841.html