培訓(xùn)資料--spss統(tǒng)計(jì)軟件培訓(xùn)數(shù)據(jù)分析
-
資源ID:22240629
資源大?。?span id="w1q5531" class="font-tahoma">1.09MB
全文頁(yè)數(shù):24頁(yè)
- 資源格式: PPT
下載積分:9.9積分
快捷下載
會(huì)員登錄下載
微信登錄下載
微信掃一掃登錄
友情提示
2、PDF文件下載后,可能會(huì)被瀏覽器默認(rèn)打開(kāi),此種情況可以點(diǎn)擊瀏覽器菜單,保存網(wǎng)頁(yè)到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請(qǐng)使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無(wú)水印,預(yù)覽文檔經(jīng)過(guò)壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標(biāo)題沒(méi)有明確說(shuō)明有答案則都視為沒(méi)有答案,請(qǐng)知曉。
|
培訓(xùn)資料--spss統(tǒng)計(jì)軟件培訓(xùn)數(shù)據(jù)分析
宿 昆重慶市疾控慢病所 統(tǒng)計(jì)描述均數(shù)比較:t檢驗(yàn)、方差分析2 檢驗(yàn)簡(jiǎn)單線性回歸二分類Logistic回歸基于秩次的非參數(shù)檢驗(yàn) 連續(xù)變量的統(tǒng)計(jì)描述分類變量的統(tǒng)計(jì)描述 集中趨勢(shì):算術(shù)均數(shù)、中位數(shù)、幾何均數(shù)、眾數(shù)、調(diào)和均數(shù)等。離散趨勢(shì):全距、方差和標(biāo)準(zhǔn)差、百分位數(shù)、四分位數(shù)/間距、變異系數(shù)。分布特征:對(duì)正態(tài)分布而言,偏度系數(shù)和峰度系數(shù)等。其他趨勢(shì):?jiǎn)畏?、雙峰、對(duì)稱、偏態(tài) 算術(shù)均數(shù): 用于描述服從正態(tài)分布的變量值的平均水平。中位數(shù): 用于描述服從偏態(tài)分布資料的平均水平。幾何均數(shù): 用于描述等比或等差數(shù)列變量值的平均水平。方差:主要用于正態(tài)分布資料;標(biāo)準(zhǔn)差:主要用于正態(tài)分布資料;四分位數(shù)間距:主要用于偏態(tài)分布資料(QP75P25 ); 變異系數(shù):用于度量單位不同或均數(shù)相差懸殊的資料。 SPSS中的相應(yīng)功能:“頻率”過(guò)程 SPSS中的相應(yīng)功能:“描述”過(guò)程 SPSS中的相應(yīng)功能:“探索”過(guò)程 頻數(shù)分布情況的描述:絕對(duì)頻數(shù)、百分比集中趨勢(shì)的描述:眾數(shù)使用相對(duì)數(shù)進(jìn)行深入描述:比、構(gòu)成比、率SPSS中的相應(yīng)功能:“頻率”過(guò)程、“描述”過(guò)程和“探索”過(guò)程 完全隨機(jī)化設(shè)計(jì)單組計(jì)量資料的均數(shù)與總體均數(shù)比較的t檢驗(yàn)?zāi)硞€(gè)小區(qū)1000個(gè)6歲男孩的身高與重慶市所有6歲男孩的身高平均值的比較配對(duì)設(shè)計(jì)兩組相關(guān)計(jì)量資料均數(shù)間比較的t檢驗(yàn)自身配對(duì):如治療前后某項(xiàng)指標(biāo)比較。異體配對(duì):如對(duì)兩只兔子兩種處理方法的結(jié)果比較。完全隨機(jī)化設(shè)計(jì)兩組獨(dú)立計(jì)量資料均數(shù)間比較的t檢驗(yàn)如男女BMI比較完全隨機(jī)化設(shè)計(jì)多組獨(dú)立計(jì)量資料均數(shù)間比較的單因素ANOVA如比較不同鄉(xiāng)鎮(zhèn)BMI 完全隨機(jī)設(shè)計(jì)的單樣本計(jì)數(shù)資料的率/構(gòu)成比與已知總體率/構(gòu)成比比較完全隨機(jī)設(shè)計(jì)的兩(多)獨(dú)立樣本計(jì)數(shù)資料的率(構(gòu)成比)比較配對(duì)設(shè)計(jì)的兩組相關(guān)樣本計(jì)數(shù)資料的率/構(gòu)成比比較與Kappa一致性檢驗(yàn)完全隨機(jī)設(shè)計(jì)的分層2檢驗(yàn) 回歸的最初含義:生物學(xué)含義 英國(guó)的遺傳學(xué)家F.Galton和K.Pearson注意到一個(gè)有趣的現(xiàn)象,即父親高,兒子也高,父親矮,兒子也矮,但兒子的身高離平均水平更近些,即子代身高有向人群的平均身高回歸(regression to the mean)的趨勢(shì),這就是“回歸”的生物學(xué)內(nèi)涵,Galton稱該現(xiàn)象為“普遍回歸法則(law of universal regression)”。這是很自然的,否則,豈不一代比一代無(wú)限制地遠(yuǎn)離平均值,導(dǎo)致身高兩級(jí)分化?回歸的現(xiàn)在含義:完全不同了,回歸分析是研究事物或現(xiàn)象之間的數(shù)量依存關(guān)系,控制/預(yù)測(cè) 模型: iii XY i ii bXaY ( 隨 機(jī) 誤 差 ) 線性回歸分析的一般步驟(1)確定因變量和自變量(2)繪制散點(diǎn)圖(3)從樣本數(shù)據(jù)出發(fā)確定變量之間的數(shù)學(xué)關(guān)系式,并對(duì)回歸方程的各個(gè)參數(shù)進(jìn)行估計(jì).(4)對(duì)回歸方程進(jìn)行各種統(tǒng)計(jì)檢驗(yàn).:回歸方程的顯著性檢驗(yàn);擬合優(yōu)度檢驗(yàn);殘差(Y的估計(jì)值與實(shí)測(cè)值的差)分析(y/殘差-x/X or )(5)利用回歸方程進(jìn)行預(yù)測(cè)與控制; 相關(guān)(correlation)與回歸(regression)簡(jiǎn)介在大量的醫(yī)學(xué)研究中還需要對(duì)兩個(gè)變量之間的關(guān)系進(jìn)行量化研究,一是確定兩個(gè)變量間是否有聯(lián)系及聯(lián)系的程度如何,二是定量地確定它們之間的互依關(guān)系,相關(guān)與回歸就是研究這種關(guān)系的統(tǒng)計(jì)方法。變量間的關(guān)系(1)函數(shù)關(guān)系(確定性關(guān)系):如:圓面積和圓半徑.(2)統(tǒng)計(jì)關(guān)系(非確定性關(guān)系):不象函數(shù)關(guān)系那樣直接,但卻普遍存在,且有強(qiáng)有弱, 如:身高與體重. (變異)相關(guān)和回歸分析的研究對(duì)象:統(tǒng)計(jì)關(guān)系 Logistic回歸:應(yīng)變量為分類變量,自變量: 連續(xù)/分類變量,研究該分類變量與一組自變量之間的關(guān)系0/1:治愈/未治愈,或患病/未患病有序分類:治愈/好轉(zhuǎn)/未治愈無(wú)序分類:腺癌、鱗癌、大細(xì)胞癌 模型中參數(shù)的意義0為常數(shù)項(xiàng):自變量取值全為0時(shí)的基線狀況,未必有實(shí)際意義i為偏回歸系數(shù),代表固定其它Xj時(shí),Xi改變一個(gè)單位引起logit(P)平均值的改變量當(dāng)其它自變量(Xj)取值保持不變時(shí), Xi取值增加一個(gè)單位引起OR自然對(duì)數(shù)值的變化量,因此在使用上OR值要遠(yuǎn)比i本身更常用iORPPPP ln)1/()1 ln( 1111 啞變量 偏回歸系數(shù)表示其它自變量Xj不變,Xi每改變一個(gè)單位,所導(dǎo)致logitP的平均變化量x為連續(xù)性/二分類變量:沒(méi)有問(wèn)題x為多分類變量:不太合適無(wú)序多分類:民族,各族之間不存在大小問(wèn)題有序多分類:家庭收入分為高、中、低三檔,它們之間的差距無(wú)法準(zhǔn)確衡量在以上這些情況時(shí),我們就必須將原始的多分類變量轉(zhuǎn)化為數(shù)個(gè)啞變量(Dummy Variable), 啞變量每個(gè)啞變量只代表某兩個(gè)級(jí)別或若干個(gè)級(jí)別間的差異,這樣得到的回歸結(jié)果才能有明確而合理的實(shí)際意義對(duì)于取值具有n個(gè)水平的自變量Xi,可以生成n-1個(gè)啞變量模型中啞變量遵循“同進(jìn)同出” 的原則 完全隨機(jī)化設(shè)計(jì)單組樣本的基于秩次的非參數(shù)檢驗(yàn)完全隨機(jī)設(shè)計(jì)兩組獨(dú)立樣本的基于秩次的非參數(shù)檢驗(yàn)配對(duì)設(shè)計(jì)兩組相關(guān)樣本的基于秩次的非參數(shù)檢驗(yàn)完全隨機(jī)設(shè)計(jì)多組獨(dú)立樣本的基于秩次的非參數(shù)檢驗(yàn)