畢業(yè)設(shè)計(jì)(論文) 腎炎診斷問題
《畢業(yè)設(shè)計(jì)(論文) 腎炎診斷問題》由會(huì)員分享,可在線閱讀,更多相關(guān)《畢業(yè)設(shè)計(jì)(論文) 腎炎診斷問題(32頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、 腎炎診斷問題 一.問題重述 1 二.問題分析 2 2-1 問題一分析 2 2-2 問題二分析 3 2-3 問題三分析 3 2-4 問題四分析 3 2-5 問題五分析 3 三.模型假設(shè)與符號(hào)說明 4 3-1 假設(shè) 4 3-2 符號(hào)說明 4 四.模型的建立與求解 4 4-1 問題一的模型及求解 5 4-1-1模型建立與求解 5 模型Ⅰ:兩類總體fisher判別法 5 模型Ⅱ:BP誤差反傳神經(jīng)網(wǎng)絡(luò)判別法 8 4-1-2 模型檢驗(yàn)與結(jié)果分析 9 4-1-3模型評(píng)價(jià) 11 4-2 問題二求解與分析 11 4-2-1:問題二的模型建
2、立與求解 11 4-2-2:問題二的計(jì)算結(jié)果與分析 13 4-3 問題三建模與求解 13 4-3-1:問題三的模型建立與求解 13 4-3-2:主成分分析模型的結(jié)果檢驗(yàn)與分析 15 4-4 問題四求解與分析 16 4-5 關(guān)于問題二和問題四的結(jié)果分析與改進(jìn) 17 4-5-1 結(jié)果分析 17 4-5-2 模型修正 17 五.關(guān)于腎炎檢測問題的進(jìn)一步討論及模型的推廣 18 六.參考文獻(xiàn) 19 七.附錄 19 附錄一:化驗(yàn)結(jié)果 19 附錄二:部分程序代碼 22 一.問題重述 人們到醫(yī)院就診時(shí),通常要化驗(yàn)一些指標(biāo)來協(xié)助醫(yī)生的診斷。診斷就診人員是否患腎炎時(shí)通常要化驗(yàn)人體
3、內(nèi)各種元素含量。表B.1(見附錄一)是確診病例的化驗(yàn)結(jié)果,其中1-30號(hào)病例是已經(jīng)確診為腎炎病人的化驗(yàn)結(jié)果;31-60號(hào)病例是已經(jīng)確定為健康人的結(jié)果。表B.2(見附錄一)是就診人員的化驗(yàn)結(jié)果。我們的問題是: 問題一:根據(jù)表B.1中的數(shù)據(jù),提出一種或多種簡便的判別方法,判別屬于患者或健康人的方法,并檢驗(yàn)?zāi)闾岢龇椒ǖ恼_性。 問題二:按照問題一中提出的方法,判斷表B.2中的30名就診人員的化驗(yàn)結(jié)果進(jìn)行判別,判定他(她)們是腎炎病人還是健康人。 問題三:能否根據(jù)表B.1的數(shù)據(jù)特征,確定哪些指標(biāo)是影響人們患腎炎的關(guān)鍵或主要因素,以便減少化驗(yàn)的指標(biāo)。 問題四:根據(jù)問題三的結(jié)果,重復(fù)問題二中的工作
4、。 問題五:對(duì)問題二和問題四的結(jié)果作進(jìn)一步的分析。 二.問題分析 2-1 問題一分析 該問要求根據(jù)表B.1中的數(shù)據(jù),提出一種或多種簡便的判別方法,判別屬于患者或健康人的方法,并檢驗(yàn)所提出方法的正確性。 模型Ⅰ:表中展示了Zn, Cu,F(xiàn)e,Ca,Mg,K, Na七種元素在確診病人中的含量,要想通過這七個(gè)觀測指標(biāo)判斷某病人健康與否,首先,應(yīng)分別用變量表示這七個(gè)觀測指標(biāo),然后建立一個(gè)含有這七個(gè)變量的判別函數(shù),通過將觀測值帶入函數(shù)計(jì)算出一個(gè)結(jié)果,找出一個(gè)固定的判別方法,判斷所得結(jié)果屬于哪一類。這是一個(gè)典型的兩類總體判別問題??紤]到觀測數(shù)據(jù)有限,為達(dá)到最佳的利用效果,也為了更加科學(xué)合理,
5、在計(jì)算過程中,我們選取了四十組觀測數(shù)據(jù),采用fisher判別法建立模型并求解判別函數(shù),再用余下的二十組觀測數(shù)據(jù)進(jìn)行檢驗(yàn),得出該模型的準(zhǔn)確性,并對(duì)結(jié)果進(jìn)行可靠性分析。 模型Ⅱ:我們可以利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練的方法判定就診人員是否患病。將患者與健康者的指標(biāo)進(jìn)行訓(xùn)練,在建立模擬仿真網(wǎng)絡(luò)對(duì)待測樣本進(jìn)行模擬,從而作出診斷。本問以表1中的樣本,對(duì)樣本進(jìn)行0-1 規(guī)劃,以0表示健康人,以1表示腎炎患者,利用MATLAB軟件對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行編程求解。并對(duì)剩下的10 名健康人和10 名腎炎患者進(jìn)行了判定檢驗(yàn)(如圖4 所示) . 最后,還需要對(duì)兩個(gè)模型進(jìn)行綜合分析考慮,主要結(jié)合模型求解的準(zhǔn)確性及實(shí)用性,進(jìn)
6、行誤差比較,綜合分析等,以選出最優(yōu)模型,進(jìn)行后面問題的求解。 2-2 問題二分析 該問要求按照問題一中提出的方法,對(duì)表B.2中的30名就診人員的化驗(yàn)結(jié)果進(jìn)行判別,判定他(她)們是腎炎病人還是健康人。 通過第一問的求解,已經(jīng)有了一個(gè)能較為準(zhǔn)確地判別一個(gè)人是否患有腎炎的方法,在此問中,就只需把表B.2中的30名就診人員的化驗(yàn)結(jié)果與一問中的兩個(gè)模型進(jìn)行對(duì)應(yīng),帶入求解,根據(jù)模型的使用方法,就能判定他(她)們是腎炎病人還是健康人。 2-3 問題三分析 本問要求根據(jù)確診病例的化驗(yàn)結(jié)果的數(shù)據(jù)特征,確定哪些指標(biāo)是影響腎炎診斷的關(guān)鍵或主要因素,以便減少化驗(yàn)指標(biāo)。為此,我們建立了樣本主成分分析模型進(jìn)
7、行分析,利用降維的思想,將多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo),即主成分。該模型以各主成分對(duì)原始變量方差貢獻(xiàn)的大小為標(biāo)準(zhǔn)對(duì)其進(jìn)行排序,并求出其貢獻(xiàn)率。一般情況下,當(dāng)p個(gè)變量的累計(jì)貢獻(xiàn)率超過85%時(shí),就能確定需要提取的主成分個(gè)數(shù)為p。再將載荷矩陣的轉(zhuǎn)置乘以由挑選出的各主成分貢獻(xiàn)率所構(gòu)成的矩陣,得出每個(gè)指標(biāo)的重要性,絕對(duì)值越大表明其對(duì)腎炎診斷的影響越大。從而依次選出這q個(gè)主要指標(biāo),達(dá)到簡化分析的作用。為減少工作量,在驗(yàn)證模型準(zhǔn)確率時(shí),我們只選取了模型Ⅰ,按照一問中的方法建立模型,進(jìn)行判別并檢驗(yàn)正確率。 2-4 問題四分析 本問題與二問相同,也是要求對(duì)表B.2中的30名就診人員的化驗(yàn)結(jié)果進(jìn)行判別,判定他(
8、她)們是腎炎病人還是健康人,且采用的模型和判別方法與二問中相同,不同點(diǎn)在于帶入模型的觀測指標(biāo)數(shù)量有所變化。經(jīng)過第三問的建模與求解,判定一個(gè)人是否患腎炎的指標(biāo)減少了,只保留幾個(gè)關(guān)鍵因素,這樣,判別模型得到進(jìn)一步簡化,在對(duì)就診人員進(jìn)行判定的時(shí)候就更加便捷。 2-5 問題五分析 本問題要求對(duì)第二問和第四問的結(jié)果進(jìn)行分析。與第二問相比,第四問中的求解過程只考慮了幾個(gè)關(guān)鍵因素,而不是全部七個(gè)指標(biāo),化驗(yàn)指標(biāo)的減少必然會(huì)使就診成本降低,看病效率提高,但更重要的是要保證診斷結(jié)果與之前一致,否則就會(huì)影響診斷的準(zhǔn)確性。通過這一問的分析,就能判斷第四問所取的關(guān)鍵因素是否具有足夠的代表性。如果結(jié)果分析一致,則說明
9、所選因素能準(zhǔn)確判斷一個(gè)人是否患有腎炎;如果不一致,則分析偏差出現(xiàn)的原因,并重復(fù)第四問的工作,重新確定主要因素。在此基礎(chǔ)上就影響腎炎診斷的主要因素談?wù)勅绾斡行У剡M(jìn)行腎炎診斷,分析模型的推廣。 三.模型假設(shè)與符號(hào)說明 3-1 假設(shè) 1)題中所給的內(nèi)容和數(shù)據(jù)都是真實(shí)可信的,確診病例情況(患病或是健康)都是準(zhǔn)確無誤的; 2)除了表中列出的元素外,其他元素對(duì)是否會(huì)患腎炎的影響很小; 3)沒病的個(gè)體都是健康體; 4)忽略人體內(nèi)其它元素對(duì)問題中七種元素含量的影響; 5)化驗(yàn)結(jié)果中每個(gè)元素的值之間沒有影響; 6)假設(shè)醫(yī)生不會(huì)僅僅依靠化驗(yàn)結(jié)果對(duì)患病情況作出最終判斷,化驗(yàn)僅僅作為醫(yī)生診斷的一
10、種輔助手段,所以化驗(yàn)結(jié)果單方面的現(xiàn)實(shí)結(jié)果可以跟實(shí)際有一定程度的偏差。 7)兩總體腎炎病人和非腎炎病人化驗(yàn)結(jié)果中各元素的期望值,標(biāo)準(zhǔn)差和由數(shù) 據(jù)給出的樣本的統(tǒng)計(jì)量是一致的。 3-2 符號(hào)說明 : 第一類總體,即表B.1中1至30號(hào)病例所組成的總體 : 第二類總體,即表B.1中31至60號(hào)病例所組成的總體 : 第一類總體中第i個(gè)觀測指標(biāo) : 第二類總體中第i個(gè)觀測指標(biāo) : 第i個(gè)觀測指標(biāo)的均值 : 第i個(gè)觀測指標(biāo)的系數(shù) 除模型Ⅱ以外,所有檢測結(jié)果中,1表示患有腎炎,2表示健康。 四.模型的建立與求解 4-1 問題一的模型及求解 4-1-1模型建立與
11、求解 模型Ⅰ:兩類總體fisher判別法 1) 取全部七個(gè)觀測變量,構(gòu)造判別函數(shù): 其中,系數(shù) 確定的原則是使兩組間的區(qū)別最大,而使每個(gè)組內(nèi)部的離差最小。 2) 從表B.1中的兩個(gè)總體 中分別抽取20個(gè)樣本,每個(gè)樣本都觀測全部七個(gè)指標(biāo),得 表一:樣本觀測值 總體 病例號(hào) Zn Cu Fe Ca Mg K Na 1 166 15.8 24.5 700 112 179 513 2 185 15.7 31.5 701 125 184 427 3 193 9.8 25.9 541 163 128 642
12、4 159 14.2 39.7 896 99.2 239 726 5 226 16.2 23.8 606 152 70.3 218 6 171 9.29 9.29 307 187 45.5 257 7 201 13.3 26.6 551 101 49.4 141 8 147 14.5 30 659 102 154 680 9 172 8.85 7.86 551 75.7 98.4 318 10 156 11.5 32.5 639 107 103 552 11 132 15.9
13、17.7 578 92.4 1314 1372 12 182 11.3 11.3 767 111 264 672 13 186 9.26 37.1 958 233 73 347 14 162 8.23 27.1 625 108 62.4 465 15 150 6.63 21 627 140 179 639 16 159 10.7 11.7 612 190 98.5 390 17 117 16.1 7.04 988 95.5 136 572 18 181 10.1 4.04 1437
14、 184 101 542 19 146 20.7 23.8 1232 128 150 1092 20 42.3 10.3 9.7 629 93.7 439 888 31 213 19.1 36.2 2220 249 40 168 32 170 13.9 29.8 1285 226 47.9 330 33 162 13.2 19.8 1521 166 36.2 133 34 203 13 90.8 1544 162 98.9 394 35 167 13.1 14.1 2278 2
15、12 46.3 134 36 164 12.9 18.6 2993 197 36.3 94.5 37 167 15 27 2056 260 64.6 237 38 158 14.4 37 1025 101 44.6 72.5 39 133 22.8 31 1633 401 180 899 40 156 135 322 6747 1090 228 810 41 169 8 308 1068 99.1 53 289 42 247 17.3 8.65 2554 241 77.9 373
16、 43 166 8.1 62.8 1233 252 134 649 44 209 6.43 86.9 2157 288 74 219 45 182 6.49 61.7 3870 432 143 367 46 235 15.6 23.4 1806 166 68.8 188 47 173 19.1 17 2497 295 65.8 287 48 151 19.7 64.2 2031 403 182 874 49 191 65.4 35 5361 392 137 688 50 223
17、 24.4 86 3603 353 97.7 479 將屬于不同總體的樣本帶入判別函數(shù),得 對(duì)以上兩組等式分別左右相加,再除以相應(yīng)的樣品個(gè)數(shù),則有 第一組樣品的“重心” 第二組樣品的“重心” 為使判別函數(shù)能很好地區(qū)別來自不同總體的樣品,則需滿足: (1)來自不同總體的兩個(gè)平均值 相差越大越好。 (2)對(duì)于來自第一個(gè)總體的,他們的離差平方和越小越好,同樣越小越好。 綜上兩點(diǎn),就是要求 越大越好。 利用微積分求極值的必要條件,求得可使I達(dá)到最大的。求解過程
18、如下 計(jì)算量總體間的離差矩陣S 其中 可以證明,最有判斷系數(shù)為如下方程的解 即 利用MATLAB軟件編程(見附錄二)計(jì)算,結(jié)果見表二。 3) 求臨界值,在兩總體先驗(yàn)概率相等的假設(shè)下,取為的加權(quán)平均值 = -0.1131 模型Ⅱ:BP誤差反傳神經(jīng)網(wǎng)絡(luò)判別法 1.首先建立BP神經(jīng)網(wǎng)絡(luò)模型。 神經(jīng)網(wǎng)絡(luò)模型是單個(gè)并行處理的集合,BP神經(jīng)網(wǎng)絡(luò)采用監(jiān)督學(xué)習(xí)方式,在網(wǎng)絡(luò)投入使用前使用一個(gè)樣本數(shù)據(jù)集來訓(xùn)練神功神經(jīng)網(wǎng)絡(luò)。如圖二,學(xué)習(xí)過程由正向傳播和反向傳播組成。在正向傳播過程中,輸入信號(hào)從輸入層經(jīng)隱層單元逐層處理,并傳向輸出層,每一層神經(jīng)元的狀態(tài)只影響
19、下一層神經(jīng)元的狀態(tài)。如果在輸出層得不到期望的輸出,則轉(zhuǎn)入反向傳播,將輸出信號(hào)的誤差沿原來的連接通絡(luò)返回。通過修改各層神經(jīng)元的權(quán)值,使得誤差信號(hào)最小。學(xué)習(xí)算法如圖一所示。 圖一:學(xué)習(xí)算法框圖 圖二:BP神經(jīng)網(wǎng)絡(luò)示意圖 根據(jù)題設(shè),把表一中的20個(gè)患者和20個(gè)健康人的七項(xiàng)指標(biāo)作為輸入項(xiàng),以407的矩陣輸入,再以0/1代換的思想,患病看作是1,健康看作0,以110的矩陣為目標(biāo)輸出。通過訓(xùn)練,不斷修改權(quán)值,得出最終結(jié)果。 2.模型的求解 1)能量函數(shù)選取 平方型誤差函數(shù)為 2)隱層數(shù)取1,隱層單元數(shù)取7 3)傳輸函數(shù)選取S型函數(shù) 通過M
20、ATLAB軟件,編寫程序(見附錄二),訓(xùn)練結(jié)果如圖所示 圖三:神經(jīng)網(wǎng)絡(luò)訓(xùn)練圖 4-1-2 模型檢驗(yàn)與結(jié)果分析 模型Ⅰ: 將表B.2中余下的二十組觀測數(shù)據(jù)帶入判別函數(shù)進(jìn)行求值,由于,當(dāng)觀測樣品帶入判別函數(shù)后, 若,則判定為第一組,即該就診人員患有腎炎; 若 ,則判定為第二組,即該就診人員健康。 判別結(jié)果如表二所示: 表二:fisher模型檢驗(yàn)結(jié)果 病例號(hào) y值 臨界值 判斷類別 原類別 21 0.034 -0.1131 1 1 22 -0.0224 1 1 23 -0.0903 1 1 24 -
21、0.0026 1 1 25 -0.0814 1 1 26 -0.0004 1 1 27 -0.0176 1 1 28 0.0095 1 1 29 -0.0118 1 1 30 -0.0027 1 1 51 -0.2704 2 2 52 -0.1845 2 2 53 -0.1589 2 2 54 -0.1529 2 2 55 -0.3043 2 2 56 -0.2511 2 2 57 -0.3262 2 2 58 -0.1802 2 2 59 -0.1561 2 2 60
22、 -0.1056 1 2 在二十組數(shù)據(jù)中,僅有一組發(fā)生了誤判,為60號(hào)病例??傻迷撃P偷恼_率為95% 模型Ⅱ: 運(yùn)用以上求解所得神經(jīng)網(wǎng)絡(luò),對(duì)21至30號(hào),51至60號(hào)數(shù)據(jù)進(jìn)行判別,檢驗(yàn)結(jié)果如下圖所示: 可以看出,僅有第七組數(shù)據(jù)發(fā)生了誤判,正確率同樣為95%。 由于建模過程中使用的四十組觀測數(shù)據(jù)與檢驗(yàn)時(shí)所用的20組數(shù)據(jù)不重復(fù),有效地避免了數(shù)據(jù)間的相互影響,彼此獨(dú)立,因而檢驗(yàn)結(jié)果具有很強(qiáng)的可靠性,同時(shí),95%的準(zhǔn)確率也符合要求,因此可以這兩個(gè)模型對(duì)就診人員進(jìn)行判別。 4-1-3模型評(píng)價(jià) 模型優(yōu)點(diǎn): 本問所建立的兩個(gè)模型簡單易懂,對(duì)總體的分布類型沒有要求,都能
23、夠較為準(zhǔn)確地解決該腎炎診斷問題,由題中所給數(shù)據(jù),計(jì)算結(jié)果準(zhǔn)確率都達(dá)到了95%。其中,BP神經(jīng)網(wǎng)絡(luò)能通過學(xué)習(xí)帶正確答案的實(shí)例集自動(dòng)提取“合理的”求解規(guī)則,即具有自學(xué)習(xí)能力。兩個(gè)模型在生活中的應(yīng)用都很廣,可移植性強(qiáng)。.模型的計(jì)算采用專業(yè)的數(shù)學(xué)軟件,可信度較高; 模型缺點(diǎn): 1)選取的樣本個(gè)體數(shù)目較少,不能有效的反映模型的準(zhǔn)確度; 2)假設(shè)患腎炎的決定因素只是題目所給的七項(xiàng)指標(biāo),顯然與實(shí)際不符; 4-2 問題二求解與分析 4-2-1:問題二的模型建立與求解 模型Ⅰ: 選取的fisher模型,對(duì)30位就診人員進(jìn)行判別,不需再建立模型,只需按照要求,依次把30個(gè)樣本帶入計(jì)算,利用MATLA
24、B軟件編程(見附錄二程序4),可得判別函數(shù)的最優(yōu)解及判別函數(shù) 根據(jù)判別原則,得到表三。 表三:fisher模型判別表 病例號(hào) y值 判定類別 病例號(hào) y值 判定類別 61 0.0216 1 76 0.0144 1 62 -0.033 1 77 -0.0807 2 63 -0.061 2 78 -0.08 2 64 0.0489 1 79 -0.0056 1 65 -0.0215 1 80 -0.1651 2 66 -0.0605 2 81 -0.2184 2 67 -0.1124 2 82
25、-0.1539 2 68 -0.0154 1 83 0.0704 2 69 0.001 1 84 -0.0919 2 70 -0.1396 2 85 0.0356 1 71 0.0165 1 86 -0.1253 2 72 0.0502 1 87 -0.0398 1 73 0.024 1 88 -0.2159 2 74 -0.093 2 89 -0.3878 2 75 -0.045 1 90 -0.0792 2 模型Ⅱ: 利用問題一中所建的BP神經(jīng)網(wǎng)絡(luò)模型,通過MATLAB編程可得表
26、B.2中就診人員的判定結(jié)果,如下表: 表三:三組數(shù)據(jù)判別表 病例號(hào) 模型Ⅰ 模型Ⅱ 61 患病 患病 62 患病 患病 63 健康 健康 64 患病 患病 65 患病 患病 66 健康 健康 67 健康 患病 68 患病 患病 69 患病 患病 70 健康 健康 71 患病 患病 72 患病 患病 73 患病 患病 74 健康 健康 75 患病 健康 76 患病 患病 77 健康 健康 78 健康 健康 79 患病 健康 80 健康 患病 81 健康 健康 8
27、2 健康 患病 83 健康 健康 84 健康 健康 85 患病 患病 86 健康 健康 87 患病 患病 88 健康 健康 89 健康 健康 90 健康 健康 4-2-2:問題二的計(jì)算結(jié)果與分析 分析表三,兩個(gè)模型所得結(jié)果中只有67,75,79號(hào)三組數(shù)據(jù)不同,相似度達(dá)到90%,再次驗(yàn)證了兩個(gè)模型對(duì)于該診斷問題的準(zhǔn)確性。因此,這兩個(gè)模型都具有很強(qiáng)的實(shí)用性。. 4-3 問題三建模與求解 4-3-1:問題三的模型建立與求解 1.對(duì)表 B.1 中數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理. 計(jì)算表B.1 中的樣本的均值,方差,并作標(biāo)準(zhǔn)化變換,再求得標(biāo)準(zhǔn)化變換
28、后的樣本協(xié)方差矩陣S,求解過程如下: 1)樣本均值: 2)樣本方差: 3)標(biāo)準(zhǔn)變換: 4)變換后的協(xié)方差矩陣: 在本題中,協(xié)方差陣S如下表示: 2.用所求得的協(xié)方差矩陣代替總體協(xié)方差矩陣,計(jì)算S的所有特征根及相應(yīng)的特征向量,并按的大小順續(xù)排列(見表四)。 3.計(jì)算主成分的貢獻(xiàn)率及累計(jì)貢獻(xiàn)率及載荷。 1) 貢獻(xiàn)率: 2) 累計(jì)貢獻(xiàn)率 3) 計(jì)算主成分載荷 其中,rij(i,j=1,2,…,p)為原來變量xi與xj的相關(guān)系數(shù),在此問中與協(xié)方差矩陣值相同。 由MATLAB編程(見附錄二程序)可得, 表五:主成分分析表 成分
29、數(shù) 特征根 貢獻(xiàn)率 累計(jì)貢獻(xiàn)率 6 2.4254 0.3465 0.3465 7 1.6687 0.2384 0.5849 5 1.2026 0.1718 0.7567 4 0.7947 0.1135 0.8702 3 0.4793 0.0685 0.9387 2 0.1602 0.0384 0.9771 1 0.2691 0.0229 1.0000 一般情況下,當(dāng)前r個(gè)主成分累計(jì)貢獻(xiàn)率達(dá)到85%以上便可以確定其為關(guān)鍵因素。由表五中的結(jié)果可知,前四個(gè)主成分的累計(jì)貢獻(xiàn)率已達(dá)到87.02%,由此可以確定主成分個(gè)數(shù)為四個(gè),計(jì)算對(duì)
30、應(yīng)的載荷矩陣,得, 為準(zhǔn)確取出影響人們患腎炎的關(guān)鍵因素,以四個(gè)主成分的貢獻(xiàn)率作為權(quán)重,與載荷矩陣p的轉(zhuǎn)置相乘,得出能真正反映各變量重要性的值。即取出的前四個(gè)值,記為,計(jì)算 得到一個(gè)17的矩陣: 取絕對(duì)值最大的四個(gè)指標(biāo),依次為 由此可以提取四個(gè)主成分分別別為:Zn Ca Mg K 4-3-2:主成分分析模型的結(jié)果檢驗(yàn)與分析 根據(jù)主成分分析模型的結(jié)果,我們已得出了Zn Ca Mg K在人體中的含量是腎炎診斷中的關(guān)鍵因素,也就是說,我們?cè)诮isher模型,求解判別方程時(shí),只需要把變量數(shù)據(jù)挑出考慮就行,這樣,求解時(shí)運(yùn)算量減少了,只需從兩個(gè)總體 中各抽取20個(gè)樣品,每個(gè)樣品觀測4
31、個(gè)指標(biāo),得到的觀測值如表所示。 (1)建立判別式.經(jīng)計(jì)算得到y(tǒng)值如表五所示。 (2)求判別臨界值,對(duì)于所給樣品判別分類。 由于 ,當(dāng)樣品帶入判別函數(shù)后,若,則判定為第一組,即該就診人員患?。蝗?,則判定為第二組,即該就診人員健康。 檢驗(yàn)結(jié)果如表五所示。 表六:主成分分析驗(yàn)證表 病例號(hào) y值 臨界值 判斷類別 原類別 21 0.0841 -0.047 1 1 22 0.0749 1 1 23 -0.0304 1 1 24 0.0122 1 1 25 -0.0407 1 1 26 0.0771 1
32、1 27 0.0076 1 1 28 0.0805 1 1 29 0.0321 1 1 30 0.0581 1 1 51 -0.2315 2 2 52 -0.0949 2 2 53 -0.0857 2 2 54 -0.1146 2 2 55 -0.2861 2 2 56 -0.2303 2 2 57 -0.2685 2 2 58 -0.1502 2 2 59 -0.1195 2 2 60 -0.0376 1 2 經(jīng)計(jì)算,可得出正確率為95%,與一問中沒去除任何因
33、素時(shí)的正確率相同,因此,就此項(xiàng)指標(biāo)而言判別結(jié)果好。 4-4 問題四求解與分析 由于在做主成分分析模型檢驗(yàn)時(shí)已經(jīng)用表一數(shù)據(jù)求得判別函數(shù),且通過對(duì)余下的二十組數(shù)據(jù)的檢測可知,該判別函數(shù)的準(zhǔn)確率為95%,滿足條件。故計(jì)算時(shí)不用重新求解,直接將表B.2中的數(shù)據(jù)帶入判別式,算出結(jié)果,再與判別臨界值比較即可得出判別結(jié)果,如下表: 表七:主成分分析判別表 編號(hào) y值 臨界值 判定組別 原始結(jié)果果 編號(hào) y值 臨界值 判定組別 原始結(jié)果 61 1 -0.0412 -0.1055 1 1 76 -0.0972 -0.1055 1 1 6
34、2 2 -0.0689 1 1 77 -0.0966 1 2 63 3 -0.0874 1 2 78 18 -0.1181 2 2 64 4 -0.0315 1 1 79 19 -0.097 1 1 65 5 -0.0708 1 1 80 20 -0.1061 2 2 66 6 -0.0634 1 1 81 21 -0.1009 1 2 67 7 -0.1565 2 2 82 22 -0.116 2 2 68 8 -0.1078 2 1 83 -0.0763 1
35、 1 69 -0.0933 1 1 84 24 -0.1163 2 2 70 10 -0.1382 2 2 85 25 -0.0878 1 1 71 11 -0.0371 1 1 86 26 -0.1408 2 2 72 12 -0.0797 1 1 87 27 -0.1056 2 1 73 13 -0.0781 1 1 88 -0.1443 2 2 74 14 -0.133 2 2 89 29 -0.1515 2 2 75 15 -0.1074 2 1 90 30
36、 -0.1248 2 2 分析表中數(shù)據(jù),可知,患病的有14人,與問題二中的結(jié)果比較,可以再次檢驗(yàn)主成分分析法所得的結(jié)果是否準(zhǔn)確,具體分析見4-5. 4-5 關(guān)于問題二和問題四的結(jié)果分析與改進(jìn) 4-5-1 結(jié)果分析 通過對(duì)表六的分析,可以得出如下結(jié)論: 1) 提取四個(gè)主成分之后,雖然累計(jì)貢獻(xiàn)率已達(dá)87.02%,超過85%的最低要求,但是由表六的分析結(jié)果可知,與之前七個(gè)變量的預(yù)測結(jié)果相比,有6個(gè)判別結(jié)果不同,占所有觀測值的20%,差距太大,不能保證結(jié)果的一致性。因此,提取出的四個(gè)主成分不能作為診斷時(shí)的全部指標(biāo),應(yīng)對(duì)第三問的結(jié)果進(jìn)行修正。 2) 在第三問的主成分分析模型中,除了
37、用已確定類別的數(shù)據(jù)進(jìn)行檢驗(yàn)以外,還需要通過其他方式驗(yàn)證模型的準(zhǔn)確性。例如,本問通過對(duì)30組未確定類別的數(shù)據(jù)進(jìn)行類別判定,與提取前的判定結(jié)果相比,再次檢驗(yàn)?zāi)P偷臏?zhǔn)確性。 4-5-2 模型修正 通過以上分析,需要對(duì)問題二中的主成分模型進(jìn)行修正,再次對(duì)表四結(jié)果進(jìn)行分析。由于之前的四個(gè)主成分不能滿足要求,因此,需要把第五個(gè)主成分加上,提取出的主成分改為Zn Ca Mg K Cu 在人體中的含量。于是,把以上五個(gè)主成分分別記為,重復(fù)問題一中的步驟,同樣采用1到20號(hào),31到50號(hào)共40組數(shù)據(jù),運(yùn)用模型Ⅰ,求解判別函數(shù)和臨界值,結(jié)果如下: 表八:主成分分析判別表(修正后) 病例號(hào) y值
38、 臨界值 判斷類別 二問結(jié)果 病例號(hào) y值 臨界值 判斷類別 二問結(jié)果 1 -0.0278 -0.1131 1 1 16 -0.0561 -0.1131 1 1 2 -0.072 1 1 17 -0.1205 2 2 3 -0.1497 2 2 18 -0.1224 2 2 4 -0.0413 1 1 19 -0.0532 1 1 5 -0.0677 1 1 20 -0.194 2 2 6 -0.1009 1 2 21 -0.2496 2 2 7
39、 -0.1546 2 2 22 -0.177 2 2 8 -0.1206 2 1 23 -0.0522 1 1 9 -0.0609 1 1 24 -0.125 2 2 10 -0.2167 2 2 25 -0.0894 1 1 11 -0.0533 1 1 26 -0.2109 2 2 12 -0.0348 1 1 27 -0.1326 2 1 13 -0.044 1 1 28 -0.2272 2 2 14 -0.1753 2 2 29 -0.
40、3928 2 2 15 -0.1006 1 1 30 -0.1394 2 2 由上表可知,提取五個(gè)主成分作為主要因素后,對(duì)表B.2中的30組觀測值作判別,所得結(jié)果與提取前符合度較高,90%的判別結(jié)果相同,再次驗(yàn)證了五個(gè)主成分能夠代表原有的七個(gè)觀測指標(biāo),能夠獨(dú)立進(jìn)行腎炎判別。 五.關(guān)于腎炎檢測問題的進(jìn)一步討論及模型的推廣 在社會(huì)、經(jīng)濟(jì)、自然科學(xué)領(lǐng)域的研究中,人們經(jīng)常需要對(duì)某一研究對(duì)象的一些屬性進(jìn)行觀察和研究從而將其進(jìn)行適當(dāng)?shù)臍w類。例如,一個(gè)醫(yī)生要對(duì)病人病情進(jìn)行分析,以便判斷到底應(yīng)該使用何種手段治療,例如非典型肺炎與典型肺炎治療的方法就不相同。 經(jīng)濟(jì)管理人員要對(duì)產(chǎn)品進(jìn)
41、行分類,判別它的銷售情形屬于“暢銷”還是“滯銷”。植物學(xué)家要對(duì)一類植物進(jìn)行分析,昆蟲學(xué)家對(duì)一種蠓蟲的分類判別研究,地質(zhì)學(xué)家要對(duì)某一地層出現(xiàn)的巖芯進(jìn)行分類分析,上述事例與本文中的腎炎診斷問題類似。利用本文所選模型,取得大量數(shù)據(jù),便可通過已知的指標(biāo)建立最優(yōu)判別機(jī)制,在滿足正確率的基礎(chǔ)上,用最少的指標(biāo)對(duì)研究對(duì)象進(jìn)行判別,從而解決如上的眾多實(shí)際問題。 六.參考文獻(xiàn) 【1】姜啟源、謝金星、葉俊 《數(shù)學(xué)模型(第三版)》 高等教育出版社 【2】約翰遜、威客恩 編 陳旋、葉俊 譯 《實(shí)用多元統(tǒng)計(jì)分析》第六版 清華大學(xué)出版社 【3】西北工業(yè)大學(xué)數(shù)學(xué)建模指導(dǎo)委員會(huì) 編 《數(shù)學(xué)建模簡明
42、教程》 高等教育出版社 【4】劉保柱、蘇彥華、張宏林編 《MATLAB 7.0從入門到精通(修訂版)》 人民郵電出版社 【5】 朱大奇 史慧 編著 《人工神經(jīng)網(wǎng)絡(luò)原理及應(yīng)用》 科學(xué)出版社 七.附錄 附錄一:化驗(yàn)結(jié)果 表B.1是確診病例的化驗(yàn)結(jié)果,其中1-30號(hào)病例是已經(jīng)確診為腎炎病人的化驗(yàn)結(jié)果;31-60號(hào)病例是已經(jīng)確定為健康人的結(jié)果。表B.2是就診人員的化驗(yàn)結(jié)果。 B.1 確診病例的化驗(yàn)結(jié)果 病例號(hào) Zn Cu Fe Ca Mg K Na 1 166 15.8 24.5 700 112 179 513 2 185 15.7
43、 31.5 701 125 184 427 3 193 9.80 25.9 541 163 128 642 4 159 14.2 39.7 896 99.2 239 726 5 226 16.2 23.8 606 152 70.3 218 6 171 9.29 9.29 307 187 45.5 257 7 201 13.3 26.6 551 101 49.4 141 8 147 14.5 30.0 659 102 154 680 9 172 8.85 7.86 551 75.
44、7 98.4 318 10 156 11.5 32.5 639 107 103 552 11 132 15.9 17.7 578 92.4 1314 1372 12 182 11.3 11.3 767 111 264 672 13 186 9.26 37.1 958 233 73.0 347 14 162 8.23 27.1 625 108 62.4 465 15 150 6.63 21.0 627 140 179 639 16 159 10.7 11.7 612 190 98.5
45、 390 17 117 16.1 7.04 988 95.5 136 572 18 181 10.1 4.04 1437 184 101 542 19 146 20.7 23.8 1232 128 150 1092 20 42.3 10.3 9.70 629 93.7 439 888 21 28.2 12.4 53.1 370 44.1 454 852 22 154 13.8 53.3 621 105 160 723 23 179 12.2 17.9 1139 150 45.2 2
46、18 24 13.5 3.36 16.8 135 32.6 51.6 182 25 175 5.84 24.9 807 123 55.6 126 26 113 15.8 47.3 626 53.6 168 627 27 50.5 11.6 6.30 608 58.9 58.9 139 28 78.6 14.6 9.70 421 70.8 133 464 29 90.0 3.27 8.17 622 52.3 770 852 30 178 28.8 32.4 992 112 70.2 1
47、69 31 213 19.1 36.2 2220 249 40.0 168 32 170 13.9 29.8 1285 226 47.9 330 33 162 13.2 19.8 1521 166 36.2 133 34 203 13.0 90.8 1544 162 98.90 394 35 167 13.1 14.1 2278 212 46.3 134 36 164 12.9 18.6 2993 197 36.3 94.5 37 167 15.0 27.0 2056 260 64.6
48、 237 38 158 14.4 37.0 1025 101 44.6 72.5 39 133 22.8 31.0 1633 401 180 899 40 156 135 322 6747 1090 228 810 41 169 8.00 308 1068 99.1 53.0 289 42 247 17.3 8.65 2554 241 77.9 373 43 166 8.10 62.8 1233 252 134 649 44 209 6.43 86.9 2157 288 74.0
49、219 45 182 6.49 61.7 3870 432 143 367 46 235 15.6 23.4 1806 166 68.8 188 47 173 19.1 17.0 2497 295 65.8 287 48 151 19.7 64.2 2031 403 182 874 49 191 65.4 35.0 5361 392 137 688 50 223 24.4 86.0 3603 353 97.7 479 51 221 20.1 155 3172 368 150 739
50、 52 217 25.0 28.2 2343 373 110 494 53 164 22.2 35.5 2212 281 153 549 54 173 8.99 36.0 1624 216 103 257 55 202 18.6 17.7 3785 225 31.0 67.3 56 182 17.3 24.8 3073 246 50.7 109 57 211 24.0 17.0 3836 428 73.5 351 58 246 21.5 93.2 2112 354 71.7 195
51、59 164 16.1 38.0 2135 152 64.3 240 60 179 21.0 35.0 1560 226 47.9 330 表B.2 就診人員的化驗(yàn)結(jié)果 病例號(hào) Zn Cu Fe Ca Mg K Na 61 58.2 5.42 29.7 323 138 179 513 62 106 1.87 40.5 542 177 184 427 63 152 0.80 12.5 1332 176 128 646 64 85.5 1.70 3.99 503 62.3 238 7
52、62.6 65 144 0.70 15.1 547 79.7 71.0 218.5 66 85.7 1.09 4.2 790 170 45.8 257.9 67 144 0.30 9.11 417 552 49.5 141.5 68 170 4.16 9.32 943 260 155 680.8 69 176 0.57 27.3 318 133 99.4 318.8 70 192 7.06 32.9 1969 343 103 553 71 188 8.28 22.6 1208 231
53、1314 1372 72 153 5.87 34.8 328 163 264 672.5 73 143 2.84 15.7 265 123 73.0 347.5 74 213 19.1 36.2 2220 249 62.0 465.8 75 192 20.1 23.8 1606 156 40.0 168 76 171 10.5 30.5 672 145 47.0 330.5 77 162 13.2 19.8 1521 166 36.2 133 78 203 13.0 90.8 1544
54、 162 98.9 394.5 79 164 20.1 28.9 1062 161 47.3 134.5 80 167 13.1 14.1 2278 212 36.5 96.5 81 164 12.9 18.6 2993 197 65.5 237.8 82 167 15.0 27.0 2056 260 44.8 72.0 83 158 14.4 37.0 1025 101 180 899.5 84 133 22.8 31.3 1633 401 228 289 85 169 8.0 30.
55、8 1068 99.1 53.0 817 86 247 17.3 8.65 2554 241 77.5 373.5 87 185 3.90 31.3 1211 190 134 649.8 88 209 6.43 86.9 2157 288 74.0 219.8 89 182 6.49 61.7 3870 432 143 367.5 90 235 15.6 23.4 1806 166 68.9 188 附錄二:部分程序代碼 程序1:一問fisher判別并檢驗(yàn) G=[166 15.8 24.5 7
56、00 112 179 513 185 15.7 31.5 701 125 184 427 193 9.80 25.9 541 163 128 642 159 14.2 39.7 896 99.2 239 726 226 16.2 23.8 606 152 70.3 218 171 9.29 9.29 307 187 45.5 257 201 13.3 26.6 551 101 49.4 141 147 14.5 30.0 659 102 154 680 172 8.85 7.86 551 75.7 98.4 318 156 11.5 32.5 639 107 103 552
57、 132 15.9 17.7 578 92.4 1314 1372 182 11.3 11.3 767 111 264 672 186 9.26 37.1 958 233 73.0 347 162 8.23 27.1 625 108 62.4 465 150 6.63 21.0 627 140 179 639 159 10.7 11.7 612 190 98.5 390 117 16.1 7.04 988 95.5 136 572 181 10.1 4.04 1437 184 101 542 146 20.7 23.8 1232 128 150 1092 42.3 10.3
58、9.70 629 93.7 439 888 213 19.1 36.2 2220 249 40.0 168 170 13.9 29.8 1285 226 47.9 330 162 13.2 19.8 1521 166 36.2 133 203 13.0 90.8 1544 162 98.90 394 167 13.1 14.1 2278 212 46.3 134 164 12.9 18.6 2993 197 36.3 94.5 167 15.0 27.0 2056 260 64.6 237 158 14.4 37.0 1025 101 44.6 72.5 133 22.8 3
59、1.0 1633 401 180 899 156 135 322 6747 1090 228 810 169 8.00 308 1068 99.1 53.0 289 247 17.3 8.65 2554 241 77.9 373 166 8.10 62.8 1233 252 134 649 209 6.43 86.9 2157 288 74.0 219 182 6.49 61.7 3870 432 143 367 235 15.6 23.4 1806 166 68.8 188 173 19.1 17.0 2497 295 65.8 287 151 19.7 64.2 2031
60、 403 182 874 191 65.4 35.0 5361 392 137 688 223 24.4 86.0 3603 353 97.7 479]; ssw=zeros(7,7); m=mean(G(1:20,:)); m(2:2,:)=mean(G(21:40,:)) for i=1:20 ssw=ssw+(a(i:i,:)-m(1:1,:))*(a(i:i,:)-m(1:1,:)); end for i=21:40 ssw=ssw+(a(i:i,:)-m(2:2,:))*(a(i:i,:)-m(2:2,:)); end w=inv(ssw)
61、*(m(1:1,:)-m(2:2,:)) result=G*w; theta=w*(m(1:1,:)+m(2:2,:))/2 for i=1:40 result(i:i,2:2)=theta result(i:i,3:3)=i; end x=[58.2 5.42 29.7 323 138 179 513 106 1.87 40.5 542 177 184 427 152 0.80 12.5 1332 176 128 646 85.5 1.70 3.99 503 62.3 238 762.6 144 0.70 15.1 547 79.7 71.0 218
62、.5 85.7 1.09 4.2 790 170 45.8 257.9 144 0.30 9.11 417 552 49.5 141.5 170 4.16 9.32 943 260 155 680.8 176 0.57 27.3 318 133 99.4 318.8 192 7.06 32.9 1969 343 103 553 188 8.28 22.6 1208 231 1314 1372 153 5.87 34.8 328 163 264 672.5 143 2.84 15.7 265 123 73.0 347.5 213 19.1 36.2 2220 249 62.0
63、465.8 192 20.1 23.8 1606 156 40.0 168 171 10.5 30.5 672 145 47.0 330.5 162 13.2 19.8 1521 166 36.2 133 203 13.0 90.8 1544 162 98.9 394.5 164 20.1 28.9 1062 161 47.3 134.5 167 13.1 14.1 2278 212 36.5 96.5 164 12.9 18.6 2993 197 65.5 237.8 167 15.0 27.0 2056 260 44.8 72.0 158 14.4 37.0 1025 1
64、01 180 899.5 133 22.8 31.3 1633 401 228 289 169 8.0 30.8 1068 99.1 53.0 817 247 17.3 8.65 2554 241 77.5 373.5 185 3.90 31.3 1211 190 134 649.8 209 6.43 86.9 2157 288 74.0 219.8 182 6.49 61.7 3870 432 143 367.5 235 15.6 23.4 1806 166 68.9 188 ]; theta1=x*w 程序2:神經(jīng)網(wǎng)絡(luò)分析并檢驗(yàn) G1=[166 15.
65、8 24.5 700 112 179 513 185 15.7 31.5 701 125 184 427 193 9.80 25.9 541 163 128 642 159 14.2 39.7 896 99.2 239 726 226 16.2 23.8 606 152 70.3 218 171 9.29 9.29 307 187 45.5 257 201 13.3 26.6 551 101 49.4 141 147 14.5 30.0 659 102 154 680 172 8.85 7.86 551 75.7 98.4 318 156 11.5 32.5 639 107
66、103 552 132 15.9 17.7 578 92.4 1314 1372 182 11.3 11.3 767 111 264 672 186 9.26 37.1 958 233 73.0 347 162 8.23 27.1 625 108 62.4 465 150 6.63 21.0 627 140 179 639 159 10.7 11.7 612 190 98.5 390 117 16.1 7.04 988 95.5 136 572 181 10.1 4.04 1437 184 101 542 146 20.7 23.8 1232 128 150 1092 42.3 10.3 9.70 629 93.7 439 888 ]; G2=[213 19.1 36.2 2220 249 40.0 168 170 13.9 29.8 1285 226 47.9 330 162 13.2 19.8 1521 166 36.2 133 203 13.0 90.8 1544 162 98.90 394 167 13.1 14.1 2278 2
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 市教育局冬季運(yùn)動(dòng)會(huì)安全工作預(yù)案
- 2024年秋季《思想道德與法治》大作業(yè)及答案3套試卷
- 2024年教師年度考核表個(gè)人工作總結(jié)(可編輯)
- 2024年xx村兩委涉案資金退還保證書
- 2024年憲法宣傳周活動(dòng)總結(jié)+在機(jī)關(guān)“弘揚(yáng)憲法精神推動(dòng)發(fā)改工作高質(zhì)量發(fā)展”專題宣講報(bào)告會(huì)上的講話
- 2024年XX村合作社年報(bào)總結(jié)
- 2024-2025年秋季第一學(xué)期初中歷史上冊(cè)教研組工作總結(jié)
- 2024年小學(xué)高級(jí)教師年終工作總結(jié)匯報(bào)
- 2024-2025年秋季第一學(xué)期初中物理上冊(cè)教研組工作總結(jié)
- 2024年xx鎮(zhèn)交通年度總結(jié)
- 2024-2025年秋季第一學(xué)期小學(xué)語文教師工作總結(jié)
- 2024年XX村陳規(guī)陋習(xí)整治報(bào)告
- 2025年學(xué)校元旦迎新盛典活動(dòng)策劃方案
- 2024年學(xué)校周邊安全隱患自查報(bào)告
- 2024年XX鎮(zhèn)農(nóng)村規(guī)劃管控述職報(bào)告