《預測蛋白質(zhì)二級結構的快速方法》由會員分享,可在線閱讀,更多相關《預測蛋白質(zhì)二級結構的快速方法(3頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、預測蛋白質(zhì)二級結構的快速方法
蛋白質(zhì)二級結構預測方法是首先預測蛋白質(zhì)的結構類型,下面是小編搜集整理的一篇探究預測蛋白質(zhì)二級結構方法的論文范文,歡迎閱讀參考。
1、研究背景及意義
蛋白質(zhì)二級結構的預測是生物、數(shù)學與計算機交叉領域的課題,進行二級結構預測對于理解蛋白質(zhì)結構與功能的關系,以及分子設計、生物制藥等領域都有重要的現(xiàn)實。隨著人類基因組計劃的順利實施,已知氨基酸序列的蛋白質(zhì)數(shù)量成級數(shù)增長,目前試驗手段主要依靠X射線晶體衍射與核磁共振方法測定蛋白質(zhì)二級結構,但測定周期較長,導致已測定二級結構的蛋白質(zhì)數(shù)量與已知氨基酸序列
2、的蛋白質(zhì)數(shù)量差距越來越大,要求有一種快速簡潔而適用性強的預測蛋白質(zhì)二級結構的方法。而蛋白質(zhì)的氨基酸排列順序決定了它的空間結構,空間結構體現(xiàn)了蛋白質(zhì)的生理功能,那么就可以從已知序列和結構的蛋白質(zhì)出發(fā),挖掘出其中的關系,就可以預測出其他已知序列的蛋白質(zhì)的二級結構。如果準確率達到要求則對于了解生命現(xiàn)象的本質(zhì),解釋疾病的發(fā)生機制,診斷、治療疾病、設計新藥、通過不同生物蛋白質(zhì)結構研究生物進化、利用其他生物為人類服務等都有著非常重要的意義。綜上,蛋白質(zhì)結構的預測對于蛋白質(zhì)的研究與應用領域具有很好的推動作用。
2、預測方法
二級結構預測一直都是學者喜歡研究的問題,研究時間長,目前
3、預測二級結構預測的方法已經(jīng)有很多,但是在準確率上都達不到所希望的要求,因此無數(shù)的人依然為此努力著(1)經(jīng)驗參數(shù)法。經(jīng)驗參數(shù)法是一種基于單個氨基酸殘基統(tǒng)計的經(jīng)驗預測方法。通過統(tǒng)計分析,獲得的每個殘基出現(xiàn)于特定二級結構構象的傾向性因子,進而利用這些傾向性因子預測蛋白質(zhì)的二級結構。1970年由PeterY.Chou和GeraldD.Fasman提出Chou-Fasman方法是預測蛋白質(zhì)二級結構的經(jīng)驗方法。這種方法基于每個氨基酸在α螺旋的相對頻率,測試表,和通過X射線晶體學已知的蛋白質(zhì)結構。從這些頻率、概率參數(shù),可知道每個氨基酸在各個二級結構類型的外觀,而這些參數(shù)是用來預測某一氨基酸序列將
4、形成一個螺旋,一個測試鏈,或一個又一個蛋白質(zhì)的概率的。該方法在確定正確的二級結構準確性約50-60%,這明顯比現(xiàn)代機器學習技術的準確性要低。(2)GOR方法。
GOR方法是一種基于信息論和貝葉斯統(tǒng)計學的方法,是統(tǒng)計算法中理論基礎最好的。GOR將蛋白質(zhì)序列當作一連串的信息值來處理,基本原理是將蛋白質(zhì)的一級結構和二級結構看成一個轉化過程的兩個相互聯(lián)系的信息;GOR方法不僅考慮被預測位置本身氨基酸殘基種類的影響,而且考慮相鄰殘基種類對該位置構象的影響。為了避免大量的實驗數(shù)據(jù),GOR將信息函數(shù)分為多項式和的形式。(3)Lim方法-立體化學方法。氨基酸的理化性質(zhì)對二級結構影響較大,在進行結
5、構預測時考慮氨基酸殘基的物理化學性質(zhì)。立體化學是從三維空間揭示分子的結構和性能。手性分子是立體化學中極其重要的部分之一。同分異構在有機化學中是極為普遍的現(xiàn)象。立體異構是指分子中的原子或基團在空間的排列不同步產(chǎn)生的異構現(xiàn)象。利用不同氨基酸家族的性質(zhì)差異來進行二級預測。(4)同源分析法。同源分析法是將待預測的片段與數(shù)據(jù)庫中已知二級結構的片段進行相似性比較,利用打分矩陣計算出相似性得分,根據(jù)相似性得分以及數(shù)據(jù)庫中的構象態(tài),構建出待預測片段的二級結構。該方法對數(shù)據(jù)庫中同源序列的存在非常敏感,若數(shù)據(jù)庫中有相似性大于30%的序列,則預測準確率可大大上升。(5)BP神經(jīng)網(wǎng)絡算法。在生物信息學研究中,應用得最
6、多的神經(jīng)網(wǎng)絡模型是多層前饋網(wǎng)絡模型,這種模型使用最廣泛的算法是BP算法,即反向傳播算法。它屬于有導師學習的算法。這種模型也叫BP神經(jīng)網(wǎng)絡。網(wǎng)絡通過對已有氨基酸編碼建立序列到結構,結構到結構的兩層網(wǎng)絡進行學習,預測的準確性上有極大的提高。
3、方法分析
蛋白質(zhì)二級結構預測方法是首先預測蛋白質(zhì)的結構類型,然后再預測二級結構。通過對各個方法的比較可以得到:(1)與傳統(tǒng)經(jīng)典方法相比,利用特征信息提取方法可涵蓋序列統(tǒng)計特征、氨基酸物理化學特征、氨基酸片段位置分布三方面的信息,此方法可以較為全面地反映出蛋白質(zhì)序列中有代表性的特征信息。(2)通過采用有效的特征挑選算法以及分類算法
7、,既有效減少了信息的冗余,又提高了結構類預測模型的準確率。綜上,本研究從信息學角度出發(fā),系統(tǒng)地解決蛋白質(zhì)信息提取、多特征信息組合及結構類預測等信息處理問題,有助于蛋白質(zhì)的結構及功能研究,同時也對蛋白質(zhì)序列分析、機器學習領域的發(fā)展有很大的幫助。(3)目前普遍使用的,考慮多條序列的方法,運用長程信息和蛋白質(zhì)序列的進化信息,準確度有了比較大的提高。
4、結語
由上述的各種方法可以看出有很多方面的因素會影響蛋白質(zhì)二級結構的預測,如目前已知的蛋白質(zhì)太少,大部分處于未知階段。
針對目前的蛋白質(zhì)數(shù)據(jù)庫資源的貧乏性特點,如何選擇適當?shù)念A測方法和評估準則將決定蛋白質(zhì)預測
8、的準確率的高低。因此在選擇時應該多種方法綜合利用,不僅包括各種預測方法的綜合,而且也包括結構實驗結果、序列對比結果、蛋白質(zhì)結構分類預測結果等信息的綜合。多個程序同時預測,綜合評判得到一致結果;序列比對與二級結構預測;雙重預測。對模型進行反復優(yōu)化,以提高預測的準確率和實際價值。
參考文獻:
[1]閆平凡,張長水.人工神經(jīng)網(wǎng)絡語模擬退火計算[M].北京:清華大學出版社,2000.
[2]沈世鎰,神經(jīng)網(wǎng)絡系統(tǒng)理論及其應用[M].科學出版社,2000.
[3]唐媛李,春花,蛋白質(zhì)二級結構的研究進展[J].現(xiàn)代生物醫(yī)學進展,2013.
[4]楊存榮,孫之榮,模式識別方法預測蛋白質(zhì)二級結構的研究[N].清華大學學報(自然科學版),第32卷,第1期,1992.
[5]王勇獻,蛋白質(zhì)二級結構預測的模型與方法研究[D].工學博士學位論文.