比較建模法(comparative modeling method)是基于知識(shí)的
蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法,又稱(chēng)為同源結(jié)構(gòu)預(yù)測(cè),是根據(jù)大量已知的蛋白質(zhì)三維結(jié)構(gòu)來(lái)預(yù)測(cè)序列已知而結(jié)構(gòu)未知的蛋白質(zhì)結(jié)構(gòu)。
按照目的定義,若待模型構(gòu)建蛋白質(zhì)的序列與模板序列經(jīng)比對(duì)(alignment)后的序列同源性(sequence identity)在40%(也有人認(rèn)為在35%)以上,則它們的結(jié)構(gòu)可能屬于同一家族,它們是同源蛋白(homology)可以用同源蛋白模型構(gòu)建的方法預(yù)測(cè)其三維結(jié)構(gòu)。因?yàn)樗鼈兛赡苁怯赏环N蛋白質(zhì)分化而來(lái),具有相似的空間結(jié)構(gòu)及相同或相近的功能。因此,若知道了同源蛋白家族中某些蛋白質(zhì)的結(jié)構(gòu),就可以預(yù)測(cè)其他一些序列已知而結(jié)構(gòu)未知的同源蛋白的結(jié)構(gòu),可以用同源模型構(gòu)建的方法預(yù)測(cè)未知蛋白質(zhì)的三維結(jié)構(gòu)。同源蛋白模型構(gòu)建的步驟如下。
(一)目標(biāo)蛋白序列與目標(biāo)序列的匹配
應(yīng)用FASTA或BLAST搜索軟件,在PIR、SWISSPROT或GENEBANK等序列庫(kù)中按序列同源性挑選出一些同源性比較高的序列,然后把挑選出的序列與目標(biāo)序列基序多重匹配,得到模板結(jié)構(gòu)等價(jià)位點(diǎn)套的初始集合。
(二)根據(jù)模板結(jié)構(gòu)構(gòu)建目標(biāo)蛋白結(jié)構(gòu)模型
在已確定的模板結(jié)構(gòu)等價(jià)位點(diǎn)套的初始集合的基礎(chǔ)上,旋轉(zhuǎn)每一個(gè)模板的結(jié)構(gòu),使它們相互間的未知盡可能多地重疊在一起。不同兩個(gè)模板在空間中若復(fù)合一定的重疊距離標(biāo)準(zhǔn),那它們相互之間的關(guān)系就是等價(jià)位點(diǎn)。許多這樣的等價(jià)位點(diǎn)構(gòu)成了等價(jià)位點(diǎn)套。
疊合結(jié)束后,即得到了同源蛋白的結(jié)構(gòu)保守區(qū)(SCR),以及相應(yīng)的基架結(jié)構(gòu)(framework)。模板結(jié)構(gòu)匹配后,一般還要用得到的同源體的SCR的第1條序列與目標(biāo)序列匹配,挑選出目標(biāo)序列上的高相似區(qū),定義為目標(biāo)蛋白的SCR。Homology、UQANTA/CHARM、COMPOSER、CONSENSUS、MODELLER和Collarextension等軟件和方法可以用于目標(biāo)蛋白結(jié)構(gòu)模型的構(gòu)建。
(三)對(duì)模型構(gòu)建結(jié)構(gòu)基序的優(yōu)化和評(píng)估
同源結(jié)構(gòu)模型構(gòu)建(預(yù)測(cè))得到的蛋白質(zhì)結(jié)構(gòu)模型,通常含有一些不合理的原子間接觸,須對(duì)模型進(jìn)行分子力學(xué)和分子動(dòng)力學(xué)優(yōu)化,消除模型中不合理的接觸。另外,模型中有些鍵長(zhǎng)、鍵角和兩面角也有可能不合理,也須檢查評(píng)估。PROCHECK和PROSAⅡ等軟件常用于完成這類(lèi)工作。
原創(chuàng)作者:上海遠(yuǎn)慕生物科技有限公司