Sprievodca metódami a softvérom na predikciu proteínovej štruktúry

Na uskutočnenie svojich biologických funkcií sa proteíny skladajú do jednej alebo viacerých špecifických konformácií, diktovaných komplexnými a reverzibilnými nekovalentnými interakciami. Určenie štruktúry proteínu sa dá dosiahnuť časovo náročnou a pomerne nákladnou technikou, ako je kryštalografia, nukleárna magnetická rezonančná spektroskopia a interferometria s duálnou polarizáciou. Bioinformatický softvér bol vyvinutý na výpočet a predpovedanie proteínových štruktúr na základe ich aminokyselinových sekvencií.

Súhrn proteínovej štruktúry

Ako alternatíva k experimentálnej technike pomáhajú nástroje na analýzu štruktúry a predpovedanie predpovedať proteínovú štruktúru podľa ich aminokyselinových sekvencií. Riešenie štruktúry daného proteínu je veľmi dôležité v medicíne (napríklad pri navrhovaní liekov) a biotechnológii (napríklad pri navrhovaní nových enzýmov). Oblasť predikcie výpočtových proteínov sa teda neustále vyvíja v dôsledku zvýšenia výpočtovej sily strojov a vývoja inteligentných algoritmov.

Existujú štyri úrovne proteínovej štruktúry (obrázok 1). Pri predikcii proteínovej štruktúry sa primárna štruktúra používa na predikciu sekundárnych a terciárnych štruktúr.

Sekundárne štruktúry proteínov sú lokalizované skladaním v polypeptidovom reťazci, ktorý je stabilizovaný vodíkovými väzbami. Najbežnejšie sekundárne proteínové štruktúry sú alfa helixy a beta listy.

Terciárna štruktúra je konečná forma proteínu, keď sa rôzne sekundárne štruktúry zložia do 3D štruktúry. Tento konečný tvar sa tvorí a je držaný pohromade pomocou iónových interakcií, disulfidových mostov a van de Waalsových síl.

Štyri úrovne proteínovej štruktúry. Obrázok z Khanacademy.org.

Metódy predpovedania proteínovej štruktúry a softvér

Pre špecializované proteínové vlastnosti a špecifickosť, ako je predikcia poruchy, predikcia dynamiky, predikcia zachovania štruktúry, atď., Bolo vyvinutých veľké množstvo softvéru na predikciu štruktúry, prístupy zahŕňajú modelovanie homológie, proteínové vlákno, metódy ab initio, predikciu sekundárnej štruktúry a transmembránovú špirálu a predikcia signálneho peptidu.

Výber správnej metódy vždy začína použitím primárnej sekvencie neznámeho proteínu a vyhľadaním homológov v proteínovej databáze (obrázok 2).

Graf rozhodovania pre metódu predikcie proteínovej štruktúry.

Tu je niekoľko podrobných metód na predikciu proteínovej štruktúry:

  • Nástroje na predikciu sekundárnej štruktúry

Tieto nástroje predpovedajú miestne sekundárne štruktúry založené iba na aminokyselinovej sekvencii proteínu. Predpovedané štruktúry sa potom porovnajú so skóre DSSP, ktoré sa vypočíta na základe kryštalografickej štruktúry proteínu (viac tu na skóre DSSP).

Predikčné metódy pre sekundárnu štruktúru sa spoliehajú hlavne na databázy známych proteínových štruktúr a moderné metódy strojového učenia, ako sú neurónové siete a podporné vektorové stroje.

Tu je niekoľko vynikajúcich nástrojov na predikciu sekundárnej štruktúry.

  • Terciárna štruktúra

Terciárne (alebo 3-D) nástroje na predikciu štruktúry spadajú do dvoch hlavných metód: Ab initio a komparatívne proteínové modelovanie.

Metódy predikcie proteínovej štruktúry ab initio (alebo de novo) sa snažia predpovedať terciárne štruktúry zo sekvencií na základe všeobecných princípov, ktoré riadia energetickú skladateľnosť proteínov a / alebo štatistické tendencie konformačných znakov, ktoré natívne štruktúry získavajú, bez použitia explicitných templátov.

Všetky informácie o terciárnej štruktúre proteínu sú kódované v jeho primárnej štruktúre (to znamená v jeho aminokyselinovej sekvencii). Možno ich však predpovedať obrovské množstvo, z ktorých iba jeden má minimálnu voľnú energiu a stabilitu, ktorá sa musí správne zložiť. Predikcia proteínovej štruktúry ab initio teda vyžaduje obrovské množstvo výpočtovej sily a času na vyriešenie natívnej konformácie proteínu a zostáva jednou z hlavných výziev modernej vedy.

Medzi najobľúbenejšie servery patrí Robetta (pomocou softvérového balíka Rosetta), SWISS-MODEL, PEPstr, QUARK. Tu nájdete úplný zoznam.

Ak proteín známej terciárnej štruktúry zdieľa najmenej 30% svojej sekvencie s potenciálnym homológom neurčenej štruktúry, na predpovedanie pravdepodobnej štruktúry neznámeho sa môžu použiť porovnávacie metódy, ktoré prekrývajú predpokladanú neznámu štruktúru so známou. Homologické modelovanie a proteínové vlákno sú dve hlavné stratégie, ktoré využívajú predchádzajúce informácie o inom podobnom proteíne na navrhnutie predpovede neznámeho proteínu na základe jeho sekvencie.

Softvér na modelovanie homológie a navlečenie proteínov zahŕňa RaptorX, FoldX, HHpred, I-TASSER a ďalšie.

Referencie

Predikcia de novo proteínovej štruktúry. Wikipedia.

Predikcia proteínovej štruktúry. Wikipedia