» »

Folding@Home - zakaj in kako?

Vaši procesorji so - če niste ravno strasten igralec, ali pa se ne ukvarjate z obdelavo podatkov z zahtevnimi algoritmi - večino časa bolj ali manj neobremenjeni. Če dobro pomislim, lahko o tem govorim v pretekliku, ker verjamem, da ste se verjetno že vključili v katerega od programov za distribuirano preračunavanje. Razlog verjetno tiči v dobri reklami projektov za deljeno procesiranje, del zaslug gre pripisati dejstvu, da računalničarji radi vidimo, da iz računalnika stisnemo največ, del zaslug pa gre verjetno na račun tega, da smo Slovenci. Stavek: "Zakaj pa ima sosed 123 paketov, jaz pa še nobenega?" je lahko tudi dobra motivacija za obremenitev lastnega procesorja.

Tako je bil dolgo časa na mnogo računalnikih prisoten Seti@Home, ki je naredil pomemben miselni preskok v naših glavah, zadnje čase pa je glavna zvezda projekt Folding@Home. To, da gre za preračunavanje konformacij proteinov, verjetno že veste, kaj pa dejansko vaš računalnik dela, in kakšna je povezava z naravnimi mehanizmi, pa vam bom poskušal razložiti tukaj.


Od DNA do proteina

O DNA ste slišali (ali pa še poslušate) že mnogo v času vašega šolanja, tako da vas ne bom obremenjeval s kopico podatkov, ampak samo s tistimi, ki so za razumevanje nastanka proteina bistveni. Gledano z vidika naravoslovca je DNA ena boljših zamisli narave, ki se je izoblikovala v času evolucije. Je naravni polimer, ki ima pri vseh nas večinoma obliko dvojne vijačnice, sestavljena pa je iz ogrodja sladkorjev (deoksiriboze), povezanih s fosfodiestrskimi vezmi, in parov purinskih in pirimidinskih baz. Glede na to, da je teh snovi v naravi v zadostnih količinah, ali pa jih znamo sami sintetizirati, je princip racionalen. Če se še malo posvetimo baznim parom, ki so znotraj vijačnice vidimo, da so vedno pravilno urejeni. Adenin se poveže s timinom, citozin pa z gvaninom, preko vodikovih vezi. Da narava loči vezavo, je enemu paru namenila dve, enemu pa tri takšne povezave.

Struktura dvojne vijačnice DNA

vir: Neanderthal modern

To stanje DNA je mirujoče, dokler telo ne ugotovi, da potrebujemo določeno količino encima. Pride do procesa transkripcije, ki pomeni, da se DNA odvije s histonov (bazičnih beljakovin, ker je vezana), razvije in odpre. Z nadzorovanim principom se ob molekuli DNA tvori molekula RNA, ki je "zrcalna" slika originalne vijačnice DNA. Temu sicer ni popolnoma tako, saj timin iz DNA v RNA zamenja uracil, a razlike so malenkostne.

Molekula RNA

vir: Nobelov sklad

Primarni transkript, kakor se imenuje nastala molekula (kot zanimivost: definicija termina gen pravi, da en gen predstavlja en primarni transkript), je nato podvržena nekaj cepitvam in modifikacijam, izrežejo se deli, ki ne nosijo informacije (introni), tako da na koncu ostane zaporedje uporabnih informacij eksonov - mRNA (messenger RNA - sporočilna RNA), rRNA in t-RNA. Vse to potuje v del celice, imenovan ribosom. mRNA sedaj predstavlja matrico oziroma zapis za to, katera od 20 aminokislin, ki jih imamo v telesu, pride na katero mesto v aminokislinskem zaporedju proteina. Da je varnost zapisa še večja, obstaja za vsako aminokislino več izvornih podatkov, imenovanih kodoni. Vsak je sestavljen iz treh osnovnih baz, kar pomeni 64 kombinacij za 20 aminokislin. Genetski kod je torej degeneriran.

Sestavljanje proteina ali translacija potem poteka tako, da mRNA potuje po žlebu ribosoma, t-RNA pa prinaša aminokisline. Pride do (spet) enimsko katalizirane kondenzacije ali nukleofilne substitucije z eliminacijo vode, oziroma preprosto povedano do tvorbe amidne vezi med funkcionalnima skupinama prejšnje in naslednje aminokisline. To omogoča lastnost aminokislin, ki vsebujejo tako aminsko (-NH2) in karboksilno (-COOH) skupino.

Splošna struktura aminokislin

Začetek in konec translacije določajo start in stop kodoni. Ko je protein sestavljen, zapusti ribosom ter potuje v druge dele celice, kjer se mu lahko doda ali odvzame določene strukture, in ga s tem naredi uporabnega za njegovo nalogo. Vendar imamo sedaj šele denaturirano, nezvito, obliko proteina.

Pregleden proces nastajanja proteina

vir: Nobelov sklad

Zvijanje proteina

Pri proteinih poznamo štiri različne strukture. Prva, primarna, nam pove, katere aminokisline so vsebovane in kako si sledijo po vrsti ter prikaže potencialne disulfidne vezi, sekundarna nam pove, kako se linearne verige obnašajo v prostoru (recimo: tvorijo alfa-vijačnico, beta-ploskev ipd.), terciarna pa nam pove, kako se vsi deli proteina, naj bodo v sekundarni strukturi ali prosti, uredijo v prostoru. Posledica tega so recimo primeri, da se skupaj nahajajo aminokisline, ki so oddaljene za več 100 mest glede na primarno strukturo. Poznamo še kvartarno strukturo, ki pa se nanaša na več proteinov, ki se uredijo v določeno konformacijo, če je to potrebno. Ponavadi so to podenote encimov. Na spodnji sliki je prikazanih več sekundarnih struktur, največ beta-ploskev in alfa-vijačnica.

Sekundarne strukture polipeptidnih verig

vir: Tsing Ilua University

Terciarna struktura proteina

vir: Brooklyn City University of New York

Še vedno nepojasnjeno pa je vprašanje, kako točno in zakaj pride do tako hitrega zvijanja proteinov. Zakaj pride do samega zvijanja, je znano že precej časa. Vsaka aminokislina, ki sestavlja protein, ima namreč poleg dveh osnovnih (aminske in karboksilne) še druge stranske skupine, ki po nastanku proteina odstopajo od osnovne verige. Te skupine imamo različne lastnosti, saj se delijo glede na to, ali so kisle ali bazične, hidrofilne ali lipofilne, glede na to, kakšne elektronske efekte imajo te skupine ipd. Tu bom citiral nekega fizika, ki je dejal, da je kemija fizika zunanjih elektronov, in dejansko ni bil daleč od resnice. Zvijanje proteina je posledica težnje molekule, da bi dosegla čim nižje energetsko stanje - termodinamska lastnost. To lahko doseže tako, da zmanjša interakcije med lastnimi skupinami in molekulami medija, kjer se nahaja. V vodi zato večina proteinov izkazuje hidrofilne (vodoljubne) lastnosti, medtem ko so lipofilne skupine v notranjosti. V lipofilnih membranah je seveda ravno obratno. To pa seveda ne bi bilo dovolj, saj je potrebno najnižjo energijo najti za vsako interakcijo znotraj molekule, kar seveda traja veliko časa - če smo natančni, približno 10-13 sekunde za vsako konformacijo. Predstavljajte si protein, ki ima 100 prostih skupin, od katerih se lahko vsaka nahaja v treh konformacijah. Imamo torej 3100 konformacij, vsaka pretvorba traja 10-13 sekunde. Preračunamo to pomeni, da bi se ta protein po logiki zvijal 5x1034 sekund ali 1,6x1027 let, kar bi pomenilo, da življenje na Zemlji v tej obliki ne bi bilo možno. Celoten proces zvijanja takšnega proteina namreč poteka največ nekaj sekund. Strokovno se enormna razlika med časoma zvijanja imenuje Levinthalov paradoks.

Kljub vsemu, poznamo že del teorije, ki se skriva za zvijanjem proteinov. Verjetno gre za kumulativno selekcijo, saj se ohranijo delno pravilno zviti deli molekule, to je pa bolj ali manj vse, kar poznamo. Ugotovljeno pa je vendarle bilo dejstvo, da je za terciarno strukturo proteina odgovorno samo aminokislinsko zaporedje. To je bil velik korak naprej v razumevanju zvijanja proteinov ... Zakaj? Beri naprej!


Preračunavanje zvijanja

Zadnje čase nam velika razpoložljiva procesorska moč omogoča, da računalniku naložimo kompleksna preračunavanja. Lahko iščemo signale, ki ustrezajo določeni shemi, vremenski prediktorji lahko na kvadratni meter natančno izračunajo vreme, večina molekul, predvsem na področju farmacije, ima izračunane IR in NMR spektre (v kratkem energijske spremembe določenih molekul, ki jih izpostavimo infrardeči svetlobi ali pa magnetnemu polju), preden jih sploh izdelajo, da o fizikalno-kemijskih lastnostih sploh ne govorimo. Torej je bil logičen korak, da nam lahko računalnik izračuna, kako se bo molekula proteina zvila. Potrebni vhodnih podatkov je malo, saj poleg energij funkcionalnih skupin, ki so v bazi in lastnosti medija ter seveda aminokislinskega zaporedja, ne potrebujete ničesar več. Razen časa, ki ga računalnik potrebuje, da preračuna najbolj stabilno stanje. Rezultat je najbolj verjetna oblika proteina.


Zakaj preračunavanje?

V našem telesu proteini igrajo več različnih vlog. Trenutno sta za nas najbolj zanimivi vlogi encimov in receptorjev. Bistvo prvih je v tem, da reakcijo, ki bi drugače težko ali pa sploh ne potekala, vodijo tako, da poteče hitreje. Pri receptorjih pa je princip še enostavnejši. Na njih se namreč vežejo ligandi - ponavadi manjše molekule s specifičnimi lastnostmi - ki spremenijo na primer konformacijo receptorja in s tem sprožijo neko novo reakcijo. Vendar pa v telesu vse ne poteka vedno tako, kot bi moralo. Določenih snovi je lahko preveč, določenih premalo ali jih sploh ni. Tako na nivoju receptorjev ločimo dva načina vplivanja - agonistični in antagonistični. Prvi se vežejo na receptor in vzpodbudijo njegovo aktivnost, medtem ko se drugi sicer vežejo, a nimajo prave strukture, ki bi sprožila delovanje (t.j. intrinzične aktivnosti). Receptor torej samo zasedejo, prav tako pa je v tem času nemogoča vezava drugih molekul. Za lažjo predstavo. Agonist je ključ, ki odklene vrata, antagonist pa samo zasede ključavnico.

Tu pa nastopi preračunavanje zvijanja. Recimo, da imamo poznano primarno strukturo proteina, vendar mu ne moremo določiti tri-dimenzionalne strukture, ker recimo ni dovolj stabilen, ali pa nimamo primerne naprave (za to se uporabljajo denimo NMR spektrometri, ki pa v končni fazi tudi preračunavajo spektre). Primarno strukturo zato vnesemo v program za preračunavanje in kot rezultat dobimo strukturo proteina in njegove profile energije.

V tej fazi smo naredili velik korak. Vemo, kako naj bi se molekula vezala na protein, zato lahko iščemo zelo selekcionirane skupine snovi in nato spet preračunavamo, kako dobro se bodo vezale nanj. Ali pa še bolje - lahko celo izračunamo, katere molekule bi se vezale po naših zahtevah. V končni fazi je lahko posledica tega kar nova zdravilna učinkovina, ki se čez nekaj let, ko prestane teste in birokracijo, pojavi na trgu.


Povzetek

Kot ste lahko ugotovili, lahko z zadostno procesorsko močjo izračunate pomembne informacije. Verjamem, da smo pri preračunavanju šele na začetku. Vlak je torej odpeljal z začetne postaje, kdaj pa se mu bomo priključili? Slo-Tech Folding@Home ekipa vas pričakuje.

DirectX 11

DirectX 11

Dve leti že mineva od Microsoftove razgrnitve novega operacijskega sistema Windows Vista, skupaj s katerim je luč sveta ugledala tudi zadnja različica multimedijskih knjižnic DirectX 10. Po rutinskih posodobitvah vsake dva-tri mesece, ki so večinoma posodabljale zgolj HLSL prevajalnik za shaderje, pa ...

Preberi cel članek »

LEGO kocke za malo večje otroke

LEGO kocke za malo večje otroke

LEGO kocke. Večina ljudi ob tej besedi pomisli na otroške igrače, a kot boste videli v članku, se da iz njih narediti tudi zelo resne izdelke. Z LEGO kockami se ukvarjam že od malih nog, v zadnjih desetih letih pa sem začel delati na malo bolj resnih projektih. Moj cilj je pokazati, da je možno tudi ...

Preberi cel članek »

Nanotehnologija, I.del

Nanotehnologija, I.del

V svetu, ki ga poznamo, so vsi predmeti narejeni iz atomov. V sedanjem svetu so to velike, statistično neurejene skupine, ki služijo zgolj konstistetnosti, vendar pa razvoj narekuje, da naj bi ščasoma ti atomi opravljali vsak svojo določeno nalogo. Ker je sam velikostni razred ...

Preberi cel članek »

Nanotehnologija, II.del

Nanotehnologija, II.del

Če ste se že soočili s patetno zakonodajo ali pa imate zgolj priložnost ta del spoznavati v segmentih vašega študija,vam je termin stanje tehnike znan. Drugače pa, če se z njim še niste srečali, gre preprosto za pregled dosežkov danega področja ...

Preberi cel članek »

CRT proti LCD (2. del)

CRT proti LCD (2. del)

Uporaba elektronskih naprav za prikazovanje slike, ki temeljijo na LCD ali CRT tehniki, kamor štejemo med drugim računalniške in TV zaslone, digitalne prikazovalnike na mobitelih ter urah, je postala v zadnjem času del našega vsakdana. Še več, brez njih si življenja ...

Preberi cel članek »