AlphaFold izračunal strukturo vseh proteinov
Matej Huš
2. avg 2022 ob 22:15:55
Algoritem AlphaFold, ki ga je DeepMind pokazal predlani in lani odprl vsem, je napravil še korak naprej. Potem ko je lani predvidel strukturo milijona proteinov, so sedaj javnosti priobčili zbirko napovedi strukture 200 milijonov proteinov. Zbirko so pripravili v sodelovanju z EMBL (European Molecular Biology Laboratory) in je na voljo vsakomur, saj je del odprtokodne baze AlphaFold Protein Structure Database. Izvršni direktor DeepMinda Demis Hassabis je dogodek pompozno označil kot darilo človeštvo, a dejansko gre za velik dosežek.
Določanje oblike proteinov je težak problem. Proteine sestavljajo aminokisline, katerih zaporedje določa primarno strukturo. Kako se potem te zvijejo v prostoru v sekundarno in terciarno strukturo, pa je zelo težko pravilno napovedati. Zgodovinsko smo strukture določali eksperimentalno, kar prinaša svojevrstno omejitve (rentgenska difrakcija je možna na kristaliziranih proteinih). Računalniško napovedovanje se zdi logičen korak naprej, a je zaradi ogromnega števila možnosti to nemogoče rigorozno preveriti. Tekmovanje Critical Assessment of Structure Prediction, ki poteka vsaki dve leti, omogoča primerjanje računalniških algoritmov, ki napovedo strukturo proteinov, katerih resnična struktura je bila nedavno eksperimentalno določena (a še ni javna). Tam je AlphaFold vse od izuma za razred boljši od konkurence.
A pomembne so številke. Še pred dvema letoma smo pisali, da poznamo strukturo 170.000 proteinov. Odkar obstaja AlphaFold, se je to število povečalo na milijon. Sedaj pa so znane strukture vseh poznanih proteinov, torej približno 200 milijonov. To vključuje proteine, ki jih imajo živali, rastline, bakerije, arheje in vsi drugi organizmi. Poznavanje njihovih struktur bo dalo velik pospešek aplikativnemu raziskovanju v vedah o življenju, denimo iskanju zdravil in zdravljenju nekaterih genskih bolezni. Ob tem je treba vedeti, da gre vendarle za izračune in ocene. V nekaterih primerih je lahko napoved AlphaFolda nenatančna, a pričakovati je, da se bo algoritem sproti učil in izboljševal.