vir: Nature
Določanje oblike proteinov je težak problem. Proteine sestavljajo aminokisline, katerih zaporedje določa primarno strukturo. Kako se potem te zvijejo v prostoru v sekundarno in terciarno strukturo, pa je zelo težko pravilno napovedati. Zgodovinsko smo strukture določali eksperimentalno, kar prinaša svojevrstno omejitve (rentgenska difrakcija je možna na kristaliziranih proteinih). Računalniško napovedovanje se zdi logičen korak naprej, a je zaradi ogromnega števila možnosti to nemogoče rigorozno preveriti. Tekmovanje Critical Assessment of Structure Prediction, ki poteka vsaki dve leti, omogoča primerjanje računalniških algoritmov, ki napovedo strukturo proteinov, katerih resnična struktura je bila nedavno eksperimentalno določena (a še ni javna). Tam je AlphaFold vse od izuma za razred boljši od konkurence.
A pomembne so številke. Še pred dvema letoma smo pisali, da poznamo strukturo 170.000 proteinov. Odkar obstaja AlphaFold, se je to število povečalo na milijon. Sedaj pa so znane strukture vseh poznanih proteinov, torej približno 200 milijonov. To vključuje proteine, ki jih imajo živali, rastline, bakerije, arheje in vsi drugi organizmi. Poznavanje njihovih struktur bo dalo velik pospešek aplikativnemu raziskovanju v vedah o življenju, denimo iskanju zdravil in zdravljenju nekaterih genskih bolezni. Ob tem je treba vedeti, da gre vendarle za izračune in ocene. V nekaterih primerih je lahko napoved AlphaFolda nenatančna, a pričakovati je, da se bo algoritem sproti učil in izboljševal.