Izrastki na površini virusa so protein S, ki ga zaradi cepiva izdela naše telo in predstavi imunskemu sistemu.
Nukleotidi vsebuje fosfatno skupino, pentozni sladkor (ribozo v RNK ali deoksiribozo v DNK) in bazo (A, G, C, T/U)
Cepivo vsebuje aktivno učinkovino, ki je modRNA z ustreznim genskim zapisom, ter pomožne snovi. Poglejmo najprej slednje. Evropska agencija za zdravila (EMA) je v odobritvi navedka tudi seznam pomožni snovi (stran 9), ki so voda, saharoza (namizni sladkor), natrijev klorid (kuhinjska sol), natrijev hidrogenfosfat dihidrat (Na2HPO4 . 2H2O), kalijev klorid (KCl) in kalijev dihidrogenfosfat (KH2PO4). To so soli, ki so normalno prisotne v telesnih tekočinah, in so v cepivu zato, da ima ustrezno ionsko moč, da v celica ne povzroči osmoznega šoka. Celične membrane so prepustne za vodo, ki prehaja z mesta z višjo koncentracijo proti nižji, zato voda brez raztopljenih soli vdira v celice in povzroči, da popokajo. V praksi vsi vemo, da ne smemo piti večjih količin destilirane vode in da morajo biti infuzije fiziološka raztopina in ne voda. Poleg tega ima cepivo še holesterol, DSPC (1,2-distearoil-sn-glicero-3-fosfoholin), ALC-0159 (2-[(folietilenglikol)-2000]-N,N-ditetradecilacetmid) in ALC-0315 (((4-hidrobutil)-azandiil)bis(heksan-6,1-diil)bis(2-hexildekanoat)). Zapletenim imenom navkljub so to sorazmerno preproste maščobne molekule. Holesterol je maščoba z gonansko strukturo, ki v cepivu nima veliko skupnega z zloglasnimi proteinskimi skupki LDL in HDL, ki jih običajno določamo, ko govorimo o holesterolu. To so namreč večji delci proteinski delci, ki prenašajo več molekul maščob po telesu. Naloga maščob v cepivu je zaščita dednine v cepivu, saj ustvarijo maščobne nanodelce, v katere je ujeta modRNA.
Svet in biologija namreč nista tako spektakularna, kot bi nam radi prikazali hollywoodski filmi. Če bi v telo naivno vbrizgali tujo RNA ali DNA, ne bi proizvedli nobenega mutiranega organizma. Imunski sistem bi v sodelovanju z encimi preprosto pomalical tuji genski zapis, ne da bi to sploh opazili. To se nam dogaja dnevno. S prehranjevanjem v telo vnesemo ogromno tujega DNK in RNK, pa niti ne opazimo. Tudi ko nas poleti grizejo komarji, klopi in drug mrčes, v kri dobimo tujo dednino, ki tam hitro razpade (bolj problematično je, če nam podarijo kakšnega zajedavca, bakterijo ali virus). Sam genski material je sila nebogljen in neobstojen, zato tudi virusi, ti do skrajnosti poenostavljeni zasevki življenja (ali so sploh živi?), še vedno ohranijo ovojnico, v katero je oblečena njihova RNA ali DNA. In tako mora tudi dedni material v cepivu imeti maščobno ovojnico, da se lahko prinese do celic in vanje vstopi.
Ko genski material cepiva vstopi v celico, se zadržuje v citoplazmi. V jedro celice se ne more prenesti, a v resnici ga tam niti ne potrebujemo, saj je tam zgolj glavna celična DNA. V vsakem genskem materialu je zapis za izdelavo proteinov, ki se proizvajajo na ribosomih. Ti berejo informacijsko RNA, ki si jo lahko predstavljamo kot kopije relevantnih delov DNA. Ustrezni encimi najprej preberejo DNA v jedru in jo prepišejo v mRNA, ki potem potuje iz jedra v citoplazmo. Ribosomi niso preveč izbirčni. Vsako mRNA (ustrezno oblikovano, glej spodaj), ki jo najdejo, z veseljem prevedejo v proteine. In cepivo jim podtakne tako RNA, ki seveda ni prišla iz celičnega DNA, kar pa ribosoma popolnoma nič ne moti.
Poglejmo sedaj, kaj jim podtakne cepivo (BNT162b2 oziroma Tozinameran). Celotno zaporedje ima 4284 nukleotidov. Posamezen nukleotid vsebuje baze, sladkor ribozo in fosfatno skupino. To je osnovni gradnik RNA (in tudi DNA, če je sladkor deoksiriboza). Medtem ko sta riboza in fosfatna skupina pri vsakem nukleotidu enaka in predstavljata ogrodje, kamor so baze pripete, se slednje razlikujejo. V DNA so te adenin (A), gvanin (G), citozin (C) in timin (T), v RNA pa funkcijo timina opravlja uracil (U). V 30 mikrogramih RNA, ki je prisotna v odmerku cepiva, je zapisano vse, kar potrebujemo za obrambo pred virusom.
V teh 4284 znakih je 8568 bitov informacije (za vsako bazo so štiri možnosti, torej za njen zapis potrebujemo dva bita), torej približno 1 kilobajt. Celoten virus pa ima približno štirikrat več informacij. Genski zapis beremo v trojkah. Razlog je preprost - s štirimi črkami želimo zapisati vsaj 20 različnih besed, kolikor je aminokislin, ki gradijo proteine. To pa pomeni, da si moremo privoščiti nekaj redundance. Tričrkovnih možnosti je 64 (imenujemo jih kodoni), aminokislin pa 20. Narava tu ni bila enako pravična, saj za triptofan kodira le eno zaporedje (UGG), zato vsaka točkovna mutacija povzroči zamenjavo aminokisline, medtem ko je za levcin možnosti šest (UUA, UUG, CUA, CUC, CUG, CUU). To bo pomembno kasneje.
Celotna genska koda v cepivu je objavljena, enako velja tudi za protein S v virusu (in tudi celoten virus). Kakor v računalništvu, tudi v genetiki koda vsebuje določene glave, smerokaze, usmeritvene podatke itd. Začne se z nukleotidoma GA, ki predstavljata kapico na 5'-koncu (konca RNA verige označujemo 5' in 3', ker so ciklični sladkorji riboze kot ogrodje v verigo povezane na mestih 3 in 5). Ta kapica je nujno potrebna, da je mRNA sploh aktivna, podobno kot imajo skripte v Linuxu na začetku deklaracijo #!. Sledi del, ki se ne prepisuje (UTR - untranslated region). Ta je nujno potreben, ker ribosom ne more začeti brati od začetka, saj se mora fizično pritrditi na mRNA, s čimer sam sebi blokira nekaj začetnih nukleotidov. Prepisovanje se začne po kodonu AUG, ki označuje začetek proteina. Prvi krajši del je signalni peptid - to je krajši del nekaj aminokislin, ki niso del proteina S, temveč imajo usmerjevalno funkcijo. Pripete so na začetek nastalega proteina in vsebujejo informacije, kaj naj celica z njim naredi: naj se še kako dodatno spremeni (posttranslacijske modifikacije), denimo pripne metilna skupina na določene aminokisline, kam naj odpotuje itd.
Torej po dveh nukleotidih kapice, 52 nukleotidih, ki se ne prevajajo, se prevede 48 nukleotidov v signalni protein (s 16 aminokislinami), potem pa sledi šele zapis za protein S (nukleotidi 103-3879). Če primerjamo ta zapis z zapisom za isti protein v dejanskem virusu, opazimo nemalo razlik, zato se ta RNA imenuje modificirana (modRNA). Prva očitna razlika je odsotnost uracilov. Namesto črke U je v kodi Ψ, ki predstavlja 1-metil-3'-psevdouridilil. Razlog je precej zvit. Tuja RNA v telesu ni ravno dolgoživa, saj jo imunski sistem uniči. Izkaže pa se, da ta zamenjava imunski sistem prepriča, da RNA ni nevarna, zato jo pusti pri miru, medtem ko pri prevajanji RNA v proteine ta zamenjava ne povzroča težav, saj jo ribosomi še vedno normalno berejo kot U. Zato so v cepivu dosledno vsi U zamenjani s Ψ. Druga sprememba je zamenjava nekaterih A in Ψ/U z G in C, kadar to ne vpliva na aminokislino, ki jo kodira kodon (več kodonov kodira isto aminokislino, kot smo videli zgoraj). V dvoverižni DNA ima to za posledico večjo stabilnost, saj so med G in C tri vodikove vezi, med A in T pa dve. V RNA je veriga le ena, a te modifikacije so vseeno koristne, ker povečajo učinkovitost prevajanja in sinteze. Vse te spremembe na končni izdelek nimajo vpliva - še vedno se sintetizira enak protein S kakor ga ima virus. Pravimo, da so to sinonimne substitucije.
Podroben pregled pa pokaže, da sta dve substituciji drugačni. Dva kodona sta spremenjena tako, da namesto valina in lizina kodirata za prolin. To je nujno, da je protein S, ki ga izdela celica, enake oblike kakor tisti na virusu. Imunski sistem namreč prepoznava obliko, zato mora biti ta karseda enaka. Če izdelamo protein S v celici in ga pustimo samega, se sesede v drugačno obliko od tistega, ki je pripet na virusno ovojnico. Imunski odziv bi se zato naučil prepoznavati protein, ki ni enak virusnemu, kar bi bilo neuporabno. S to zamenjavo pa povzročimo, da je protein S, ki je sam v raztopini, enake oblike kakor virusni. Ni naključje, da je ključ ravno prolin, saj je to edina aminokislina s ciklično strukturo, ki nima primarne aminske skupine, temveč sekundarno. V praksi to pomeni, da je precej bolj rigidna. Če jo vpnemo na pravo mesto, "zaklene" strukturo proteina.
Na koncu sledita dva kodona UGA, ki sta stop kodona - tam ribosom ustavi sintezo proteina. Sledi del, ki se ne prevaja (3'-UTR), a mora tam biti. Funkcij je več, veliko jih še ne poznamo, a zagotovo vpliva na poliadenilacijo, učinkovitost prevajanja, stabilnost same mRNA in lokacije, kje se nahaja. mRNA se zaključi z zaporedjem A, ki varuje pred degradacijo. Ob vsaki uporabi jih nekaj odpade, zato obstaja optimalna vrednost, s koliko A se mora mRNA končati za optimalno izražanje gena.
Če strnemo: V cepivu je vodna raztopina nekaj soli, ki skrbijo za primeren pH in ionsko moč, da celice ne doživijo šoka, ter kup maščob, ki skrijejo genski zapis mRNA, da se lahko brez uničenja prebije v celice. Omenjena mRNA v celici ostane v citoplazmi, kjer ribosomi iz nje proizvajajo enak protein S, kot ga ima virus na površini, da se imunski sistem potem nauči odzvati nanj. Da je cepivo učinkovitejše, mRNA v cepivu ni čisto enak kakor v virusu. Namesto nukleotida U (uracil) uporablja sintetični analog, da se izogne uničenju s strani imunskega sistema, prav tako pa ima zamenjave, ki ne vplivajo na izražene aminokisline, a poskrbijo za učinkovitejšo sintezo. Na dveh mestih sta aminokislini zamenjani, s čimer se zagotovi, da oblika osamljenega proteina S ostane enaka tistemu na virusu. Zaradi teh modifikacij govorimo o modificirani informacijski RNA (modRNA). Sama RNA pa vsebuje začetno kapico, del, ki se ne prevaja, signalni oligopeptid, relevantni del za prevajanje v protein, končni del, ki se ne prevaja, ter poliadenilno zaščito pred degradacijo. V celici mRNA seveda ne ostane dolgo, temveč hitro razpade.