Druga generacija največjega procesorja v zgodovini

Jurij Kristan

25. apr 2021 ob 20:35:12

Firma Cerebras, ki je predlani presenetila z orjaškim procesorjem WSE, velikim za vso silicijevo rezino, je razkrila njegovega naslednika WSE-2, ki je iste fizične velikosti, a ima več kot dvakrat toliko elementov.

Sredi leta 2019 je ameriško zagonsko podjetje Cerebras na prireditvi Hot Chips razburkalo področje računalniških procesorjev s predstavitvijo na videz nemogočega čipa: WSE ali Wafer Scale Engine ima površino največjega kvadrata, ki ga še lahko dobimo iz 300-milimetrske silicijeve proizvodne rezine, to je 22×22 centimetrov. Vanj je s 16-nanometrskim TSMCjevim proizvodnim procesom "natisnjenih" 1,2 bilijona tranzistorjev, ki sestavljajo 400.000 računskih jeder in 18 gigabajtov pomnilnika. Podobno udaren je videti računalniški sistem CS-1, ki so ga okoli čipa zgradili in so ga predstavili tisto jesen, saj WSE hladi s 4-kilovatnim tekočinskim sistemom. WSE je namenjen strojnemu učenju in superračunalnikom, njegov smisel pa je tako v hitrosti kot varčnosti pri elektriki ter prostoru. Ker so povezave med elementi v samem siliciju hitrejše kot med različnimi GPGPU karticami, gre za hitrejšo in elegantnejšo rešitev. Hkrati z 20 kW potrebne moči CS-1 porabi skoraj desetkrat manj električne energije kot primerljive omare s Teslami, obenem pa je tridesetkrat manjši. Cena CS-1 je sicer približno poltretji milijon ameriških dolarjev, od česar dva milijona odpadeta na sam WSE.

Na drugi strani je na videz blazno izdelovati čip, kjer lahko že nekaj napak na siliciju pomeni, da moraš vreči proč vso rezino. Hkrati pa ga je z obstoječimi procesi litografije tudi zelo težko napraviti, ker je velikost čipa v praksi omejena z velikostjo maske (reticle size), s katero na silicij projicirajo električna vezja. Maske gredo lahko tja do okoli 800 kvadratnih milimetrov, se pravi v okolico največjih Nvidijinih čipov, in če hočemo še večji izdelek, je potrebno učinkovito spojiti različne predele rezine, kar je doslej veljalo za nepraktično. Cerebras orje ledino ravno pri tem pristopu in je zbral lep kupček s tem povezanih patentov, na podlagi katerih je moral TSMC zanje močno spremeniti svojo proizvodno linijo. Danes vemo nekaj več okoli tega, kako je podvig sploh izvedljiv. Zaslužna je stara dobra redundanca, saj so WSE zasnovali z dodatnim številom elementov v višini 1,5% nazivne količine. Danes pravijo, da je to zaradi visoke zanesljivosti TSMCjeve proizvodnje v bistvu še preveč.

Na roko jim gre tudi način delovanja samega procesorja, kajti uporabljajo napreden prevajalnik, ki za dejanski program z optimizacijo grafov predvidi najprimernejši kos silicija za uporabo in ga šele nato dinamično dodeli za izvajanje izračunov. Uporabnik pa lahko vse preprosto spiše s pomočjo PyTorcha ali TensorFlowa, ne da bi se mu bilo treba ubadati s posebnostmi čipa. Zato ni nenavadno, da so si kljub ekperimentalni naravi izdelka v dveh letih priborili "več ducatov" uporabnikov, med katerimi so nekateri najvidnejši svetovni laboratoriji in multinacionalke, kot sta Argonne National Laboratory in GlaxoSmithKline. Ti CS-1 uporabljajo za vse od klasičnega strojnega učenja do preračunavanj v genetiki, zdravljenju raka, farmaciji in iskanju gravitacijskih valov.


Druga generacija procesorja, WSE-2, prispe v drugi polovici letošnjega leta in je zelo premočrtna nadgradnja, osnovana na prehodu na TSMCjev 7-nanometrski proizvodni način. To pomeni, da je kos silicija fizično enake velikosti, a ima zaradi višje gostote veliko več elementov - več kot dvakrat, oziroma 2,6 bilijona. Delovnih jeder je tako v WSE-2 850.000, pomnilnika pa 40 GB. Višja bo tudi cena, a točna postavka še ni znana. Videti pa je, da se poraba ne bo bistveno povišala, kajti računalnik CS-2 je na papirju nadvse podoben predhodniku; najvišja delovna moč naj bi znašala med 22 in 24 kilovati, kar pomeni, da bo WSE-2 očitno kuril nekaj nad 15 kW, hladilni sistem bo potreboval blizu 5 kW, ostalo pa bo odpadlo na izgube.