AMD predstavil GPGPU družino Instinct MI200

Jurij Kristan

10. nov 2021 ob 08:57:38

V AMDju so pokazali svojo bržkone najbolj ambiciozno serijo izdelkov za superračunalnike doslej, linijo GPGPU čipov Instinct MI200, na arhitekturi CDNA2, ki bo jedro prvega ameriškega eksaflopnega superračunalnika, Frontier.

Nvidia se je v preteklem desetletju s teslami in sorodnimi izdelki dobro utrdila na področju grafičnih čipov za splošno računanje (GPGPU) za oblak ter superračunalnike. Toda oba glavna procesorska tekmeca, Intel in AMD, se vztrajno dvigata. Prvi prihaja na prizorišče s čipi Ponte Vecchio, ki so osnova nastajajočega superračunalnika Aurora. AMD pa je po vzoru grafične arhitekture RDNA2 za domače uporabnike, kjer je Nvidio že skoraj dohitel, sedaj predstavil CDNA2, s katero namerava hoditi tekmecu v zelje še v superračunalniškem, oziroma strežniškem segmentu. Na tej zasnovi so zgrajeni izdelki z nalepko Instinct MI200, ki bodo na voljo v prvih mesecih prihodnjega leta; že sedaj pa podjetje z njimi izpolnjuje naročilo za ameriško ministrstvo za energetiko, ki v Oak Ridgu gradi superračunalnik Frontier, prvo ameriško napravo te sorte, katere zmogljivost naj bi prebila mejo enega eksaflopa (10¹⁸ Flopsov). Ta projekt je sicer doslej največja zmaga za AMD na področju superračunalništva.

Tako RDNA kot CDNA sta arhitekturi, izšli iz AMDjeve GCN, le da se je prva razvejila proti igričarstvu in domačim uporabnikom, medtem ko je druga namenjena čipom GPGPU. CDNA smo prvič spoznali lansko leto, ko je podjetje predstavilo prve instincte, MI100. Z njihovimi nasledniki cilja precej višje, pri čemer je še posebej zanimivo, v katerih smereh so izvedli izboljšave. Struktura samih čipov je namreč skoraj nespremenjena in nosijo v bistvu celo za kanček nižje število stream procesorjev od predhodnikov. Toda. Kot prvo: na enotnem pakiranju sta pravzaprav dva! Izdelki MI200 so namreč prvi v GPGPU segmentu, ki uporabljajo čiplete. Končni čip je tako pravzaprav napravljen iz dveh čipletov, katerim AMD pravi Graphics Compute Die ali GCD, in sta med seboj povezana s štirimi vodili Infinity Fabric 3.0. Toda zmogljivost na papirju je še veliko višja od dvakratnika pretekle. Druga in poglavitna novost se skriva v drobovju - v širini vektorskih aritmetičnih logičnih enot, ki je podvojena na 64 bitov. To pa pomeni, da je mogoče vektorske operacije v formatu FP64 izvajati po eno na cikel, oziroma dvakrat hitreje kot prej (in pri konkurenci). Čipi MI200 imajo tako kar okoli štirikrat višjo zmogljivost v FP64 kot pretekle generacije. Cena se odraža v električni porabi, ki znaša kar 560 W in zahteva tekočinsko hlajenje. Tu se vidi, da se je AMD načrtno usmeril v klasične superračunalnike, medtem ko Nvidia zadnja leta v svojih izdelkih krepi predvsem elemente za matrične operacije, pomembne pri strojnem učenju.

Družina MI200 bo sicer vsebovala tri izdelke. Najzmogljivejši je MI250X, rahlo obtesan je MI250, medtem ko v nedoločeni prihodnosti prispe tudi PCIe kartica MI210, o kateri niso povedali še ničesar. Oba doslej predstavljena čipa sta napravljena v TSMCjevem procesu N6 in povezana s 128 gigabajti pomnilnika HBM2E - prav tako na istem pakiranju. Za to je zaslužen nov način spajanja vezij, ki ga podjetje imenuje Elevated Fanout Bridge (EFB) 2.5D. Gre za podobno reč kot je Intelov EMIB, pri čemer pa silicijev mostiček z vodili za povezovanje stoji na substratu in ne v njem. Zato pri AMDju pravijo, da ima pristop podobne zmogljivosti kot Intelov, a je hkrati cenejši in enostavnejši za proizvodnjo, ker ni treba rezkati v substrat.