Novi izdelki za superračunalnike iz obeh grafičnih taborov
Jurij Kristan
19. nov 2020 ob 08:29:09
AMD je predstavil naslednjo generacijo izdelkov iz svoje linije grafičnih čipov za splošno računanje Instinct, MI100, ki je prva na temelju arhitekture CDNA. Tudi Nvidia je po le šestih mesecih prenovila Ampere A100 in naznanila implementacijo v obliki delovne postaje, DGX Station A100.
Medtem ko ima AMDjeva grafična arhitekturna paradigma za poganjanje iger naziv RDNA(2), se tista za GPGPU imenuje CDNA in jo je podjetje predstavilo letošnjega marca. Gre za prve rešitve za compute na temelju arhitekture Navi, s katerimi želi AMD mešati štrene Nvidiji tudi v superračunalnikih. Zeleni so spričo razširjenosti Tesel in priljubljenosti ter optimiziranosti programske platforme CUDA tam zelo dobro vkopani, toda dejavnik, na katerega se AMD lahko opre, je tudi tu uspeh njihovih strežniških procesorjev EPYC, kar je dobro vidno v novi generaciji GPGPU čipov, Instinct MI100. Ena od njenih odlik je denimo raba druge generacije vodila Infinity Fabric, ki MI100 omogoča elegantno delitev pomnilniškega naslovnega prostora s procesorji EPYC.
Snovalci so se v MI100 sicer očitno osredotočili na zmogljivosti v režimih FP64 in FP32, kjer oglašujejo prevlado nad Nvidijinim A100, oziroma "prvi HPC GPU s prek desetimi teraflopi moči". Seveda gre za marketinško govorico, kajti dejanska zmogljivost je odvisna najprej od konkretnega računskega problema, nato pa še programske optimizacije, kjer AMD trenutno še ne blesti, vsaj v primerjavi s prevladujočo Cudo. A če pogledamo zmogljivosti čez palec, MI100 očitno poseka tekmeca v FP64 in FP32, medtem ko ga A100 prehiti v ostalih režimih, se pravi INT8, INT4, bfloat16 itd. Zanimiv vključek v MI100 zna biti Matrix Core Technology, vezje za optimizacijo matričnih operacij v mešani natančnosti, ki je v čipu pripojeno vsaki računski enoti (EU), nekako podobno kot vezje za raytracing v RDNA. Instinct MI100 trenutno pozna izvedbo v obliki PCIe 4.0 kartice in uporablja 32 GB pomnilnika HBM2. Prvi primerki naj bi do naročnikov prišli še pred koncem tega leta.
Prav na pomnilniku HMB2 pa sloni posodobitev Nvidijinega A100, do katere, presenetljivo, prihaja že šest mesecev po majski splovitvi. Razlog je bržkone preprosto v tem, da sta Samsung in Hynix uspela konkretno zagnati proizvodnjo novejše izvedbe pomnilnika, HBM2E, ki ima tako višjo prepustnost kot razpoložljivo velikost. A100 tako pride v novi različici z 80 GB HBM2E, ki ga je dvakrat več kot v obstoječi, ima pa tudi za četrtino višjo prepustnost - 2 TB/s proti 1,6 TB/s. Starejša inačica, ki se sedaj imenuje A100 40 GB, bo ostala v prodaji. Tudi A100 80 GB je prvenstveno namenjen platformam HGX in DGX, medtem ko PCIe izvedbe vsaj na štartu še ne bo poznal. So pa v podjetju za tiste, ki ne potrebujejo orjaških 8-procesorskih sistemov, razvili kompaktnejšo delovno postajo, DGX Station A100 s štirimi, ki uporablja kompresorski hladilni sistem. A100 v 80 GB inačici in DGX Station naj bi na trg prispela januarja.