AMD na tekmo v strojnem učenju odgovarja z novimi epyci in MI300
Jurij Kristan
15. jun 2023 ob 09:04:47
Pri AMDju so delno popolnili družino strežniških procesorjev EPYC 4 z dvema specializiranima linijama, obenem pa širijo serijo pospeševalnikov strojnega učenja MI300.
Eksplozija generativnih algoritmov in velikih jezikovnih modelov je proti nebu pognala tudi zaslužek podjetij, ki zagotavljajo strojno hrbtenico dejavnosti, kot je nedavno pokazala Nvidia z vnovičnimi rekordnimi številkami. Zato je logično, da je bila AMDjeva poletna predstavitev novosti za podatkovne centre v mnogočem osrediščena okoli vprašanja, kako se bo procesorski velikan čim bolj uspešno zajedel v pogačo, ki vzhaja na AI-noriji. Oziroma - kako bo tekmoval z Nvidio. Seveda takšne strategije ne nastanejo iz danes na jutri in odgovore na vprašanja tega tržišča so okvirno zastavili že leta nazaj, zato je prireditev v bistvu minila v znamenju izpolnjevanja preteklih obljub, pa tudi z nekaj (manjšimi) presenečenji.
Tako smo že lanskega novembra, ob lansiranju družine strežniških procesorjev EPYC 4, vedeli, da letos prispejo še tri specializirane podrazličice, od katerih so to pot predstavili dve. Bergamo je kodno ime za arhitekturo epycov, strogo usmerjenih v čim višje število jeder in namenjenih storitvam v oblaku, z optimizacijo za virtualizirana okolja. Jedra so delno zasnovali na novo in zato nosijo ime Zen 4c (cloud), na posameznem čipletu pa jih je tokrat 16. Največje različice procesorjev imajo po 8 čipletov in torej skupno 128 jeder, se pravi še 32 več od običajnih epycov 4. Genoa-X pa je različica osnovnega Epyca 4 z dodatnim vertikalnim predpomnilnikom L3 (V-Cache), podobno kot pri namizniških procesorjih X3D, oziroma predhodnikih Milan-X. Največji model s 96 jedri tako nosi dodatnih 768 MB L3, oziroma skupno 1152 megabajtov. AMD nam je sedaj dolžan še lansiranje cenejših in varčnejših epycov Senoa, o katerih naj bi več povedali jeseni.
Najbolj impozanten del prezentacije se je odvil na koncu, pri platformi strežniške grafične tehnologije Instinct MI300, kjer se serija izdelkov veji v dve smeri. Doslej smo poznali osnovno različico, ki združuje procesna jedra Zen 4, grafično arhitekturo CDNA 3 in 128 GB pomnilnika HBM3. Ti modeli bodo odslej nosili oznako MI300A, kajti tokrat so predstavili tudi vejo zgolj z GPU jedri, MI300X. 3 čiplete z zeni 4 so nadomestili z dvema CDNA 3 čipletoma in gor pribili 192 GB pomnilnika HBM3. Takšna rešitev je namenjena predvsem poganjanju velikih jezikovnih modelov (LLM), kot so GPTji. Trenutno s tovarniških linij prihajajo prvi instincti MI300A, ki jih bo nosil superračunalnik El Capitan, medtem ko naj bi MI300X prispeli jeseni.