» »

ISC 2019

ISC 2019

pegasus ::

Tako kot minula leta smo letos znova na ISCju.

Začel sem s tutorialom o kompresiji znanstvenih podatkov, ki je boleča tema približno povsod. Dosegljiv je na https://goo.gl/m6KeQP . LLNL je razvil zfp, Argonne pa SZ. Oba sta velik korak naprej, tako v hitrostih (zfp cuda implementacija dosega 150GB/s pri stiskanju) kot v učinkovitosti.
  • spremenil: pegasus ()

zee ::

Uživaj!

Letos sem žal ostal doma, čeprav so moji novi šefi tam. :D
zee
Linux: Be Root, Windows: Re Boot
Giant Amazon and Google Compute Cloud in the Sky.

Zgodovina sprememb…

  • spremenilo: zee ()

pegasus ::

Popoldne sedim na tutorialu projekta Better Scientific Software. Malo razočaran, ker predstavljajo "moderna" agile orodja kot so github in trello. Ja, HPC folk šele sedaj odkriva, da to obstaja. Vendar ima vsaj znanstvena skupnost problem, ker te softver design & architecture pristope dojema kot nekaj nepotrebnega in čas odvzemajočega. Tipičen timeline znanstvenika je problem, eksperiment, podatki, softver za njihovo obdelavo, zaključek, članek, zdravo. Kaj se potem dogaja s softverom ni več njihov problem. Bo treba močno pritisniti na revije, da kot predpogoj objave članka zahtevajo ponovljivost rezultatov, ki jih je nekdo pridelal s svojim softverom ...

zee ::

Se strinjam. Verjetno bi bilo to najbolje obliki kakšnega Juptyer notebook-a.
zee
Linux: Be Root, Windows: Re Boot
Giant Amazon and Google Compute Cloud in the Sky.

pegasus ::

Opening keynote me je prijetno presenetil. Prvi slide je prikazal posnetek razvoja embria sadne mušice, ki so ga zajeli na našem inštitutu in obdelali na "mojem" clustru. Cela zbirka enih občutkov ;)

top500.org talk se sedaj začenja. Stran je že osvežena, pravijo da ni bistvenih novosti na vrhu. Bomo videli, kakšne bodo analize trendov.

Spock83 ::

Lepa. Bom z veseljem spremljal to temo.

pegasus ::

Analiza top500 se je posvetila predvsem vplivu konca Dennard scalinga na trende rasti in na distribucijo sistemov po državah in proizvajalcih, kjer se še vedno vidi, da ima Kitajska zelo nenaravno (med vrsticami: politično motivirano) distribucijo. Trenutna projekcija za exascale je 2023 +- 1 leto.

Fascinanten mi je bil hpcg/hpl ranking, kjer K, stroj iz 2010, še vedno drži tretje mesto. Ilustracija, kako je memory bandwidth pomemben za real world aplikacije. Omembe vredno je tudi dejstvo, da je med top50 sistemi kar 23 homogenih, brez nekih gpujev ali sorodnih acceleratorjev. Kar še vedno kaže na percepcijo kompliciranosti programiranja heterogenih sistemov, čeprav smo zjutraj na keynoteu na primeru OpenFPM videli, da temu ni več tako.

Trenutno sedim na green500 BoFu, da vidim, kaj menijo o stagnaciji na vrhu, kjer že leta vztraja pezy z xeon-d based sistemom zettascaler. Počasi je že čas, da se pojavi naslednji korak na p/w poti ...

Zgodovina sprememb…

  • spremenil: pegasus ()

pegasus ::

Green500 lista ima probleme sama s sabo ... ugotavljajo, da so v začetku preveč površno zastavili pogoje, pod katerimi se mora izmerit poraba, številke ki jih dobivajo niso primerljive in sedaj tuhtajo, ali naj naredijo reset ali obstaja kaka boljša pot ven iz godlje. Meh. Tako da bolj malo tehnikalij.

Me je pa presenetil beegfs bof - soba nabita do zadnjega kotička. Očitno postaja beegfs priljubljena rešitev ... imajo ljudje dovolj preglavic z lustrom in gpfs.

Intlov pogled v prihodnost je bil letos popolnoma pričakovan. CPUji niso več zanimivi, sedaj je vse v AI in novih softverskih stackih okrog AI in upravljanja z infrastrukturo. Od hardvera so zares izpostavili le optane (itak), med drugim z benchmarkom, ki sem ga zasnoval še v Arcturju pred štirimi leti. Torej sem na letošnjem ISCju bil v enem dnevu posredno že 2x na platnu ;)

Če koga intlova vizija zanima podrobneje, naj si ogleda daos in geopm. Ti dve tehnologiji bosta jedro Aurora sistema, skupaj s kupom xeonov in Xe kartic, nekako v stilu power+volta v današnjih sistemih Summit in Sierra.

Sejmišča še nisem podrobneje pregledal. Videl sem le, da je pri Sugonu strašna gužva, vsi namreč hočejo poslikati in pofotkati brbotanje v Nebula bladeih. Kar impresivno velik rack :)

pegasus ::

Mixed precision computing je zelo očitno pot naprej. Gustafson je predstavil svoje posite z dodatkom natančnega vektorskega dot producta, LLNL oseba je predstavila implementacijo zgoraj omenjenega ZFP algoritma za (lossy!) kompresijo float podatkov v ramu, grk iz japonskega Rikena pa je pokazal implementacijo positov v fpgajih. 10 let star fpga dosega s posit math zmogljivosti današnjih cpujev pri množenju matrik. Kar impresivno.

Positi obljubljajo *najmanj* 2x pohitritev, v praksi opažene vrednosti prek 400x. ZFP implementacija ponuja 14x pohitritev brez bistvene izgube natančnosti (okrog 0.1%), fpgaji pa so poljubno hitri, odvisno kako svež model vzamete v roke. Še vedno čakamo uradno najavo, kdo bo to prvi implementiral v dostojen proc. Moram it malo trolati dol po razstavišču ;)

pegasus ::

Sejmišče se mi letos zdi bolj glasno in polno kot minula leta. Je treba precej povzdigniti glas, da se lahko pogovarjaš. Za to niso krivi glasni ventilatorji po mašinah (z nekaj izjemami), pač pa večje število ljudi in več interesa za ponujano kramo. Preveril sem vse manjše novince v resnem server segmentu (asrock, gigabyte, tyan) in vsi že imajo amd v ponudbi. Vsi veliki še ga še nimajo, kar da jasen signal, kako močno so se navezali na intel. A to jih sedaj tepe in novinci imajo možnost dobiti kak posel, ki ga sicer nebi ... stvari so spet zanimive.

Prisotni so tudi openpower ljudje z raptor ponudbo ter s primerki opencompute power serverjev. Inspur ima tudi cel power rack na ogled. ARM je že praktično povsod, od Craya navzdol. Google razkazuje tudi svoje tpuje, ki jih ponuja skozi svojo cloud ponudbo. Tudi fpgaji so praktično povsod, letos prvič tudi vodno hlajeni. Vsekakor zelo pestro in dinamično v primerjavi z minulimi leti :)

HotBurek ::

Kul napisano. Je možno dodat še kakšno sliko razstavljene opreme iz sejmišča?
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

pegasus ::

Pridejo jutri zvečer, ko bom imel nekaj časa zanje.

Trenutno sedim na "hcp 2030" talku. Ti so vedno zabavni, crystall ball style fantazije kaj bi če bi ko bi. Tokrat je nekdo celo zastavil vprašanje, kdo bo vse to plačal :D Namreč ugotavljajo, da vse alternativne tehnologije ala quantum in neuromorphic ne bodo nadomestile obstoječih clustrov, bodo jih le dopolnjevale v nekem heterogenem sestavu, kjer bo vsaka komponenta počela to, kar najbolje zna. Nekako kot gradniki (ala legokocke), iz katerih si vsak sestavi orodje, ki ga potrebuje. Opazka na mestu tu je, da nobena od teh novih tehnologij nima nekega mainstream use casea, ki bi poskrbel za množičnost in s tem cenovno dostopnost. Tu ima neuromorphic potencial prehiteti quantum ... a bo preteklo še nekaj vode, da se najprej vsaj neuromorphic začne uveljavljat v nekem consumer segmentu.

Osebno bi rad videl vsaj arme v consumer laptopih do te mere, da userji pridejo fehtat za arm serverje, da bodo lahko svoje containerje poganjali na njih enake kot na laptopih ... Držim pesti, da pridemo do tega v naslednjih petih letih.

pegasus ::

Kolegi vremenarji so veseli kot otroci, ker so končno dobili prototipni rack s skoraj 100TB optane memoryja. Na njej so podvojili io performance svojih modelov in se spravili v stanje, da za počasnost ne morejo več kriviti storagea in lahko spet začnejo odpravljat io ozka grla v svoji kodi. Sistem jim omogoča mirno spanje v smislu, da imajo sedaj jasno vizijo, kako do 2030 doseči resolucijo 1km globalno prek celega planeta.

pegasus ::

Ker slo-tech še nima novičke o novostih s top500, si lahko več preberete npr. tu: https://www.nextplatform.com/2019/06/18...

jeremenen ::

Hvala za update. Lepo je videt, da tudi unum in posit dobivata moment. Kaj se pa dogaja z DB, ki jih pohitrijo GPU-ji e.g. OmniSci etc.? Kaj novega pri hlajenju? 3M od Novec je že nekaj časa na trgu. Bi pričakoval polno novih produktov, ki presegajo računsko gostoto blade sistemov.

pegasus ::

Hlajenje ... proizvajalci stiskajo zobe, ker morajo dejansko zadnjih par let za vsako novo generacijo cpuja na novo zdizajnirat celo škatlo. Ni več isti tdp in isti socket, kot je intel vlekel večji del desetletja, vsak proc pride z novimi socketi, busi, rami, večjimi zahtevmai po hlajenju ... in še kar so lani prodajali kot hw za naslednjih pet let, letos umikajo in obljubljajo posodobljene verzije "kmalu". Intel je šel iz 80w prek 120, 150 in sedaj do 205w tdp ter s stunt zlepki na 350-400w. Tudi novim amd rimljanom se je tdp dvignil. Fizika je pač neizprosna ... Olajšanje bo, ko bodo šli nazaj na single socket sisteme in začasno odrinili te termične probleme v prihodnost, a pri tej hitrosti razvoja le za nekaj let. Tekočinsko hlajenje v taki ali drugačni obliki bo postalo nuja.

Današnji popoldanski keynote je bil naslovljen "HPC beyond Moore's law" in z veseljem sem ugotovil, da je moj talk na DevOps Days Ljubljana 2015 še vedno spot on. Takrat sicer nisem imel časa iti v podrobnosti o vzrokih smeri razvoja, a je že takrat bilo jasno, kaj se dogaja. General purpose vezja gredo počasi v smeri muzeja, vedno več algoritmov se bo selilo v namenska specializirana vezja, v fpga ali asic obliki. Predavatelj je za ilustracijo "razstavil" iphone, ki v svoji zadnji iteraciji vsebuje že skoraj 30 ločenih namenskih hw komponent in razložil, da že razvijajo vezja za pde, fft in za simulacijo kapljevin. Jutri bo še en cel talk na temo ekonomike vsega tega, ki bo zelo verjetno malo prizemljil vse te reči ...

pegasus ::

Ekonomik je malce razočaral. Ali pa sem pričakoval preveč, kar je bolj verjetno. Pač nima kristalne krogle in se ukvarja bolj s tem, kako se opazke na top500 listi odražajo v dejanski ekonomiji. In suprise, se. Kdor se ni v začetku tisočletja uspel paralelizirati, je postal nekonkurenčen v multicore obdobju. Iz česar se da podobno sklepati, da kdor ne bo sedaj našel specializiranih vezij za pospešitev svoje dejavnost, čez nekaj let ne bo več konkurenčen. No, upam, da mu uspe izluščiti konkretne zgodbe in jih objaviti kot motivacijo vsem današnjim jamračem.

Za zaključek je tako kot že 16x do sedaj na koncu potrolal vse po spisku Thomas Sterling, starosta, ki si to lahko privošči. Upam, da kak njegov talk spravijo na youtube, so res vredni ogleda. Baje da so bila vsaj nekatera predavanja snemana, jih polinkam, ko jih objavijo.

pegasus ::

Nekaj slikic in posnetkov ...

Imperij vrača udarec:


 Armi vsepovsod, lepo spakirani na tesno

Armi vsepovsod, lepo spakirani na tesno



 Moderna umetnost

Moderna umetnost



 Sugon Nebula je kar impresivno velika omara, 320kW v 80 bladeih. Na voljo tudi v lepi integrirani obliki "silicon cube".

Sugon Nebula je kar impresivno velika omara, 320kW v 80 bladeih. Na voljo tudi v lepi integrirani obliki "silicon cube".



 Še eno hlajenje za jedrski reaktor, HPE SGI 8600

Še eno hlajenje za jedrski reaktor, HPE SGI 8600



O teh monstrumih so se že začeli pogovarjati kot o dinozavrih. Sumim, da bodo v naslednjem desetletju popolnoma izginili iz razstavišča. Letos so namreč velike prazne razstavne prostore že imeli vsi večji cloud providerji, ki razen svojega logotipa in ene osamljene osebe nimajo nič za pokazati. Sem se pa danes zjutraj pustil pogostiti na amd+ms+cray zajtrku, kjer so razkazali, kako se je cray spetljal z Azure na AMD mašineriji in kaj lahko pri njih dobiš. Za info, najmanjša začetna enota je login + infrastruktura in nekih 2800 jeder, vsak naslednji dodatek je 4600 jeder. Zdi se mi, da dobiš kar en cel rack, rasteš pa lahko do 18k jeder v enem jobu. Kar bi moralo zadostovati za vse možne cloud bursting scenarije. Baje da Azure gosti fizične Cray stroje, brez virtualizacij, integriran je zgolj provisioning in networking. Je to prihodnost?

Zgodovina sprememb…

  • spremenil: pegasus ()

pegasus ::

Sedim na workshopu na temo data intensive computation. Tokrat manj o hardveru in številkah in precej več o upravljanju teh podatkov, pregled nad metapodatki, organizaciji dela ...
Vremenarji ugotavljajo, da jim je še najlažje, ker imajo jasno in relativno enostavno strukturo podatkov, s katerimi delajo. A dobesedno prosijo celo skupnost, naj se vsede skupaj in definira standardizirane apije za upravljanje z ogromnimi množicami podatkov v vseh vejah znanosti. Plemenita poteza, a bo glede na moje dosedanje izkušnje le težko uspela. Držim pesti.

pegasus ::

Do sedaj smo spoznali še nekaj metodologij merjenja performanc različnih storageov in njihove primerjave. Vsi benchmark fani, tema je tako komplicirana, da se z njo še vedno resno ukvarjajo akademiki. Izvedeli smo tudi, kako so se lotili načrtovanja naslednjega all-flash lustre setupa pri nersc za njihov bodoči perlmutter sistem. Model je relativno enostaven, bolj zanimivo je zbiranje vseh vhodnih podatkov. A zaključki so enaki kot pri meni - 1dwpd flash je vrh glave dovolj za hpc scratch, realno potrebuješ le okrog 0.3 dwpd. Primerno mesto za masivne prihranke v nabavni ceni hardvera.

pegasus ::

No, lahko vsaj preberete kaj je modroval Sterling: https://www.hpcwire.com/2019/06/20/isc-...

pegasus ::

https://www.hpcwire.com/2019/06/21/is-w... ... Tole je že en kul talk, ki sem ga spregledal. Vremenarji so kar face.

pegasus ::

En utrinek iz sejmišča - med bolj zanimivimi kosi ne-hpc hardvera so bili https://www.acmeportable.com - škatlice, o kakršnih sem že fantaziral, da bi se jih lotil sestavit kot hobi projekt. Torej povprečna kišta, namesto stranice zaslon, tipkovnica kot pokrov in nekje v škatli še baterija in ups. Praktično mobilen desktop z lastnim napajanjem. Tile strici so to idejo razvili do konca in ponujajo razne zelo zanimive variacije :)

pegasus ::

Končno so objavljeni rezultati študentskega tekmovanja: https://www.hpcwire.com/2019/07/15/isc1...
Če uspem najti še kake konkretne številke, kako so se odrezale alternativne arhitekture, jih prilepim.

pegasus ::

Nimam boljše, teme, zato tole objavljam kar tu:

terryww ::

pegasus je izjavil:

Nimam boljše, teme, zato tole objavljam kar tu:

Vau, ves RAM je na čipu in benchmark kaže, da je hiter kot GPU. Se da že dobit kak dev sample workstation :)?
It is the night. My body's weak.
I'm on the run. No time to sleep.

pegasus ::

Ja, Fujitsu jih je že lani poleti okrog ponujal. Fugaku mora biti sedaj že precej postavljen, upam da letos poleti vidimo že kake številke.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

ISC 2018

Oddelek: Znanost in tehnologija
111409 (1115) pegasus
»

Lestvica TOP500 je osvežena

Oddelek: Novice / Omrežja / internet
105222 (2916) Mr.B
»

ISC15

Oddelek: Znanost in tehnologija
223314 (1232) pegasus
»

ISC14

Oddelek: Znanost in tehnologija
213075 (2163) pegasus
»

ISC13 Lepizig

Oddelek: Znanost in tehnologija
161924 (1383) pegasus

Več podobnih tem