» »

128gb workstation

128gb workstation

joker605 ::

Zdravo,

v naslednjih 2h mescih bi rad postavu workstation za deep learning, kater mora met 128gb ddr4 rama, 4tera SSDja in usaj 4x1080ti oz titane (nagibam se na 1080ti, ker je ful cenejša in nima tolko slabšega performanca)

Zatakne se pri ramu, ker ne vem, keri proci s platami sploh podpirajo tolko rama, menda ma threadripper tolko supporta ( in dost pcie lane-u, 4x16 za gpuje)

Ma kdo kake izkušnje s tem, da me usaj u pravo smer napoti, da ne bom prej obrnu pou googla.

lp

zee ::

Za deep learning IMO ne rabis prav dosti RAM-a - kakopak je to odvisno od problema, ki se ga bos polotil.

Za zacetek bi predlagal 32 GB ali 64 GB, ki ga kasneje po potrebi nadgradis; pomni, da je strezniski pomnilnik zelo drag.

1070 Ti ti bo prav dobro sluzil za manj denarja kot 1080 Ti, serija Titan je zastarela, mocno tudi dvomim, da rabis stiri kartice, dve bosta vec kot dovolj.

Za procesorje glej Intel Xeon Silver/Gold z oznakami 61xx.

Katero programsko opremo bos poganjal? Ce ti ta ne podpira GPU-jev, je sploh skoda denarja za graficne kartice.

Se to: pripravi se, da bos odstel ~4-5 kEUR za to postajo.
zee
Linux: Be Root, Windows: Re Boot
Giant Amazon and Google Compute Cloud in the Sky.

Zgodovina sprememb…

  • spremenilo: zee ()

pegasus ::

Ali pa glej nvidijin dgx workstation. Če si ga ne moreš privoščiti, ga imej kot hw referenco.

Invictus ::

geizhals.eu

Poišči kaj rabiš...
"Life is hard; it's even harder when you're stupid."

http://goo.gl/2YuS2x

FireSnake ::

zee je izjavil:

Za deep learning IMO ne rabis prav dosti RAM-a - kakopak je to odvisno od problema, ki se ga bos polotil.

Za zacetek bi predlagal 32 GB ali 64 GB, ki ga kasneje po potrebi nadgradis; pomni, da je strezniski pomnilnik zelo drag.

1070 Ti ti bo prav dobro sluzil za manj denarja kot 1080 Ti, serija Titan je zastarela, mocno tudi dvomim, da rabis stiri kartice, dve bosta vec kot dovolj.

Za procesorje glej Intel Xeon Silver/Gold z oznakami 61xx.

Katero programsko opremo bos poganjal? Ce ti ta ne podpira GPU-jev, je sploh skoda denarja za graficne kartice.

Se to: pripravi se, da bos odstel ~4-5 kEUR za to postajo.



Če vzame ThreadRipperja ne rabi strežniškega pomnilnika.

Je kakšen poseben razlog, da je edina izbira (po tvoje) Xeon Silver/Gold? Ker, če je tako bi bilo treba zadevo primerjati z Epycom.
Poglej in se nasmej: vicmaher.si

pegasus ::

joker605 je izjavil:

Zdravo,

v naslednjih 2h mescih bi rad postavu workstation za deep learning, kater mora met 128gb ddr4 rama, 4tera SSDja in usaj 4x1080ti oz titane
Čemu 4 gpuji? Če boš obdeloval tako velike probleme, da ti ne sedejo v en gpu memory, potem nujno glej nvlink oz. nvidia dgx station. Če so tvoji problemi manjši od gpu memoryja in bi rad obdeloval 4 hkrati, potem ok. Na vsak način se skušaj izogniti situaciji, da bi imel večino podatkov v main memory in jih ves čas premetaval v gpu in nazaj.
Also, za ML se sedaj kupuje volte. Tensor core-i so vredni denarja.

Mavrik ::

Drugače mi trenutno na firmi uporabljamo HP Z series workstatione ki so skonfigurirani s 64GB in 128GB rama. Poglej če ti nudijo to kar rabiš.
The truth is rarely pure and never simple.

pegasus ::

Aja, preden vržeš kup denarja v škatlo (vem, mikaven hobi), preveri še cloud ponudbo. Ker škatle zelo verjento ne boš gonil 24/7 nekaj let skupaj, ti zna biti cloud ponudba cenovno učinkovitejša.

zee ::

Je kakšen poseben razlog, da je edina izbira (po tvoje) Xeon Silver/Gold? Ker, če je tako bi bilo treba zadevo primerjati z Epycom.


ECC RAM. IMO je to modro imeti za resno delo.

Drugače mi trenutno na firmi uporabljamo HP Z series workstatione ki so skonfigurirani s 64GB in 128GB rama. Poglej če ti nudijo to kar rabiš.


Jap. Podobno tu.

Aja, preden vržeš kup denarja v škatlo (vem, mikaven hobi), preveri še cloud ponudbo. Ker škatle zelo verjento ne boš gonil 24/7 nekaj let skupaj, ti zna biti cloud ponudba cenovno učinkovitejša.


Se en glas za oblak. Delovna postaja s toliko pomnilnika in graficnimi karticami pozre kar nekaj elektrike in odda kar nekaj toplote.
zee
Linux: Be Root, Windows: Re Boot
Giant Amazon and Google Compute Cloud in the Sky.

klinker ::

Halo, ECC registered je cenejsi od navadnega rama, unbuffered pa tu nekje z navadnim ramom.

joker605 ::

hvala za odgovore, čeprav mi večina nč ne pomagajo.

Sistemske zahteve za gpu so min 1080ti, 1070ti ma premalo rama. Tolko kot mam rama skupi na gpujih (44gb), bom potreboval sistemskega x2.

Glede na to, da dobim 1080ti za 700e, dvomim da mi bojo 4 kartice računale počasneje kot ena za 4k evrov (glej sliko).

 benchmark TensorFlow

benchmark TensorFlow



V nobenem primeru ne mislim met clouda, ker bo workstation delal 24/7 usaj nekaj mescev.

Edina omejitv CPUja je ta, da mora podpirat 64pcie lane-ov (vsak gpu bo porabil 16xpcie bandwitha). Kupil bi pa najcenejši CPU s tem supportom.

Plata mora pa podpirat 8xsata, ker bom meu na njej 8x 500gb ssdje.

Appe katere bojo GPUji računal: TensorFlow, PyTorch, Caffe, CNTK ...

Okvirna cena sistema je 6k.

pegasus ::

joker605 je izjavil:

dvomim da mi bojo 4 kartice računale počasneje kot ena za 4k evrov
Računale? Ne. Jih boš le s težavo uspel futrat s podatki? Da.

Če si tu želiš zmanjšat težave, išči "single pci root" rešitve. Preberi zakaj. Če te to ne zanima, pač vzami fancy desktop plato ...

joker605 ::

Tega ne štekam najbujši.

Kaj pa je bottleneck? Če procesor podpira 64pci lajnov, in gpu nuca vsak 16x, v teoriji (in praksi) bi moglo sfurat, sej majo tolko bandwitha do procesorja kot ga nucajo, al ne?

pegasus ::

Poleg bandwidtha obstaja tudi latenca ... In o njej se ne govori veliko, ker jo marketingarji ne marajo, ker je pogojena s fiziko.

Koliko te to prizadane, je močno odvisno od tega, kaj boš počel in kako boš poganjal svoje zadeve.

joker605 ::

kako bi pol blo najbolj optimalno pa najcenejše 4gpuje postavt v en workstation?

pegasus ::

Prvi hit na googlu: https://lambdal.com/raw-configurator?pr...
Ceneje ne boš prišel skozi, tudi če zbiješ skupaj desktop pc iz starih gajbic in lepenke.

Če hočeš met kolikor toliko izkoriščen hw, boš najmanj potrojil budget ali pa se sprijaznil s kompromisi. Btw, aws p3 s štirimi voltami je okrog $12 na uro, google pa ima tudi svoje TPUje na voljo v GCE.

joker605 ::

Kaj me zdej zajebavaš, kaj mi limaš te konfiguracije ka so po 10k, ka lahko z boljšim procom (threadripperjem) pridem bolj poceni čez (6k). Zanimalo me je kaj si meu čez latence povedat pametnega, da je bolj kompatibilno z določenem hardwarjem, ne pa nabijat prve linke z googla.
Pa ne govor mi potem o izkoriščanju hardwara, ka i7 6850 ma "samo 40" pcie lines, tr pa 64. Tolko pol lahko govorimo o izkoriščanju HWja.

klinker ::

Ti predlagam da pegasusa malo bolj resno jemljes in se ne repencis prevec, ker pozna pro sceno ohoho bolje od tebe in marsikoga, verjetno vseh tu ;)

joker605 ::

Mogoče jo, ampak njegov odgovor nikakor ni na mestu, sploh ker sem biu v prejšnjem njegovem postu okaran glede izkoriščenosti HWja, potem pa dobim link kjer kaže nasprotje temu kar je trdil.

Lambda labs fura 4x 1080ti (cca 10k usd) na i7 6850 kater ima 40 lane-u, potem bo menda threadripper fural lahko isto zadevo na 64 laneih bolj izkoriščeno. Če je zdej tukaj problem v matični, verjetno ma TR tud high end plate usaj tolko dobre kot i7 6 generacije.

Isotropic ::

pegasus je izjavil:

Prvi hit na googlu: https://lambdal.com/raw-configurator?pr...
Ceneje ne boš prišel skozi, tudi če zbiješ skupaj desktop pc iz starih gajbic in lepenke.

Če hočeš met kolikor toliko izkoriščen hw, boš najmanj potrojil budget ali pa se sprijaznil s kompromisi. Btw, aws p3 s štirimi voltami je okrog $12 na uro, google pa ima tudi svoje TPUje na voljo v GCE.
rofelj... mogoče je tole kakšna opcija s hostanjem serverja pri njih in je zato tako drag, ampak tole je v vsakem primeru občutno previsoka cena (mogoče edino zaradi rama, samo dvomim, da se toliko pozna). edit: proc 300e na MF, matična kakšnih 500e, ram nekaj nad jurja non-ecc, najcenejša grafa 900e (približno), PSU pojma nimam, 200-300e recimo. koliko še manjka do 10k? ni nobenega razloga, zakaj nebi bil skylake xeon ali threadripper v homebuildu popolnoma ustrezen. ne vem, koliko pcie stez rabijo kartice ali koliko se pri tem izkorišča proc, bi se pa mogoče dalo priti skozi tudi z desktop sistemom (če so vsi podatki v ramu graf npr.).

Zgodovina sprememb…

pegasus ::

Ja sej ... še vedno ne vemo narave in obsega problema, moja kristalna krogla je trenutno pokvarjena, tako da natančnega odgovora ne morem dati. Še najboljši odgovor je ja, TR ima 64 pci stez, a jih je nekaj porabljenih za periferijo na plati, tako da na plati s štirimi sloti dobiš dva x16 in dva x8. In spet ne moremo nič reči, ali je to ok ali ne.

Isotropic ::

vseeno ena kišta za 10k od nekih overpriced builderjev ni pravi odgovor, sploh z zastarelimi komponentami (2011-3 socket). posebne mem compatibility problemov pa pri intelih tudi ni.

Isotropic ::

glede stez ugibam, da ni problem, samo je treba najti kakšno ploščo, ki ima tisti PLX čip.
konec koncev ima nvidia to tudi na trenutnem DGX workstationu, samo da malo bolj refinirano.

zee ::

Sodelavcu v Sloveniji sem sestavljal delovno postajo z dvema 1080 Ti in je bila cena ~4.6 kEUR za sistem s samo 32 GB, enim SSD-jem in nekaj diskovja za hrambo. Dvomim, da bo sistem s štirimi karticami cenejši.
zee
Linux: Be Root, Windows: Re Boot
Giant Amazon and Google Compute Cloud in the Sky.

FireSnake ::

joker605 je izjavil:


Okvirna cena sistema je 6k.
Poglej in se nasmej: vicmaher.si

joker605 ::

ja,

ram: 1200 (128gb)
cpu: 400 (TR 1900X)
mobo: 300
ssd: 115x8 (500gb)
GPU: 700-800x4 (1080ti)
PSU: 300
ohišje: 200

cca 6100-6500eur

Zgodovina sprememb…

  • spremenil: joker605 ()

hojnikb ::

joker605 je izjavil:

Kaj me zdej zajebavaš, kaj mi limaš te konfiguracije ka so po 10k, ka lahko z boljšim procom (threadripperjem) pridem bolj poceni čez (6k). Zanimalo me je kaj si meu čez latence povedat pametnega, da je bolj kompatibilno z določenem hardwarjem, ne pa nabijat prve linke z googla.
Pa ne govor mi potem o izkoriščanju hardwara, ka i7 6850 ma "samo 40" pcie lines, tr pa 64. Tolko pol lahko govorimo o izkoriščanju HWja.

TR nima exposanih 64 lanov za grafike, ker so 4 za čipset in 4 za m.2, ostalo (56) pa ostane res za pcie naprave.
In ne, število pcie lanov ni vse. Kot je pegasus povedal že, važne so tudi latence. Pa še kakšen podatek (pogooglaj za HSA in kako nekatere probleme APUji rešujejo dost hitrej, z kjub precej manj shader enot).
#brezpodpisa

joker605 ::

ja, ampak če je ena kartica na 8x, pomeni da bo imela max 10% izgube zarad vodila, tko pravejo na forumih kjer klapa že ma workstatione. Med tem pa na enem TRju komot tečejo 4 gpuji.
lambda labs ma sisteme z TRjem, i7-6850k za 4gpuje in 2x Xeon(R) Processor E5-2650 na supermicro plati z 8karticami.

hojnikb ::

sj če maš 40 lanov, bo tut kamot laufalo na x8.

Mislim, da bo lažje če definiraš točne probleme, ki jih boš reševal, bo lažje potem sestavit optimaln konfig.
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

joker605 ::

TR ma 64 lajnov, tko da bi šlo 3x16x in 1x 8x.

TensorFlow, PyTorch, Caffe, CNTK

WizzardOfOZ ::

Si si potem sestavil mašino?

zee ::

WizzardOfOZ je izjavil:

Si si potem sestavil mašino?


IMO je bila to še ena troll tema...
zee
Linux: Be Root, Windows: Re Boot
Giant Amazon and Google Compute Cloud in the Sky.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Etherum mining (rudarjenje) (strani: 1 2 3 460 61 62 63 )

Oddelek: Kriptovalute in blockchain
3108474442 (83173) Jagdpanter
»

Pomoč pri sestavi Zverine od računalnika (strani: 1 2 )

Oddelek: Kaj kupiti
8918111 (6913) overklocker
»

Nvidia Volta (strani: 1 2 3 413 14 15 16 )

Oddelek: Strojna oprema
795114275 (66268) tikitoki

Več podobnih tem