Wired News - Da spletni velikani potiskajo meje prilagoditev strežniške opreme najprej je bilo že dalj časa znano, saj je za npr. Google že dalj časa znano, da so izdelali svojo konfiguracijo, na kateri temeljijo njihovi strežniki, Amazon bi naj za svojo storitev Glacier prav tako uporabljal posebno nizkoenergetsko opremo, pri tem pa ne zaostaja niti Facebook. Kako močno se je spremenilo tržišče za strežnike pove že podatek, da so leta 2008 HP, Dell in IBM pokupili 75 odstotkov vseh strežniških procesorjev, danes pa 75 odstotkov pokupi osem podjetij, med katerimi najdemo tudi že omenjeni Google.
Prilagajanje procesorjev zahtevam strank je tako samo naslednji logični korak, ki pa je do danes večinoma ostajal v domeni zahteve izbire specifične serije procesorjev. Kljub na papirju istim karakteristikam procesorji pridejo iz proizvodnje linije z različnimi karakteristikami - določene serije procesorjev so bolj energetsko učinkovite, spet druge najhitrejše, in ko si dovolj velika živina, lahko izbereš katero serijo bi kupil. Odstopanja, o katerih je govora so seveda že zaradi narave izredno natančnega proizvodnjega procesa zelo majhna, a ko je vaš račun za elektriko sedem ali več mestno število, se takšne razlike poznajo.
Spet drugič pridejo velikani do proizvajalcev z zahtevami po prilagoditvah samih procesorjev. Vsa vpletena podjetja so sicer zelo skrivnostna o obsegu prilagoditev, ki so jih že izvedli, a na podlagi nakupov, ki sta jih v zadnjih mesecih opravila Intel in AMD je očitno, da se na tem področju nekaj kuha. Največji problem na tem področju pa se morda presenetljivo pojavlja Intelu, saj je slednji daleč najbolj prilagojen za proizvodnjo masovnih serij procesorjev, kar jim po drugi strani precej zavezuje roke pri proizvodnji prilagojenih procesorjev. AMD je nekoliko bolje opremljen za soočenje s tem problemom, tretje podjetje, ki se je zadnje čase pojavilo na tem področju, pa je ARM. Še dodatna prednost ARMja pa je, da dejansko ne izdelujejo svojih čipov, ampak jih licencirajo, kar omogoča še več prilagoditev zahtevam kupca.
Ko namreč stranka prosi Intel ali AMD za določeno prilagoditev, je pogosto najbolj ugodno, da prilagoditev konča v vseh procesorjih, kar pa ubije konkurenčno prednost, zaradi katere se je kupec na prvem mestu obrnil na Intel ali AMD direktno. Intel bi tako naj v preteklosti že izdelal Atom N570 procesorje upoštevajoč "pomembne in specifične predloge" SeaMicroja, podjetja, ki se specializira za izdelavo nizkoenergetskih strežnikov, AMD pa je tudi za specifične stranke že izključil določene dele procesorja za nižjo porabo energije in dodal inštrukcije.
ARMjev poslovni model je po drugi strani popolnoma prilagojen temu, saj njihove stranke praviloma njihovo intelektualno lastnino prilagodijo specifičnemu telefonu ali napravi, a zaenkrat še niso dovolj močni na strežniškem področju, da bi podjetja posegala po njihovih procesorjih.
Novice » Procesorji » Procesorji, prilagojeni potrebam strank, počasi začenjajo svoj pohod na strežnike
Isotropic ::
iz enega drugega foruma
I take this to mean they (Intel) weight their willingness to implement ISA extensions based on the expectations given to them regarding the prospects of future sales if said future processors contained said ISA extensions.
In other words Intel didn't just decide in a vacuum that the world needed SSE4.2 or FMA. They were probably given unsolicited and solicited guidance that such ISA extensions would be most appreciated (sales) by specific big-name high-volume customers and based on those inputs they put their design teams to work on ensuring their grand(er) plans incorporated and comprehended those inputs such that the final product made as many fat-walleted customers happy as possible at the same time.
Mask sets are expensive, but even more expensive is the validation process. Just look at the year long gap between SB and SBE. That is a few hundred engineers soaking up an extra year's worth of compensation package just to validate the functionality of a pre existing CPU's microarchitecture with a few extra circuits built into it.
I doubt the value add for whatever extra spice a facebook or a google might extract from having just a few more specialized instructions added on top of that could ever be met by the added expense versus that same company just buying an equal amount of extra processing power in terms of adding more boxes to an existing server farm.
If the value (performance) added was really that great then they probably wouldn't be running x86 in the first place, they'd go completely customized Power7 or Itanium at that point IMO.
znano je tut, da je ibm naredil neko custom izdajo power procesorja za xbox.
I take this to mean they (Intel) weight their willingness to implement ISA extensions based on the expectations given to them regarding the prospects of future sales if said future processors contained said ISA extensions.
In other words Intel didn't just decide in a vacuum that the world needed SSE4.2 or FMA. They were probably given unsolicited and solicited guidance that such ISA extensions would be most appreciated (sales) by specific big-name high-volume customers and based on those inputs they put their design teams to work on ensuring their grand(er) plans incorporated and comprehended those inputs such that the final product made as many fat-walleted customers happy as possible at the same time.
Mask sets are expensive, but even more expensive is the validation process. Just look at the year long gap between SB and SBE. That is a few hundred engineers soaking up an extra year's worth of compensation package just to validate the functionality of a pre existing CPU's microarchitecture with a few extra circuits built into it.
I doubt the value add for whatever extra spice a facebook or a google might extract from having just a few more specialized instructions added on top of that could ever be met by the added expense versus that same company just buying an equal amount of extra processing power in terms of adding more boxes to an existing server farm.
If the value (performance) added was really that great then they probably wouldn't be running x86 in the first place, they'd go completely customized Power7 or Itanium at that point IMO.
znano je tut, da je ibm naredil neko custom izdajo power procesorja za xbox.
Zgodovina sprememb…
- spremenil: Isotropic ()
Isotropic ::
je pa amd ze najavil, da bodo pripravljeni integrirati 3rd-party IP v svoje cpuje. samo ne vem kako, da jim nebi bilo treba mask delat na novo (€€€€€). mogoce prek interposerja.
pegasus ::
Prejšnji teden sem gledal AMD prezentacijo posebne serije opteronov, prilagojene za througput computing (big data etc), ki imajo disablane skoraj vse floating point enote (ostaneta samo še dve) iz enostavnega razloga, ker jih ne potrebujejo. Tip je kazal benchmarke nekih aplikacij, kjer se pomanjkanje FPjev na zmogljivosti praktično ne pozna, prihranek energije pa je očiten.
Če obstaja trg za take štose in če obstaja stranka, ki ima denar, well, go for it, ne čakaj.
Če obstaja trg za take štose in če obstaja stranka, ki ima denar, well, go for it, ne čakaj.
Jst ::
Amm... saj je to "neuradno znano" že kar nekaj časa, da Intel/AMD/Nvidia/ARM delajo custom čipe za velike firme. No, se šušlja. To sem jaz prvič slišal ene 2008.
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|
Bistri007 ::
To so male relativno majhne prilagoditve za velike stranke, ne drugi produkti.
ARM in Atom nimata kaj iskati na strežniku, njihov performance/watt je zelo slab. Za težke računske operacije pa je GPGPU.
ARM in Atom nimata kaj iskati na strežniku, njihov performance/watt je zelo slab. Za težke računske operacije pa je GPGPU.
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...
RejZoR ::
Ti low power čipi so za domače serverje kjer rabiš zmogljivost za osebne potrebe.
Angry Sheep Blog @ www.rejzor.com
pegasus ::
ARM in Atom nimata kaj iskati na strežniku, njihov performance/watt je zelo slab. Za težke računske operacije pa je GPGPU.
Wrong & wrong.
Arm ima z malce truda daleč najboljši performance per watt, gpuji pa so primerni samo za računske operacije, ki jih lahko enostavno izvajaš vzporedno.
Še amd talk, ki sem ga omenjal prej:
Zgodovina sprememb…
- spremenil: pegasus ()
krneki0001 ::
ARM in Atom nimata kaj iskati na strežniku, njihov performance/watt je zelo slab. Za težke računske operacije pa je GPGPU.
ARM mogoče res ne, Atom pa ima nekaj procesorjev, ki so večjedrni in podpirajo virtualizacijo. Atomi Z5XX so večjedrni in podpirajo virtualizacijo. Torej dovolj plat s temi procesorji pa recimo hyperV gor in zadeva bo delovala.
Asrock X99 Extreme 4 | Intel E5-2683V4 ES | 64GB DDR4 2400MHz ECC |
Samsung 250GB M.2 | Asus 1070 TI | 850W Antec | LC Tank Buster
Samsung 250GB M.2 | Asus 1070 TI | 850W Antec | LC Tank Buster
Poldi112 ::
>Arm ima z malce truda daleč najboljši performance per watt, gpuji pa so primerni samo za računske operacije, ki jih lahko enostavno izvajaš vzporedno.
Pa ima tudi performance?
Pa ima tudi performance?
Where all think alike, no one thinks very much.
Walter Lippmann, leta 1922, o predpogoju za demokracijo.
Walter Lippmann, leta 1922, o predpogoju za demokracijo.
Isotropic ::
web serverji obicajno ne rabijo hpc-level performance, rabijo pa veliko threadov.
isto map-reduce.
isto map-reduce.
Zgodovina sprememb…
- spremenil: Isotropic ()
pegasus ::
pegasus ::
Približala, a bo p/w še vedno boljši na armu. Že zato, ker se mu ne bo treba ukvarjati z x86 ukaznim naborom in njegovimi komplikacijami ...
Nekako dvomim, da bo "off the shelf", ki ga ponuja x86 svet, vreden več kot bo cena energije v exaflop svetu. Zato bi si upal stavit, da prva exaflop mašina ne bo x86, ampak nekaj drugega - arm ali power, bomo videil.
Nekako dvomim, da bo "off the shelf", ki ga ponuja x86 svet, vreden več kot bo cena energije v exaflop svetu. Zato bi si upal stavit, da prva exaflop mašina ne bo x86, ampak nekaj drugega - arm ali power, bomo videil.
Isotropic ::
mips
a ni kina obljubljala, da bo naslednja gen. procev imela 1tflop na procesorju? (izvedljivo, ce imas kaj podobnega avx2 in dosti jeder)
The updated 8-core 65 nm Loongson 3B processor runs at 1.05 GHz, with a peak performance of 128 GFLOPS double-precision or 256 GFLOPS single-precision.[10] This is accomplished by having two 256 bit vector processing units in each core. They produce a peak performance of 8 double-precision floating-point fused Multiply-Add results per cycle, or 16 GFLOPS per core operating at 1 GHz. The Godson-3B has exceptional energy efficiency in terms of performance per watt -- executing 128 GFLOPS using 40 watts
ajd, do 1tf rabijo se dost dela, imajo pa se rezerve v clocku in procesu.
vira se mi iskat trenutno ne da, ker moram na wc :)
pa pomoje so tut legacy x86 decoderji powered down, kadar niso v uporabi, sploh pri avx. avx2 in 3 bosta imela se to prednost, da bosta rabila dva-tri cikle, da se instrukcija izvrsi, kar pomeni, da spet lahko odklopis decoder oz. neuporabljane enote.
a ni kina obljubljala, da bo naslednja gen. procev imela 1tflop na procesorju? (izvedljivo, ce imas kaj podobnega avx2 in dosti jeder)
The updated 8-core 65 nm Loongson 3B processor runs at 1.05 GHz, with a peak performance of 128 GFLOPS double-precision or 256 GFLOPS single-precision.[10] This is accomplished by having two 256 bit vector processing units in each core. They produce a peak performance of 8 double-precision floating-point fused Multiply-Add results per cycle, or 16 GFLOPS per core operating at 1 GHz. The Godson-3B has exceptional energy efficiency in terms of performance per watt -- executing 128 GFLOPS using 40 watts
ajd, do 1tf rabijo se dost dela, imajo pa se rezerve v clocku in procesu.
vira se mi iskat trenutno ne da, ker moram na wc :)
pa pomoje so tut legacy x86 decoderji powered down, kadar niso v uporabi, sploh pri avx. avx2 in 3 bosta imela se to prednost, da bosta rabila dva-tri cikle, da se instrukcija izvrsi, kar pomeni, da spet lahko odklopis decoder oz. neuporabljane enote.
Zgodovina sprememb…
- spremenil: Isotropic ()
pegasus ::
Ja, kitajci so tudi aktualni, pa japonci že delajo naslednika Kei mašine (majo 6 letni cikel razvoja), tko da ...
Btw, intlov "xeon phi" (ex knights corner, ex larabee) že ima avx4, kjer je na voljo ljudem, ki mislijo, da to rabijo.
1 tflop na čip danes ni več nič posebnega, sveže grafične imajo 3tflop single precision (amd) in 2tflop double precision (nvidia), samo to so še vse teoretične številke, če v praksi prideš blizu polovice tega, si že svetovna faca ...
Btw, intlov "xeon phi" (ex knights corner, ex larabee) že ima avx4, kjer je na voljo ljudem, ki mislijo, da to rabijo.
1 tflop na čip danes ni več nič posebnega, sveže grafične imajo 3tflop single precision (amd) in 2tflop double precision (nvidia), samo to so še vse teoretične številke, če v praksi prideš blizu polovice tega, si že svetovna faca ...
pegasus ::
krneki0001 ::
Jap procesorji za cloude. Ogromno procesorjev, ki pa se ob neuporabi izklapljajo in s tem lahko šparamo na porabi.
Zanimiva zadeva:
Zanimiva zadeva:
It will be very interesting to see how a chassis full of QCT S910 sleds loaded up with a dozen two-core Xeon E3-1220L v3 parts, which run at 2.3GHz and burn at 17 watts, stacks up against a chassis loaded up with 24 QCT S900 sleds with 48 Centerton Atoms matches up. The densest Atom version will have 96 cores compared to 24 for the Xeon E3 version. That's four times the cores and maybe 45 per cent lower clock speed if the Centerton comes in at around 1.3GHz. On workloads that don't need high-speed networking (Gigabit speeds are fine) or fat cores with lots of main memory (distributed web apps often don't), then the Atom box will have about twice the computing oomph in a 3U rack and maybe burn 30 per cent less juice.
Asrock X99 Extreme 4 | Intel E5-2683V4 ES | 64GB DDR4 2400MHz ECC |
Samsung 250GB M.2 | Asus 1070 TI | 850W Antec | LC Tank Buster
Samsung 250GB M.2 | Asus 1070 TI | 850W Antec | LC Tank Buster
Zgodovina sprememb…
- spremenilo: krneki0001 ()
Bistri007 ::
ARM in Atom nimata kaj iskati na strežniku
Also, oglej si malo kaj Intel razvija pod imenom Centerton. Jup, serverski atom :)
OK, si me dobil - nisem mislil mikro strežnika, ampak to, kar uporablja 8 podjetij iz novice v svojih podatkovnih centrih. Oziroma to, kar se razume pod strežnik v večini podjetij.
Arm ima z malce truda daleč najboljši performance per watt, gpuji pa so primerni samo za računske operacije, ki jih lahko enostavno izvajaš vzporedno.
Pegasus, to je malo bolj resni test od tvojega citiranega s Phoronixa:
But, says Hill, even if you assume 11.26 watts for the ECX-1000 socket, then the Calxeda ARM server is doing around 489 Apache Bench requests per second, per watt, and the low-voltage part plus the faster networking option gives Intel's Xeon E3 v2 a 28 per cent performance per watt advantage over the ARM server.Xeon ima tudi nižjo latenco, kar ni zanemarljivo pri QoS.
Vir: http://www.theregister.co.uk/2012/08/13...
Z izjavo "gpuji pa so primerni samo za računske operacije, ki jih lahko enostavno izvajaš vzporedno" si se ustrelil v nogo. A veliko malih švohotnih ARM je OK, še več malih švohotnih GPU pa ne?
Seveda GPGPU zahteva paralelne algoritme, ampak tudi enostavni multicore jih: brez tega je brezveze govoriti o tem, kako naj bi bilo veliko malih ARMov boljših kot Xeon. GPGPU seveda ni mišljen za I/O bound workload, pač pa za obsežnejše preračunavanje (HPC pa take fore).
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...
krneki0001 ::
Glede šparanja na energiji je bolje 10 atomov ali 20 armov kot 4 xeoni. Zakaj, če imaš virtualizacijo v cloudu, potem ko ni obremenitve izklapljaš jedra in prestavljaš vse na čimmanj jeder. Pri atomu eno jedro požre 2W, pri xeonu vsaj 17W in tukaj je ta uporabnost teh majhnih mašin.
Asrock X99 Extreme 4 | Intel E5-2683V4 ES | 64GB DDR4 2400MHz ECC |
Samsung 250GB M.2 | Asus 1070 TI | 850W Antec | LC Tank Buster
Samsung 250GB M.2 | Asus 1070 TI | 850W Antec | LC Tank Buster
pegasus ::
to je malo bolj resni test od tvojega citiranega s Phoronixa:
Ki bazira na domnevah o prototipnem izdelku, sure ... i buy ;)
Te zadeve kar dokaj blizu spremlja, sem jih tudi že šlatal. Za določene namene bodo super, za vse pa pač ne.
Seveda GPGPU zahteva paralelne algoritme, ampak tudi enostavni multicore jih: brez tega je brezveze govoriti o tem, kako naj bi bilo veliko malih ARMov boljših kot Xeon. GPGPU seveda ni mišljen za I/O bound workload, pač pa za obsežnejše preračunavanje (HPC pa take fore).
Programer ima veliko dela predelati algoritem, originalno spisan za en core, tako, da teče na štirih. Še več, da teče na npr. 64 corih. Če pa mu porineš stotine primitivnih corov, ki si z prvotnimi niti ne delijo naslovnega prostora, pol te pa sploh nekam pošlje, da ga že nehaj za***avat. Tako da po tej plati je veliko arm corov varjanta, ki je bližje realnemu svetu, kot pa gpuji; Zaradi tega se mi zdi AMDjev pristop k dizajnu hardvera tu veliko bolj smiseln. Upam samo, da amd finančno preživi toliko časa, da realizirajo integracijo cpu+gpu in da vzpostavijo softverski ekosistem okrog tega.
Bistri007 ::
krneki0001 je izjavil:
Glede šparanja na energiji je bolje 10 atomov ali 20 armov kot 4 xeoni. Zakaj, če imaš virtualizacijo v cloudu, potem ko ni obremenitve izklapljaš jedra in prestavljaš vse na čimmanj jeder.
Ampak je potrebno upoštevati porabljeno energijo od PSU najprej (MB, HDD itd), ne samo na procesorju...
Programer ima veliko dela predelati algoritem, originalno spisan za en core, tako, da teče na štirih. Še več, da teče na npr. 64 corih. Če pa mu porineš stotine primitivnih corov, ki si z prvotnimi niti ne delijo naslovnega prostora, pol te pa sploh nekam pošlje, da ga že nehaj za***avat.
Napišeš lambda izraz, ki nima stranskih učinkov (funkcionalno programiranje). Potem pa je na dispatcherju, da porazdeli izvajanje na več jeder. Ne razumem o kakšna razlika v dizajnu programa naj bi bila med 4 in 64 jedri...
Malo si preberi glede C++ AMP (GPGPU): http://msdn.microsoft.com/en-us/library...
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...
krneki0001 ::
krneki0001 je izjavil:
Glede šparanja na energiji je bolje 10 atomov ali 20 armov kot 4 xeoni. Zakaj, če imaš virtualizacijo v cloudu, potem ko ni obremenitve izklapljaš jedra in prestavljaš vse na čimmanj jeder.
Ampak je potrebno upoštevati porabljeno energijo od PSU najprej (MB, HDD itd), ne samo na procesorju...
Si kdaj videl sistem za nadzor clouda? Tam imaš recimo 10 računalnikov (sistem desetih serverjev) in sistem diskov. Diski delajo stalno in so ločeni, računalniki pa se izklapljajo glede na obremenitev (fizično se ugasnejo). in če je zelo majhna obremenitev, lahko deluje samo en računalnik, ostali so fizično ugasnjeni. In če imaš atom ali arm procesorje, je tako poraba potem še manjša.
Asrock X99 Extreme 4 | Intel E5-2683V4 ES | 64GB DDR4 2400MHz ECC |
Samsung 250GB M.2 | Asus 1070 TI | 850W Antec | LC Tank Buster
Samsung 250GB M.2 | Asus 1070 TI | 850W Antec | LC Tank Buster
Zgodovina sprememb…
- spremenilo: krneki0001 ()
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | Intel bo pobrisal stare gonilnike in BIOSOddelek: Novice / Procesorji | 7635 (5549) | bbf |
» | Za zdaj konec Intelovega ritma tik-tak (strani: 1 2 )Oddelek: Novice / Procesorji | 22186 (18103) | Glugy |
» | IBM s partnerji načrtuje 28 nm tranzistorje (strani: 1 2 )Oddelek: Novice / Procesorji | 8508 (6938) | Icematxyz |
» | AMD se ne boji Nehalema (strani: 1 2 )Oddelek: Novice / Procesorji | 6485 (4341) | Brane2 |
» | Delničarji AMD-ja podprli razdelitev (strani: 1 2 )Oddelek: Novice / Nakupi / združitve / propadi | 8723 (6861) | RejZoR |