» »

AMD ZEN - nova X86 Jedra

AMD ZEN - nova X86 Jedra

Temo vidijo: vsi
««
6 / 610
»»

PredatorX ::



tudi zanimiv podatek.

hojnikb ::

kaj ko bi ta tabela bla zram kakega konteksta...
#brezpodpisa

PredatorX ::

hojnikb ::

ja, v zelo specialnem pogoju se zgodi to, da intelov imc povzroči veliko več bitflipov kot amdjov. Je pa lepo zapisano malo pod tem delom, da drugi primer ne povzroča _nobenih_ bit flipov na obeh platformah.
#brezpodpisa

PredatorX ::

Ja... sam kaj je drgač da AMD povzroči tolk manj?

hojnikb ::

stvar je predvsem tudi odvisna od starosti modulov. Ie, stari moduli na večji, zreli litografiji kažejo manj napak kot novejši, izdelani na manjši/novejši...
#brezpodpisa

Wrop ::

pegasus je izjavil:

IEEE fp standarda ti tega ne zagotavljata. Pravzaprav je znano, da na različnih implementacijah IEEE dobiš iz iste kode različne rezultate.
HW implementacija je predstavljena v knjigi in je mnogo enostavnejša kot IEEE.


Kje piše, da IEEE FP standard tega ne zagotavlja?

Znano je samo to, da zaradi nepopolnega skladanja implementacije s standardom lahko dobiš v nekaterih primerih različne rezultate. Velik problem pa so tudi prevajalniki, ker v veliko primerih zaradi različnih vzrokov ne prevedejo kode tako kot bi morali.

Da bi pa vse te probleme rešil nek nov tip zapisa števil, moram pa še pogledati.

pegasus ::

Na strani knjige imaš pod downloads prototip v mathematici, poigraj se z njim.

m0LN4r ::

Ja nič ane, skylake je padel v vodo, samo refill prodajnih polic do ZEN.

Moje upanje gre v ZEN, da bo vsaj nekaj na nivoju 5960X za smrtnike do takrat.
https://www.youtube.com/user/m0LN4r

klinker ::

Optimist :D
Ce pridejo na ta nivo, bo resna konkurenca Intelu, pa tudi ce porabi par 10W vec. Idealen bi bil seveda scenarij Athlon 64 >:D

facepalm ::

Tudi Phenom2 scenarij nebi bil slab:)

SuperVeloce ::

Zen bo nekje na ravni prve gen i7, kar se tiče bolj legacy nabora ukazov. Vse ostalo pa kvečjemu na ravni Sandy/ivy bridge, če bo sreča. Ker se pričakujejo nižji clocki kot na bulldozerju in njegovih naslednikih, bo konkurenca le pri perf/$$$
ryzen 5900x, MSI 5700xt Gaming X, 2x16GB 3600CL16, 850evo+860qvo, Fractal Mini C

klinker ::

Phenom 2 scenarij je to kar opisuje SuperVeloce :D

Brane22 ::

Brane22 ::

Oops:

juanrga:
AMD itself expect a commercial ready chip for 2020--2023, but yes, some pessimistic schedules extend to 2025.

https://community.amd.com/comm...

It is not needed to read the IEEE paper to see the mistakes here. Someone with minimum knowledge of HPC and technology development knows that no company will release an exascale chip in 2016--2017, because is technically impossible. However, the author is notorious by still believing that Xeon KNL Phi are "coprocessors", despite I explained him directly that the CPU version works in standalone mode.

But it could be poor. At least this author did count correctly the number of CPU cores in the EHP diagram: 32 cores. People at bitsandchips and at Fudzlilla claim that EHP has 16 cores. They cannot even count those little green boxes!!!!!


Errr, scratch that:

juanrga

Unfortunately, some new sites are confounding the "EHP" (Exascale Heterogenenous Processor) described in the recent IEEE paper by AMD engineers with the "server APU" announced by AMD's Papermaster at FAD 2015.

EHP is an exascale-level concept that targets the year 2020 (according to pesimistic schedules exascale not will be achieved before the year 2025). Whereas the "server APU" that appears in AMD roadmap targets the year 2017. This server APU includes 16 Zen cores, Greenland GPU, HBM2,...

Since the author confounds both chips, he mixes different technologies and makes incorrect claims about EHP. Some corrections:

(1) EHP doesn't use HBM2, because HBM2 doesn't provide the required bandwidth of 4TB/s needed for exascale requirements.

(2) EHP doesn't use Zen cores, neither is using Zen+ cores. EHP uses some future not defined core and, in fact, AMD engineers claim that they didn't decide if the cores will be x86 or ARM.

(3) EHP doesn't have a Greenland GPU, but a future unnamed architecture.

(4) EHP doesn't use DDR4 channels. AMD engineers make it clear on the paper that the memory architecture is dual with 3D-RAM plus NVRAM.

(5) The target process node is not 14nm.

(6) EHP is a concept and doesn't appear in any roadmap.

There are more confusions and issues, but the above list is enough to understand that EHP described by AMD in the paper is completely different to what is being said here. Now, after spending some time on the comments, I see a lot of ignorance about exascale level stuff and will do some additional remarks:

(a) Many companies are designing exascale level chips: IBM, Fujitsu, Nvidia, Intel...

(b) AMD's EHP isn't anything special when compared to exascale-level designs from others companies. The chip that is more similar to AMD's EHP is from Nvidia, because Nvidia also proposes an APU that they name "HCN" (Heterogenenous Compute Node). I will give some few details about the HCN made by Nvidia engineers just for people can compare with AMD's EHP.

The exascale chip proposed by Nvidia hits 20 TFLOPS of double precision, uses 16 high-performance ARM cores, and has 256GB 3D-DRAM on chip, backed up by 512GB NVRAM (PCM). The TDP of the chip is 230W and targets the 7nm node with a die size of 650mm?. CPU and GPU cores are 'fused' on a 2D-interconnect.

Zgodovina sprememb…

  • spremenilo: Brane22 ()

fr4nc ::

Pro_moted je izjavil:

Kolko je že, 3, 4 leta nazaj ? sem nabavil za tistih 120 evrov FX 8120, in ga dal na 3,8 Ghz in pozabil na njega. Od takrat naprej igram vse igre na full HD, brez problema, sploh se ne sekiram za procesor, ker ni klecnil še pri nobeni. Izkoristim ga tudi za renderiranje in 3D modeliranje, pravtako brez težav. Medtem pa že 4 leta berem pametnjakoviče na forumu, kako je njihov Pentium oh in sploh, AMD-ja se pa ne splača kupovat in da je nujno potrebno dat 200-300 evrov za Intela , da lahko igraš igre.


Se podpišem pod to.:D
Sem si lastil i5 2500K, FX-8120, i5 3570K in zdaj že 2 leti na FX-8320...vse laufa na FullHD+1440x900 brez problema (aia furam na 2 monitorja)

Nisem pa fan nobene strani :)

Lp
"Rad pomagam, če je le možno" by Fr4nc; blog(2): http://cpuwars.wordpress.com/
"I just love to share the truth!!" by Fr4nc; http://intelvsamd.wordpress.com/

hojnikb ::

Dovolj je ~170e za najcenejšo i5 pa si dober do konc desetletja. Pri amd pa morš cincat pr vsaki igri, če je optimizirana za več jeder. Marsikater špil namreč ni in amd kolcne, i3 pa pride naprej...
#brezpodpisa

Ciklamen ::

Še nisem naletel na igro, pod katero bi FX-8320 klecnil. Verjetno veš, za katero igro gre zato kar na plano z besedo :) (nočem bit zaničevalen, me pa res zanima katerih iger naj se izogibam :)
- End of the Post ->

fr4nc ::

hojnikb je izjavil:

Recimo določen software, ko je skompajlan z intel c++ kompilerjem, dela bolš, če pofejkaš procesorid na intel. Ker če zazna amd, laufa manj efektivno kod, ker Intel pač ne optimizira svojih kompilerjov za druga ko svojo robo.


In kako lahko to dokažeš? Ter kako pofejkaš procesorid?
"Rad pomagam, če je le možno" by Fr4nc; blog(2): http://cpuwars.wordpress.com/
"I just love to share the truth!!" by Fr4nc; http://intelvsamd.wordpress.com/

hojnikb ::

Ciklamen je izjavil:

Še nisem naletel na igro, pod katero bi FX-8320 klecnil. Verjetno veš, za katero igro gre zato kar na plano z besedo :) (nočem bit zaničevalen, me pa res zanima katerih iger naj se izogibam :)

Še ene 1000x linkal teste, kjer še i3 pride pred fx8.

Žal, fx8 single thread je crap in to se pozna.
#brezpodpisa

PredatorX ::

DX11 se ustavi na ST-ju. Pa vseeno ni intel 2x hitrejši.
Kaj je in ni crap je tebi brze veze govorit.

Hojnibk itak ve vse. i5 3.2/3.4GHz se težko kosa z FX 6300 4.2GHz v BF4 MP. Ampak, AMD IPC je crap, ker Hojnikb točno ve kaj je IPC.

Zgodovina sprememb…

Ciklamen ::

Ni potrebe po žaljenju, človek pač preferira Intel in plača več, da ima manj porabe in (malo) boljši performance :)

Mi pa pač pogledamo za vsak € ki se ga da prišparat (ali porabit za kakšno drugo komponento), in v tem je AMD pač kralj p/p :)

Pa vseeno ni to tema pogovora :)
- End of the Post ->

Dr_M ::

Ni vredno. Mene je AMD na dolgi rok stal precej vec, kot sedaj intel, ker sem moral pogosteje menjat vse skupaj. Pa se zastarelo platformo z zastarelim chipsetom imas, ce kupis AM3+.
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

PredatorX ::

Seveda se ti trenutno AM3+ plate lihk nesplača kupt raznč, če rabš pocen MT PC. Maš Fx 8320...

Ciklamen ::

Tud sam bom verjetno čez par let, ko mi moj sistem ne bo več služil, šaltal na Intel (ali kar koli bo pač takrat best p/p), takrat sem pač imel budget in sem raje malo več dal za grafo kot za proc :)
- End of the Post ->

PredatorX ::

Ciklamen
AMD bo cenejši in boljši P/P kot je sedaj.

Sej ni slab proc, velik userjev, ki imajo i7mko itd. so kr presenečeni kolk dejansko FX 6300/8320/50 zmore. Ja za max FPS pa, da ti drži na 144 FPSje z monitorjem, ki ima 144HZ refresh rate, bodo pač kup i7 pa ga navil na 4.5GHz+.

hojnikb ::

> in v tem je AMD pač kralj p/p :)

AMD že dolgo ni več p/p
#brezpodpisa

tiborrr ::

hojnikb je izjavil:

> in v tem je AMD pač kralj p/p :)

AMD že dolgo ni več p/p

No ja. Moj 4P Opteron 6344 (4x12c) sistem, ki je stal manj kot tri jurje, je v CFDju hitrejši od 15 jurjev težke Haswell-EP kripe. CMT je super zadeva, če veš, zakaj jo rabiti. Bulldozer je arhitektura, ki je v ta svet prinesla ogromno za malo denarja.
Don't test the captain's validity or his vulnerability!

Zgodovina sprememb…

  • spremenil: tiborrr ()

hojnikb ::

pustimo nise pr mir..
#brezpodpisa

tiborrr ::

To ni niša, to je poleg konzol največji trg (server, hpc). Ali res misliš, da bi AMD šel v dizajn Bulldozerja zato, ker pač nimajo pojma ali ker so imeli denarja le za eno platformo in so se odločili za najbolj profitabilno?
Don't test the captain's validity or his vulnerability!

Dr_M ::

Aha, tocno zato se pri AMDju tudi na podrocju opteronov toliko dogaja.

Oh, wait...
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

tiborrr ::

Zdaj ne vem, ali se delaš trapastega ali ti pa res niso jasna načela rentabilnosti nekega projekta. Kakorkoli že - prvi Zen bo itak Opteron, t.j. po vsej verjetnosti ~ 2000-pinski čip, tako kot je trenutni G34 in LGA-2011-3 in bo sestavljen iz dveh nodeov. Torej, prvo HPC, vse ostalo bo spet sekundarno. Ker ni resursov za vse. Torej ja, 'niša'.
Don't test the captain's validity or his vulnerability!

PredatorX ::

AMD bi moral leta 2006 mal denarja nakazat partnerjem in bi blo zdej drgač :).

Zgodovina sprememb…

pegasus ::

tiborrr je izjavil:

Moj 4P Opteron 6344 (4x12c) sistem, ki je stal manj kot tri jurje, je v CFDju hitrejši od 15 jurjev težke Haswell-EP kripe.
Bravo, naj se te zapomnim kot pametno in trezno osebo :) Mi zaupaš še, kje si dobil tako piksno za tri jurje? Ker tudi iščem eno (ali nekaj njih) za domač cfd projekt ...

Zgodovina sprememb…

  • spremenil: pegasus ()

fr4nc ::

hojnikb je izjavil:

Dovolj je ~170e za najcenejšo i5 pa si dober do konc desetletja. Pri amd pa morš cincat pr vsaki igri, če je optimizirana za več jeder. Marsikater špil namreč ni in amd kolcne, i3 pa pride naprej...


FX-8X20 so bli za 130€, mogoče tu pa tam še kaj ceneje...in so že zunaj že skoraj 4 leta...

Igre zasnovane za ST sred 2. desetletja v 21. stoletju so pa itak žalost in prikazujejo nesposobnost razvijalcev, glede na to, da je minilo že več kot desetletje od kar imamo multicore procesorje na trgu...

Lp
"Rad pomagam, če je le možno" by Fr4nc; blog(2): http://cpuwars.wordpress.com/
"I just love to share the truth!!" by Fr4nc; http://intelvsamd.wordpress.com/

Brane22 ::

pegasus je izjavil:

tiborrr je izjavil:

Moj 4P Opteron 6344 (4x12c) sistem, ki je stal manj kot tri jurje, je v CFDju hitrejši od 15 jurjev težke Haswell-EP kripe.
Bravo, naj se te zapomnim kot pametno in trezno osebo :) Mi zaupaš še, kje si dobil tako piksno za tri jurje? Ker tudi iščem eno (ali nekaj njih) za domač cfd projekt ...


Na Idealo je poceni opty 6378 za tistih €350/kos. Je tudi quad-socket plata za €800. Vse skupaj
€2k+ RAM itd.

Opteron 6378

Plata:
H8QGi-F-B Bulk H8QGi-F-B

D3m ::

tiborrr je izjavil:

Zdaj ne vem, ali se delaš trapastega ali ti pa res niso jasna načela rentabilnosti nekega projekta. Kakorkoli že - prvi Zen bo itak Opteron, t.j. po vsej verjetnosti ~ 2000-pinski čip, tako kot je trenutni G34 in LGA-2011-3 in bo sestavljen iz dveh nodeov. Torej, prvo HPC, vse ostalo bo spet sekundarno. Ker ni resursov za vse. Torej ja, 'niša'.


Človek ni trapast. Samo nima širšega obzorja. Je samo osredotočen na igre to je pa vse. :)
|HP EliteBook|R5 6650U|

hojnikb ::

Se prav vidi kako je generalno fina ta arhitektura...

Tržni delež pove vse.
#brezpodpisa

Isotropic ::

tiborrr je izjavil:

hojnikb je izjavil:

> in v tem je AMD pač kralj p/p :)

AMD že dolgo ni več p/p

No ja. Moj 4P Opteron 6344 (4x12c) sistem, ki je stal manj kot tri jurje, je v CFDju hitrejši od 15 jurjev težke Haswell-EP kripe. CMT je super zadeva, če veš, zakaj jo rabiti. Bulldozer je arhitektura, ki je v ta svet prinesla ogromno za malo denarja.

a mate še zmeri solidworks? pa ni problemov z licencami za toliko jeder?
(pr ansys je tko, da 1 jedro = 1 licenca)

tiborrr je izjavil:

To ni niša, to je poleg konzol največji trg (server, hpc). Ali res misliš, da bi AMD šel v dizajn Bulldozerja zato, ker pač nimajo pojma ali ker so imeli denarja le za eno platformo in so se odločili za najbolj profitabilno?

samo server in hpc sta dve popolnoma različni področji...
hpc je občutno manjše afaik.

Zgodovina sprememb…

tiborrr ::

@hojnikb, tržni delež še nikoli ni bil indikator uspešnosti nekega izdelka. Dober tržnik bo prodal še tako krš izdelek (Intel Netburst, Intel Pentium D?) v veliki količini.

@pegasus: Brane ti je dal odlično konfiguracijo. Sam ti pa priporočam še OCNG5 BIOS (verzija 3.5), s katero se da zadevo še precej pohitriti oz. skonfigurirati za boljši performance/watt. Sam gonim 3.6GHz (2.6GHz default) z 50mV več napetosti. Ker sem obenem navil tudi HT vodilo, je skaliranje praktično 1:1 z zviševanjem frekvence. Za več kot dve mašini pa za CFD že rabiš Infiniband, gigabitna ali dve gigabitni mreži sta premalo.

@Isotropic: OpenFOAM za večino primerov. Ansys CFX je preprosto predrag (okoli 100 jurjev + 30 jurjev na leto za licence, ki bi jih potrebovali). Solidworks Flow Simulation imamo še vedno za hitre izračune, da med malico preveriš, če ga nisi kje orenk kiksnil. Solidworksov solder je zanič in nad 8 jeder precej slabo skalira, zato ga raje poženem na hitrem 5960X Haswell-E čipu. Alternativa bi bil poceni FX-8350 (osem polnih jeder, CMT, ne HT). Navsezadnje je v CFX FX-8150 približno ~ 40% hitrejši od i7-4770K...

Ja, HPC je občutno manjše, vendar Bulldozerje še vedno zelo koristijo za virtualke in mail serverje, ker dobiš ogromno jeder na en node.
Don't test the captain's validity or his vulnerability!

Zgodovina sprememb…

  • spremenil: tiborrr ()

Isotropic ::

in ga potem kar sami programirate? kaj imate pa za meshing in post, salome (ki ga nekaj oglašujejo pri tem OF)?

Zgodovina sprememb…

tiborrr ::

Načeloma mesh narediš kjerkoli, izračunaš v OF in rezultate pogledaš kjerkoli (Paraview).

Drugače je pa http://engys.com/products/helyx ena taka fina nadgradnja :)
Don't test the captain's validity or his vulnerability!

Zgodovina sprememb…

  • spremenil: tiborrr ()

Isotropic ::

koliko stane pa abaqus, kaj veš?
pa kuk licenc ansysa bi rabili / stane 30k?
slišal sem edino, da so edu licence par 100e na jedro.

pa daj pokaži kakšno lepo slikico

Zgodovina sprememb…

Brane22 ::

BTW, na gaizhalsu so 6262HE za drobiž - €140 za 16-core čip.

Serija 62 je AFAIK Interlagos (torej Bulldozer). Mogoče malo počasnejša od Piledriverja a tudi cenejša.

Resda je takt nižji, a to bi se z OC BIOS-om najbrž dalo popravit domnevam...

tiborrr ::

Isotropic je izjavil:

koliko stane pa abaqus, kaj veš?
pa kuk licenc ansysa bi rabili / stane 30k?
slišal sem edino, da so edu licence par 100e na jedro.

pa daj pokaži kakšno lepo slikico

HPC licence pack za Ansys je 15k EUR in mi bi potrebovali vsaj 3. 30+25+(3x15)= 100 jurjev za softver v štartu, potem pa še obnova 30 jurjev na leto. Z edu licenco si mi na žalost ne moremo kaj prida pomagati. Koliko stane Abaqus nimam pojma, pomoje pa nekaj sličnega. Zato je tu bistvena prednost OpenFOAMa, ker denar namesto za softver gre za hardver. Tudi, če kupiš komercialni post- in pre-procesor (Helyx, Visual-CFD).

Slike mašine lahko pokažem nasl. teden.
Don't test the captain's validity or his vulnerability!

Isotropic ::

lahko tut kakšne simulacije...
ne, edu je bila edina, za katero sem vedel (ker je bila v okviru faksa).
je bilo pa rečeno, da so komercialne x10, vsaj za abaqus.

Zgodovina sprememb…

Brane22 ::

@tiborr:

A kaj veš kolk je razlike med Optyjem 62xx ( Bulldo) in 63xx ( Piledriver) primerljivih frekvenc in jeder ?

tiborrr ::

Clock to clock nanese okoli 8-10% v prid Piledriverja. Testirano na 6272 vs. 6344, oba na 12 nitih in istem clocku.
Don't test the captain's validity or his vulnerability!

pegasus ::

tiborrr je izjavil:

Navsezadnje je v CFX FX-8150 približno ~ 40% hitrejši od i7-4770K
Pozna se, da je bil eden vodilnih developerjev pri ansysu tesno povezan z AMDjem in je kasneje pri njih prevzel mesto hpc evangelista. Sedaj je freelancer in je med drugim zdizajniral hpc clustre enajstim formula1 ekipam. Nekaj, kar je še vedno trn v peti intlu ;)

Ansys licence so tko ... srednja žalost. Pred nekaj tedni sem sedel z njimi skupaj s četico heavy userjev in vsi so jamrali. Je pa ansys obljubil svojo prisotnost na amazonu ($15k setup, $50k na leto za 10 userjev, + amazon stroški, + ansys cloudy licence), kar je zanimivo, če rabiš nekaj poračunat vsake toliko časa. Napovedujejo tudi ansys 17, ki bo končno imel multithreaded meshing in kjer bodo začeli dolg seznam njihove ponudbe tlačiti skupaj v en multiphysics produkt. Bomo videli ...

Anyway, nekaj IB opreme imam viška, imam pa še en interkonekt v paci - zanima koga numascale in mašina z mnogimi terabajti rama? Pred kratkim so se naredili vidne s svetovnim rekordom v stream benchmarku ... In to je to kar cfd rabi - memory bandwidth. Ta je pri amdju še vedno krepko cenejši kot pri intlu.

PredatorX ::

««
6 / 610
»»