» »

AMD ZEN - nova X86 Jedra

AMD ZEN - nova X86 Jedra

Temo vidijo: vsi
««
5 / 611
»»

Senitel ::

hojnikb je izjavil:

Mah, za apu bi blo 1-2GB HBMja (ali pa gddr5) čisto dovolj. Ostalo pa swappaš na DDR3/4, podobno kot to počne nvidia z zadnjih .5GB na 970gtx

Čeprav bi že ddr4 in texture compression (oz whatever r9 285 uporablja) kr pomagal pri bandwidth-u.

Če pogledaš razmerje med bandwidthom in "flops"-i, ki ga AMD uporablja lahko izračunaš nekako 0.125 byte na SP-clock na 290X in 0.106 byte na SP-clock na R5 230. NV je zadeve doterala do 0.104 byte na SP-clock na GTX 980.
1024 SP-jev recimo pri 1GHz po tej logiki in pri GTX 980 nivoju učinkovitosti torej rabi 99GB/s. DDR4 2666MHz ne dostavi polovice tega, oziroma boš v bistvu naredil zahtevo po quad channel memory kontrolerju in dejansko zasedenih vseh štirih slotih. Dejansko te to pripelje do zahteve po HBM, kjer ti en 1GB čip dostavi tam 120+GB/s.

Dr_M ::

filip007 je izjavil:

Phenom I je hiter kot Zambezi. Phenom II pa kot Bulldozer.

Phenom III ali pa FX II, to bomo še videli.



Pri stock frekvencah ja, kar pa ni IPC.
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

pegasus ::

Čakam, da quad g34 boardi postanejo dosegljivi na ebayu ... daš gor štiri 6308 proce in imaš best flops per byte per $.

filip007 ::

Ja saj, nizke frekvence in velika moč, je ponavadi pri Intelu. Pri AMD FX pa je ravno obratno se mi zdi. Preden, da AMD kaj novega ven bo še trajalo.
Palačinka z Ajvarjem in stopljenim sirom v mikrovalovki.

issak ::

hojnikb je izjavil:



Again, stlačit neko simpl grafiko nebi porabl tolk placa, bi pa pokril en segment uporabnikov. Pa še edge bi mel napram intlu, ker ta nima integriranih grafik na high performance zadevah.


Cel kup Xeon E3 ima integrirane grafike, Core serija pa tudi cela razen extreme (2011)
http://ark.intel.com/products/series/75...

Xeon E5 in E7 pa resda nimata več integriranih grafičnih. Ampak v takem primeru, če rabiš E7 v desktopu pa grafično ravno toliko da desktop poganja, pač kupiš neko pasivno za 40€. Cenovno je to zanemarljivo v primerjavi s procesorjem.

Jasno da če pride grafika integrirana v takem procesorju, in če je to ravno to kar rabiš, bi bilo super, po drugi strani pa grafičnega čipa v i7-2600K nisem nikoli v treh letih uporabil, na 4790K pa le 2 tedna dokler ni prišla nova grafična po pošti.
Desktop: i7-12700F | 7900XTX | Asrock H670M-ITX/ax | 32 GB RAM | Dell G3223Q
Server: G4560 | 16GB RAM | 3x4TB
OLKB Planck | Logitech G Pro X Superlight | Sennheiser HD660S2

m0LN4r ::

Verjameš ali ne iGPU pri intlu pokriva gromozanski spekter uporabnikov, ki rabijo samo highend cpu in entry gpu in vse to stlačiš v eno mičkeno ohišje z mičkenim napajalnikom.
https://www.youtube.com/user/m0LN4r

Zgodovina sprememb…

  • spremenil: m0LN4r ()

x45 ::

D3m je izjavil:

hojnikb je izjavil:

o kaki visheri ti sanjas ?

na am3+ nebo vec novih cpujev...

sicer pa, ce jim rata +40% ipc na nekih spodobnih clockih, zna bit se kr zanimivo...
lets wait and see..


Ko bo moramo samo še spremeniti CPUID iz AMD v Genuine Intel, da bo 100% izkoristek. :P


kako se to naredi ?
AMD x4 965 BE, 8 gb ddr3 1600, SSD Samsung, 960 GT
Xeon x3430, 8 GB DDR3, Matrox grafa

filip007 ::

Se ne da, to je imela samo VIA en test na svojem procesorju in je pokazal pospeške, če je bil spremenjen v Intel oznako.
Palačinka z Ajvarjem in stopljenim sirom v mikrovalovki.

PredatorX ::

Če, bo res IPC primerljiv Haswell/ivy-ju potem bo AM4 platforma odlična. (no dokler nevidim benchmarkov...)
- En velik plus je to, da boš imel na AM4 APU in CPU-je. Sepravi budget CPU-jev APU-jev vse do 8 jedernih CPU-jujev (8C/16T)
- Vsekakor upam, da bo enako kot trenutno glede navijanja, speravi VSI CPU-ji "UNLOCKED".
- Power efficiency

GTX970 ::

Kdaj bo predvidoma izšla AM4 platforma ?

Dr_M ::

Glede na to, da govorimo o AMDju, 2-5 let.
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

gddr85 ::

good things come to those who wait

hojnikb ::

Ko uspejo prodat vso am3+ zalogo. Sodeč po novih platah, ki še izhajajo za ta dinozaver... :)
#brezpodpisa

Dr_M ::

gddr85 je izjavil:

good things come to those who wait



Kaj ti to pomaga, ce je njihov latest and greatest 5 let za intelom.
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

PredatorX ::

Dr M
kaj ko bi ti malo primerjal še ostale stvari.

Zgodovina sprememb…

Dr_M ::

PredatorX je izjavil:

Dr M
kaj ko bi ti malo primerjal še ostale stvari.



AMDjeve zastarele chipsete?
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

PredatorX ::

Hehe...

- No, budget INTELA je mnogokrat večji od AMD-jevega. INTEL je naredi dobre poteze (dirty), ampak so dosegli željeni cilj. Zdej bulldozer sploh ni tolk napačen. Jedro na 32nm je veliko okoli 9.5mm^2 medtem, ko jedro sandija na 32nm zavzame okoli 18.5mm^2. Ja, AMD je pozabil na FPU calc in se bolj ostredotočil na INTEGER, pa ni ti tega treba nonstop govorit.

- IPC Phenom II vs Vishera, glede nato da primerjamo celotno arhitekturo je pride vishera tudi do 10-20% višjega IPC-ja. Če bi si ti pogledal jedro PHENOM-a II in VISHERE bi videl, da ni velike razlike. Zdej, če primerjaš 4C/4T (posamezno jedro modula) je vishera hitrejša. Ker pa sta dve jedri v tako rečenem modulu se pa opazi razlika med FX 4300 in phenomom. Ampak, kolk je realno te razlike v gaming benchmarkih menim... kakor vidim je FX 4300 večino časa pred pehnom x4 980BE.

- In koliko je realno INTEL napredoval v IPC-ju (gledamo gaming benchmarke) od Sandija do Haswella?
http://www.ocaholic.ch/modules/smartsec...

- Trenutno se obračajo stvari drugače. AMD začćel API ga razširil v DX12 in VULKAN... no to je že zelo veliko. Uglavm AMD je začel sodelovati in tekmovati.

- trenutni benchmarki FX 4300 vs i5 4670K
http://www.ocaholic.ch/modules/smartsec...

glede nato, da imaj FX 4300 slab core scaling in samo 128Bit FPu per core, 2x manjša jedra...se še kr obnese.

Zgodovina sprememb…

hojnikb ::

>- IPC Phenom II vs Vishera, glede nato da primerjamo celotno arhitekturo je pride vishera tudi do 10-20% višjega IPC-ja.

Tole bo pa treba podkrepit s čim.
#brezpodpisa

PredatorX ::

hojnikb je izjavil:

>- IPC Phenom II vs Vishera, glede nato da primerjamo celotno arhitekturo je pride vishera tudi do 10-20% višjega IPC-ja.

Tole bo pa treba podkrepit s čim.


pokazal sem ti benchmark (gaming) kako v single threadu AMD vishera deluje bolje.

Zgodovina sprememb…

hojnikb ::

gaming benchmark seveda ni edini pokazatelj IPC improvementa...

Pa da se greš primerjavo IPCja, morta bit proca na isti frekvenci in met isto jeder.
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

PredatorX ::

hojnikb je izjavil:

gaming benchmark seveda ni edini pokazatelj IPC improvementa...

Pa da se greš primerjavo IPCja, morta bit proca na isti frekvenci in met isto jeder.


- ista ferkvenca
No me prav zanima kolk bi se to obrestovalo v WoT-u.

Zgodovina sprememb…

filip007 ::

Dober video, samo je največja razlika zaradi jeder, 4 proti 8.

Phenom II x6 proti FX-8370
http://www.anandtech.com/bench/product/...
Palačinka z Ajvarjem in stopljenim sirom v mikrovalovki.

PredatorX ::

Ja ampak kakor sem ti rekel pri nekaterih špilih ti tistih 8 jeder nič nepomaga. Če bi imel phenom 20% višji IPC bi bil hitrejši v večini iger. Penitium g3258 je hitrejši od FX8350 clock per clock v WoT-u sigurno.

Dr_M ::

A nihce ne pomisli, da dodatne instrukcije, ki jih FX ima, phenom pa ne? Zato je ponekod velika razlika v prid FX. Kjer se ne uporablja teh instrukcij, phenom precej potegne naprej.
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

PredatorX ::

Dr_M je izjavil:

A nihce ne pomisli, da dodatne instrukcije, ki jih FX ima, phenom pa ne? Zato je ponekod velika razlika v prid FX. Kjer se ne uporablja teh instrukcij, phenom precej potegne naprej.


Ja ampak tudi pomisli na FX Core scaling in Phenom core scaling. Jst sm testiru na mantlu clock per clock BF4 pa je bil FX 6300 za malenkost hitrejši oz. razlike skorajda ni bilo.

Lj sj maš tuki CPu benchmarke.
http://www.hardwarecanucks.com/forum/ha...

pa sam boš opazil da je ponekod tudi phenom II x4 980BE na nivoju i5 4670K

Zgodovina sprememb…

hojnikb ::

> Ja ampak tudi pomisli na FX Core scaling in Phenom core scaling. Jst sm testiru na mantlu clock per clock BF4 pa je bil FX 6300 za malenkost hitrejši oz. razlike skorajda ni bilo.

o kakem core scalingu ti sanjaš =
#brezpodpisa

PredatorX ::

hojnikb je izjavil:

> Ja ampak tudi pomisli na FX Core scaling in Phenom core scaling. Jst sm testiru na mantlu clock per clock BF4 pa je bil FX 6300 za malenkost hitrejši oz. razlike skorajda ni bilo.

o kakem core scalingu ti sanjaš =


ups, na hitro sem rekel. Mislil sem "module" vs 4 cores. Itak, da ma FX večji odbitek pri 2 modulih kot pa phenom x4. Če pa primerjaš recimo 4 module, kjer bo pa v špilih delal predvsem 1 jedro na modul je pa drgač, pa še vseeno je odbitek. Kolk bi bla 4 posamezna pildriver jedra hitra?

Zgodovina sprememb…

hojnikb ::

Seveda je primerjat phenom ii pa fx8 mal bedasto.

Prvič maš turbocore (torej nebo 100% scaling, ker bo eno jedro hitrejše, kot pa vseh 8 hkrati), pol maš share-ane enote (fpu, del pipeline-a, l2)...

Sicer pa, že neki pomaga, če je scheduler vsaj tolk pametn, da 4 niti ali manj spravi vsakega na svoj modul in ne recimo čez prva dva.
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

Dr_M ::

Sicer pa, že neki pomaga, če je scheduler vsaj tolk pametn, da 4 niti ali manj spravi vsakega na svoj modul in ne recimo čez prva dva.


V Windowsih se je izkazalo, da prakticno nic ne pomaga. Razen ce ne dela tako kot treba. Vem pa, da so neki patchal in optimiziral scheduler za bulldozerja.
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

PredatorX ::

hojnikb je izjavil:

Seveda je primerjat phenom ii pa fx8 mal bedasto.

Prvič maš turbocore (torej nebo 100% scaling, ker bo eno jedro hitrejše, kot pa vseh 8 hkrati), pol maš share-ane enote (fpu, del pipeline-a, l2)...

Sicer pa, že neki pomaga, če je scheduler vsaj tolk pametn, da 4 niti ali manj spravi vsakega na svoj modul in ne recimo čez prva dva.



GTA V deluje bolk kot ne na tak princip.
3 jedra na 80% in tri na 30% = en module 80%/30%.

tuki je sam primer kolk je hitrejši recimo dual core v WoT.

hojnikb ::

Mah, za FP operacije bi sigurno mogl pomagat, ker če je aktivno samo eno jedro na modul, potem dobi celotn FP.

evo tule je recimo pomagal
http://www.overclock.net/t/1497163/amd-...
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

hojnikb ::

Btw, obstaja kje kak clock-to-clock benchmark med bulldozer, piledriver in steamrollerjem (seveda prva dva brez l3) ?

Me res zanima, koliko je ratal amdju dejansko spolirat ta faildozer.
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

PredatorX ::

Še vseenojedro ni sposobno uporabljat celoten FPU - v tem primeru mislim 2x 128Bit FPU = 256Bit FPU.

hojnikb ::

mah, amd bi mogu nardit to, kar je intel z p4; FPU enote na 2x frekvenco dejanski jeder >:D
#brezpodpisa

PredatorX ::

Sm mal iskal na internetu za benchmarke... nič našel.
Drgač pa bomo vidl kaj bo prinesel ZEN... upam, da jih bo samo na ST-ju popeljav blizu INTELA, tako da bo konkurenca.

Zgodovina sprememb…

Dr_M ::

Jest verjamem, da so pri AMDju sposobni nardit dober CPU, ne verjamem pa, da bo pravocasno na trgu, da bi bil lahko konkurencen aktualnim intelovim procesorjem.
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

hojnikb ::

Kapo dol, že če jim rata v 2016 prilezit na single thread performance Sandija...
#brezpodpisa

PredatorX ::

Z steamrollerjem so naredil lep napredek v L cache. Z excavatorjem so šli v density in tud efficiency.
Sej če pogledaš sama jedra vidiš, da je AMD delal "srednje velika" jedra z veliko cache. Če pogledaš mala Jaguar jedra se kr dobr kosajo z INTELovim. Jst mislm, da so sposobni naredit dobr CPU pa tud on "TIME". No, če smo realni je AMD že z phenomom štartal na INTEGER.

Zelo bi rad videl
Jaguar vs Piledriver vs phenom II - clock per clock benchmark.

Zgodovina sprememb…

Dr_M ::

pa tud on "TIME"


Katerega leta pa? V zadnjih 8 letih (Phenom 2007) sigurno ne.
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

PredatorX ::

uff za naprej bodo mogl bit kr "ON TIME".. vsaj upam.

hojnikb ::

sj zdej je bivši athlonovc noter, maybe that helps :)
#brezpodpisa

SuperVeloce ::

Upajmo, da res... Ekipo in izkušnje imajo. Zanimivo le, da se nihče ni spotaknil ob SMT. Intel ima tukaj 10+ let zgodovine (modelov na trgu), vprašanje, kako dolgo so zadevo že prej razvijali. AMD na drugi strani do sedaj še ni pokazal SMT + x86 v takšni obliki (čeprav L2 in FPU implementacija v bulldozerju daje nekaj izkušenj na tem področju), ampak vsi pričakujejo realizacijo in učinkovitost na ravni Intela
ryzen 5900x, MSI 5700xt Gaming X, 2x16GB 3600CL16, 850evo+860qvo, Fractal Mini C

PredatorX ::

Jaguar jedra so SMT.

SuperVeloce ::

am, ne ni?! Ima 2 4jederna modula. Sicer pa, CMT sam po sebi ni napačen, le AMD implementacija je bila rahlo zgrešena in kar je huje, zadeva ni dobila dovolj inkrementalnih nadgradenj arhitekture. Mogoče CMT+SMT verzija tudi nebi slabo izpadla...
ryzen 5900x, MSI 5700xt Gaming X, 2x16GB 3600CL16, 850evo+860qvo, Fractal Mini C

hojnikb ::

PredatorX je izjavil:

Jaguar jedra so SMT.

Ne, niso. AMD za zdaj še nima SMTja.
#brezpodpisa

Dr_M ::

So testiral SMT ze na phenomu in se ni obneslo.
Torej, ZEN bo res popolnoma drugacna zasnova od vsega, kar so do sedaj imeli, da se bo SMT splacal.
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

Brane22 ::

Bolj bo problem IMHO neugoden timing.

BD je bil hkrati prezgoden in prepozen.

Prepozen za to, da bi s svojo rešitvijo ujel nivo konkurenčnosti z Intlom in bi kljub serverski zasnovi nekako ujel unithred performance Intla, prezgoden pa zato, ker šele sedaj prihajajo časi, ko se folk bolj ozira po skupni hitrosti vseh jeder kot hitrosti posameznega.

Sam štos ni bil slab, samo kaj ko njihov silicij ni tega zadovoljivo prenesel.

Če jim ne bi bilo treba frekvenčno siliti v take višave, bi mogoče lahko imeli recimo dva modula( = 4 "jedra"), ki bi si delila resurse. Pogrešal pa sem več inovativnih korakov. Recimo to, da bi vpeljali samostojno delo SSE enote, ki itak vedno izvaja večje ali ( praviloma) manjše zanke.
Ni pametnega razloga ( izven dobrih performans z legacy kodo), da SSE ne bi imel majhnega bufferja, v katerem bi se lahko vrtel v svojem loopu in preko nekega semaforja signaliziral CPU-ju kaj in kako počne in ali je že končal. Ravno tako bi komot lahko imel pogojne ukaze itd.

Prej so se sekirali za X ali Y test, na katerem Intel blesti. Sedaj recompilanje kode, sploh za ARM, sploh ni neobičajno. Big deal, če bi jo scompilal za tako SSE enoto. Ali štiri, sploh ob deljenih resursih.
Poleg tega ima SSE ogromno legacyja, ki bi se ga znebil. Omislil bi si recimo custom-defined FP ali celo možnost nekih logaritmičnih osnov itd. Kdo pravi, da mora FP vedno zgledat tako kot pravi IEEE ?

pegasus ::

Sklepam, da bodo to "fp fleksibilnost" prinesli APUji. Sicer pa:

IEEE je history, kar se mene tiče. Takoj ko nekdo tole sporta iz mathematice v c/c++/fortran.

Wrop ::

pegasus je izjavil:

Sklepam, da bodo to "fp fleksibilnost" prinesli APUji. Sicer pa:

IEEE je history, kar se mene tiče. Takoj ko nekdo tole sporta iz mathematice v c/c++/fortran.


Po čem tako sklepanje? FP je standardiziran z razlogom. Seveda lahko implementiraš svoj custom FP, ampak to je samo pot v sranje, ki lahko nastane. Prav bistvo standardiziranega FP je v tem, da neglede kje se zadeva izračunava, dobiš ob enakih vhodnih podatkih enak rezultat. Pa naj bo na papirju ali pa na siliciju. Takoj, ko vmes pri računanju uporabljaš neko enoto, ki nima nekega standardiziranega izračuavanja, nastane prej opisani problem. Sploh pa če moraš te izračunane podatke uporabiti v nadaljevanju.

Jaz neke FP fleksibilnosti v (bližnji) prihodnosti ne vidim.

IEEE z razlogom še dolgo ne bo HIEEE. Tole moram še pogledati v celoti. V hitrem pregledu nisem videl nobenega podatka, kako bo to implementiral s tranzistorji. Če nimaš podpore na strojem nivoju, kaj imaš sploh za portat? Interpretiranje zapisa in algoritma za računanje v tem zapisu?

pegasus ::

Wrop je izjavil:

Prav bistvo standardiziranega FP je v tem, da neglede kje se zadeva izračunava, dobiš ob enakih vhodnih podatkih enak rezultat. Pa naj bo na papirju ali pa na siliciju.
IEEE fp standarda ti tega ne zagotavljata. Pravzaprav je znano, da na različnih implementacijah IEEE dobiš iz iste kode različne rezultate.
HW implementacija je predstavljena v knjigi in je mnogo enostavnejša kot IEEE.

Zgodovina sprememb…

  • spremenil: pegasus ()
««
5 / 611
»»