» »

AMD ZEN - nova X86 Jedra

AMD ZEN - nova X86 Jedra

Temo vidijo: vsi
««
264 / 623
»»

Predator X ::

Brane3 je izjavil:

Ni videti razloga da ne bi.

Tudi to, da bo več placa za nora navijanja.


Poleg tega, ker gredo vs kocke skozi I/O kocko, ni privilegiranih in prikrašanih CPU clustrov.

MOgoče bo to končno razlog da dajo ven 8-kanalne TrheadRipper plate ven.

In/ali 64C ThreadRipperje v 1+8 chiplet konfiguraciji.


JSt se spomnm sam 64C je nemogoče >:D

Jap, super bi bilo za TR. Za desktop pa vse na en die in to je to. Pa tud če ostane pr 8C.

Brane3 ::

Nieki gledam grafikuljo in par malenkosti mi ni jasno.

Instinct MI60 naj bi bil na 7nm, MI25 pa je "stara" Vega na 14 nm.

Zakaj nima pri drobljenju FP32/64 cifer novi MI60 bistveno višjih cifer ?

Če pogledam število shaderjev, je nekje enako - 4k vs starih 4k.

Ali pa ej pridobitev v tem da pač novi čip porabi 2x manj in jih lahko v enak volumen damo 2x več ?

To bi dalo nek dodaten smisel tistemu novemu Infinity Fabric obroču...

FlyingBee ::

Pravijo, da ni to Vega10 na 7nm, imam pa občutek, da je le Vega10 z višjimi clocki.

Brane3 ::

Re Epyc:

Glede na površino CPU chipletov se zdi, da so se odločili obdržati L2 v CPU chipletih.

Zanimivo bo videt ali ga bo tudi kaj na I/O chipletu ali mogoče celo kaj L4....

FlyingBee ::

Ta srednji je v 12 ali 14nm.

Brane3 ::

Še vedno ima lahko L3 ali L4. Seveda ne celoten L3 ( ta je itak segmentiran) ampak nek njegov segment.

Tadva nista v najbolj speed-kritičnih zadevah, poleg tega bi bilo mogoče v nekaterih scenarijih pametno imeti kaj L3 v centralnem hub-u...

Zgodovina sprememb…

  • spremenilo: Brane3 ()

Predator X ::

Brane3 je izjavil:

Re Epyc:

Glede na površino CPU chipletov se zdi, da so se odločili obdržati L2 v CPU chipletih.

Zanimivo bo videt ali ga bo tudi kaj na I/O chipletu ali mogoče celo kaj L4....


CCX ima L3

Brane3 ::

Ja, zatipk. MIslu sem na L3. ja, videti je,d a ga CCX-imajo, vprašanje je, ali ga bo tudi kaj na I/O kocki...

ČE bi bilo gor kaj drugega, bi se najbrž s tem hvalili včeraj ( as in "we now have also L4!" ), tako pa je to mogoče specifika, o katerei bodo mogoče govorili naslednjič.

Ali pa mogoče pri Epyc-u to ni zahtevan optimum, pri nabritih TR in/ali C/A/PUjih bi pa znal biti...

gendale2018 ::

Brane3 je izjavil:

Re Epyc:

Glede na površino CPU chipletov se zdi, da so se odločili obdržati L2 v CPU chipletih.

Zanimivo bo videt ali ga bo tudi kaj na I/O chipletu ali mogoče celo kaj L4....

kot je že Predator rekel je L3 del CCXa, se pravi L1/L2 je del jedra, L3 del CCXa (se pravi ima 2700x dejansko 2x8MB L3)... seveda jim pa to ne preprečuje da dajo še nek skupen L4 na io del če pomaga pri performancu

še posebej pri epycih, ki so mišljeni kot dragi procesorji in ni hud problem če se izdelava malo podraži

si predstavljate zen3 64c/128t threadripper z 256 gb hbm2 na io delu... seveda z današnjimi cenami rama ne bo šlo.....

Brane3 je izjavil:

Ja, zatipk. MIslu sem na L3. ja, videti je,d a ga CCX-imajo, vprašanje je, ali ga bo tudi kaj na I/O kocki...

ČE bi bilo gor kaj drugega, bi se najbrž s tem hvalili včeraj ( as in "we now have also L4!" ), tako pa je to mogoče specifika, o katerei bodo mogoče govorili naslednjič.

Ali pa mogoče pri Epyc-u to ni zahtevan optimum, pri nabritih TR in/ali C/A/PUjih bi pa znal biti...

za apu bi prav prišlo par gb hbmja, če jim rata to spravit gor bo to prvi igpu uporaben za zahtevne uporabnike
ja sam mali poštar, kurac mi je oštar
čuvajte se žene, bit ćete jebene

Zgodovina sprememb…

Predator X ::

Mene trenutno zanima kakšen delay bo do rama. Mogoče se res skriva nekaj L4 oziroma kakšna zadeva, ki bi izboljšala performance arhitekture

Brane3 ::

gendale2018 je izjavil:


kot je že Predator rekel je L3 del CCXa, se pravi L1/L2 je del jedra, L3 del CCXa (se pravi ima 2700x dejansko 2x8MB L3)... seveda jim pa to ne preprečuje da dajo še nek skupen L4 na io del če pomaga pri performancu


To še ne izključuje L3, še posebej ker je ta lahko deljen preko IF, ki zagotavlja koherenco.

Pač lokalno banko L3 imaš na svojem četverčku, ostale so drugje, z različnimi latencami glede na izvirni četverček.
Ni videti nekih zadržkov, da neka banka L3 ne bi mogla biti na I/O kocki...

Zgodovina sprememb…

  • spremenilo: Brane3 ()

gendale2018 ::

če te prav razumem bi ti imel nekako tako - vsak ccx ima svoj lokalni L3 + dostop do L3ja drugih ccxov (to dvoje je sedaj) + še nekaj L3 na io delu (novo)?

pol je imo pomembno samo še kaj je hitreje, da dodaten cache na io delu uporabljaš kot l3 ali kot l4
ja sam mali poštar, kurac mi je oštar
čuvajte se žene, bit ćete jebene

Brane3 ::

NE pravim da bi/ne bi to imel. Samo da je to videti možno.

MOgoče bi tak dodatek prav prišel pri orkestriranjju dela različnih CCX enot, če je razlog da bi si delile podatke v centralni enoti.

Ali da bi recimo počela write-combining za podatke, preden je batch za unit prebran ali zapisan ipd.

Ali da bi to pogruntal, da lahko stvar postavi v dual-use. Da recimo 16MB pride prav GPU enoti, če je tam baferiran tekoči slikovni frame ali kot cache za GPU, da mu je na voljo celotni RAM bandwidth za druge ali tretje stvari ipd ipd.

Zgodovina sprememb…

  • spremenilo: Brane3 ()

gendale2018 ::

lahko da bodo imeli tudi več različnih različic za različne čipe, pač odvisno kaj se kje najbolje obnese

za gpu bi pomoje prav prišlo še veliko več rama, ampak potem to ne bo ravno poceni... bi bil pa lahko veliko hitrejši kot trenutni.. afaik je zdaj za tisto vego na apujih hitrost rama velik bottleneck

na https://old.reddit.com/r/Amd/comments/9... je veliko ugibanja :)
ja sam mali poštar, kurac mi je oštar
čuvajte se žene, bit ćete jebene

Brane3 ::

MAm občutek, da se to ne končalo na klasični mantri 50% manjša poraba, 2x večja gostota, 25% višja hitrost posamezne enote, ampak bodo vstopili dodatni "množilniki" te vrste.

Tudi če je tak APU brez HBM2, bi se znal obnesti bistveno bolje od starega.

Ali da bi recimo novi TR dobil izvedbo z recimo 2C + 2G čipleta + HBM2 ali kaj petega.

To bi bla recimo zelo zanimiva kombinacija, iz več vzrokov. Dobil bi konbinacijo z izredno prepustnimi in low latency kanali med vsemi enotami in RAM-om, hkrati pa bi ta stvar imela GPU dele, ki s blizu klasični dGPU kombinaciji...

gendale2018 ::

tr z dobrim gpujem bi pomoje bil super, pa še pri cenah trja si lažje privoščijo še solidno količino hbm2 za gpu... poceni apu z dovolj hbm2 ne verjamem da je možen

še ena možnost je tudi 8c mobilni procesor + gpu + hbm2, to gre spet v drage izdelke in cena hbm2 ni tak problem

ubistvu imajo s tem dizajnom z ločenim io delom zelo fleksibilno arhitekturo s katero se da naredit marsikaj + relativno poceni ker so posamezni chipleti majhni in lažji za proizvodnjo pa še io del, ki ne bi profitiral veliko od 7nm procesa je še na starem cenejšem

ampak a ni zanimivo... že leta se selijo stvari iz northbridga/southbridga v procesorje, zdaj so šle pa spet ven :D
ja sam mali poštar, kurac mi je oštar
čuvajte se žene, bit ćete jebene

Brane3 ::

V bistvu sem se to spraševal od začetka OPteronov, ko smo vzeli taprve dual plate s 140-tkami.

Če so vpeljali pojem kock, ki jih setavljaš in spajaš preko HT kanalov in če so imeli stalne jebe z uskladitvijo CPU dela z memkontrolerjem, zakaj hudiča niso dali vsak del na svojo kocko ? Ja, latenca se poveča, samo:

- Intel je potem, ko mu je zagorelo pod ritjo spravil latence skozi zunanji NB _nižje_ kot jih je imel AMD z vdelanim mekontorletjem
- AMDju je vedno kronično primanjkovalo denarja in nikakor ni mogel z Intlom tekmovati povsod hkrati.Če bi imeli take kocke od začetka, bi bilo veliko manj proizvodnih linij za veliko več izdelkov. Kjer bi rezultat lahko tekmoval z Intlom, super. Kjer ne bi, bi pač ustrezno spustili ceno...

scipascapa ::

filip007 ::

Kaj so tista manjša jedra pri EPYC, to je zdaj modularen pristop.

Očitno AMD Starship preklican to je zdaj 64 jeder.
Prenosnik, konzola, TV, PC upokojen.

Predator X ::

majšna "jedra" (die) so CCX (Core + LLC), tisto večje je uncore- I/O

Zgodovina sprememb…

FlyingBee ::

vsako po 8 jeder,impressive

hojnikb ::

takle nacin bi se lahko spravl na desktop; en ccx die za core, drug die za io pa grafiko, tretji die pa za hbm
#brezpodpisa

Predator X ::

hojnikb je izjavil:

takle nacin bi se lahko spravl na desktop; en ccx die za core, drug die za io pa grafiko, tretji die pa za hbm


za APUja.. kolksen bo pa ddr4 latency...

FlyingBee ::

Nekako se zdi, da še ni popolne rešitve z latencami, naj bi bile nekatere aplikacije prav na to zelo občutljive.

hojnikb je izjavil:

takle nacin bi se lahko spravl na desktop; en ccx die za core, drug die za io pa grafiko, tretji die pa za hbm

Pa vse skupaj na pcb in v pcie režo.

Zgodovina sprememb…

gendale2018 ::

Brane3 je izjavil:

V bistvu sem se to spraševal od začetka OPteronov, ko smo vzeli taprve dual plate s 140-tkami.

Če so vpeljali pojem kock, ki jih setavljaš in spajaš preko HT kanalov in če so imeli stalne jebe z uskladitvijo CPU dela z memkontrolerjem, zakaj hudiča niso dali vsak del na svojo kocko ? Ja, latenca se poveča, samo:

- Intel je potem, ko mu je zagorelo pod ritjo spravil latence skozi zunanji NB _nižje_ kot jih je imel AMD z vdelanim mekontorletjem
- AMDju je vedno kronično primanjkovalo denarja in nikakor ni mogel z Intlom tekmovati povsod hkrati.Če bi imeli take kocke od začetka, bi bilo veliko manj proizvodnih linij za veliko več izdelkov. Kjer bi rezultat lahko tekmoval z Intlom, super. Kjer ne bi, bi pač ustrezno spustili ceno...

to se še spomnim, ko so pri opteronih obljubljali da se bo dalo preko hypertransporta povezati s procesorjem še razne specializirane čipe, ki bi šli v cpu sockete...

Pomojem so hitro videli, da z gradbeno mehanizacijo ne bo nič in so večino truda preusmerili v Zen. Tko kot si rekel, AMD ni imel nikoli dovolj denarja, da bi istočasno razvijal Zen, nadgrajeval gradbeno mehanizacijo, razvijal čipe za konzole in še razvijal grafične kartice. In pač gradbena mehanizacija ni nikoli prešla na tako modularen sistem kot ga ima Zen.

Gradbena mehanizacija je bila pa že v osnovi sfaljena:
-prepočesen predpomnilnik/slab prefetch
-posamezno jedro ima samo 2 alu cevovoda + 2 agu cevovoda, ki ne moreta izvajati veliko koristnega (prej so imeli 3 alu/agu cevovoda, zen ima pa 4 alu + 2 agu)
-obe jedri v modulu si delita fpu
-na začetku je imel vsak modul samo en dekoder, ki lahko dekodira 4 ukaze za obe jedri
-relativno dolg cevovod + slab branch prediction
-računali so da bodo lahko uporabili proces, ki bo šel na visoke frekvence pri relativno nizki porabi, ampak gfju ni zneslo

Namesto da bi se ukvarjali z izboljševanjem tega, so naredili nova dobra jedra, dodali 'lepilo', ki jim omogoča da iz enega dizajna potegnejo ven vse od čipov za prenosnike do čipov za strežnike in nastal je Zen. Zen2 nadaljuje s trendi, ki jih je začel Zen.
ja sam mali poštar, kurac mi je oštar
čuvajte se žene, bit ćete jebene

FlyingBee ::

najmanj kar so zasrali, je bilo poimenovanje, težka gradbena mehanizacija za majhne čipe, kot da bi vedeli, da bo sranje od cpujev bilo počasno in potratno

Predator X ::

Ljudje so se končno mal umiril. AMD mal na hypa stvar pa vsi čakamo samo legit reviewe.

Noben ni pričakoval 2x 256Bit fpu oziroma 1x 512bit fpu.
Me tud zanima na kakšnih clockih laufa sam IF oziroma I/O chip, ali je kaj L4 oz. kaj podobnega.

Brane3 ::

Ne vem če je vse ravno hype.

Teli recimo naj bi vedeli kaj več, pradvsem gledao iz strežniške dimenzije:

AMD EPYC 2 Rome - What We Know Will Change the Game

Predator X ::

Gre s epredvsem za FPU performance. V dveh letih prehitel Intel (fpu perf per core/clock).

Zgodovina sprememb…

gendale2018 ::



upam da se tole ugibanje uresniči
ja sam mali poštar, kurac mi je oštar
čuvajte se žene, bit ćete jebene

Predator X ::

https://www.anandtech.com/show/13566/am...

true desktop workstation.
No ko pride TR 3000 bo druga stvar.

Predator X ::

I/O naj bi bil ~ 430mm^2 .. jap definitivno je L4.

U24ever ::

gendale2018 je izjavil:



upam da se tole ugibanje uresniči


kaj je tukaj tako privlačnega?

FlyingBee ::

Njemu je vse kar AMD požegna sveto. Sledijo mu še objektivni gddr5 in d3m.

D3m ::

U24ever je izjavil:

gendale2018 je izjavil:



upam da se tole ugibanje uresniči


kaj je tukaj tako privlačnega?



Lego stil? ;)
|HP EliteBook|R5 6650U|

Jarno ::

U24ever je izjavil:

gendale2018 je izjavil:



upam da se tole ugibanje uresniči


kaj je tukaj tako privlačnega?


16c/32t na consumer AM4 socketu in z nizkimi latencami.
Glede na to, da AMD s prehodom na 7nm obljublja -50% porabo pri enakih frekvencah, bi znalo biti zanimivo.
Chuck Norris je med števili 0.999... in 1 uspel vriniti konstanto imenovano CN.
#65W!

AapocalypseE ::

Torej dobimo 2700X namesto 105W, 52.5W TDP.

Amazing 8-O

Kje je šele potem 105W pri 7nm.

5GHz jim ne uide do 105W.

Zgodovina sprememb…

D3m ::

50% je hudo optimistično. Malo z rezervo jemlji.

sem siguren, da bodo pustili TDP 65W.
|HP EliteBook|R5 6650U|

Zgodovina sprememb…

  • spremenil: D3m ()

Jarno ::

D3m je izjavil:

50% je hudo optimistično. Malo z rezervo jemlji.

sem siguren, da bodo pustili TDP 65W.


Pri enaki porabi najavljajo 25% povečano zmogljivost. Tudi na račun latenc in floating point izboljšav.
Chuck Norris je med števili 0.999... in 1 uspel vriniti konstanto imenovano CN.
#65W!

D3m ::

Mogoče. Bomo videli, še cca. 2 meseca za vsaj kak dodatni leak.
|HP EliteBook|R5 6650U|

Isotropic ::

Jarno je izjavil:

D3m je izjavil:

50% je hudo optimistično. Malo z rezervo jemlji.

sem siguren, da bodo pustili TDP 65W.


Pri enaki porabi najavljajo 25% povečano zmogljivost. Tudi na račun latenc in floating point izboljšav.

vir?
toliko bo mogoče v res redkih programih, večinoma pa občutno manj.

RegulusDraco ::

Isotropic je izjavil:

Jarno je izjavil:

D3m je izjavil:

50% je hudo optimistično. Malo z rezervo jemlji.

sem siguren, da bodo pustili TDP 65W.


Pri enaki porabi najavljajo 25% povečano zmogljivost. Tudi na račun latenc in floating point izboljšav.

vir?
toliko bo mogoče v res redkih programih, večinoma pa občutno manj.


saj je jasno zapisal, da bo CPU pri isti porabi wattov 25% zmogljivejši. Pri enaki zmogljivosti pa bo 50% varčnejši od zen+ generacije.

To je AMD trdil na tiskovni konferenci prejšnji teden.

Realno bodo pomojem porabo malenksot znižali, zmogljivost pa bo torej nekje med 100% (sigurno ne bo samo enako dober kot 2700x..morajo ga pohitriti) in 125% (best case, najbrž se bo to dalo doseči z navijanjem procesorja) procesorja AMD ryzen 2700x.
A coding sequence cannot be revised once it's been established.

Zgodovina sprememb…

Jarno ::

Isotropic je izjavil:

Jarno je izjavil:

D3m je izjavil:

50% je hudo optimistično. Malo z rezervo jemlji.

sem siguren, da bodo pustili TDP 65W.


Pri enaki porabi najavljajo 25% povečano zmogljivost. Tudi na račun latenc in floating point izboljšav.

vir?
toliko bo mogoče v res redkih programih, večinoma pa občutno manj.



@5:35

Ne pozabit, da gre povečana zmogljivost tudi na račun povišanih frekvenc.
Chuck Norris je med števili 0.999... in 1 uspel vriniti konstanto imenovano CN.
#65W!

D3m ::

RegulusDraco je izjavil:

Isotropic je izjavil:

Jarno je izjavil:

D3m je izjavil:

50% je hudo optimistično. Malo z rezervo jemlji.

sem siguren, da bodo pustili TDP 65W.


Pri enaki porabi najavljajo 25% povečano zmogljivost. Tudi na račun latenc in floating point izboljšav.

vir?
toliko bo mogoče v res redkih programih, večinoma pa občutno manj.


saj je jasno zapisal, da bo CPU pri isti porabi wattov 25% zmogljivejši. Pri enaki zmogljivosti pa bo 50% varčnejši od zen+ generacije.

To je AMD trdil na tiskovni konferenci prejšnji teden.

Realno bodo pomojem porabo malenksot znižali, zmogljivost pa bo torej nekje med 100% (sigurno ne bo samo enako dober kot 2700x..morajo ga pohitriti) in 125% (best case, najbrž se bo to dalo doseči z navijanjem procesorja) procesorja AMD ryzen 2700x.


Ne. To so govorili za Zen in ne Zen+.
|HP EliteBook|R5 6650U|

Zgodovina sprememb…

Isotropic ::

aha, glede frekvenc je druga ja.
vseeno pa intelovih 5ghz še vedno niti približno ne bo dosegal, prej 4.5.

RegulusDraco ::

ah, my bad.

Se pravi proti zen+ bo pohitritev v najboljšem primeru med 10 in 15%, če ne zvišajo porabe?

Pol pa morajo dvignit porabo. 10% pohitritev ni nč...
A coding sequence cannot be revised once it's been established.

Zgodovina sprememb…

D3m ::

15-20% ob isti porabi.

Kar sploh ni slabo.
|HP EliteBook|R5 6650U|

Zgodovina sprememb…

RegulusDraco ::

proti zen. proti zen+ torej 10 % pohitritev, kar je neomembe vredno.

vsaj tako ti trdiš...da pohitritev v primerjavi s porabo velja za zen in ne zen+ generacijo.
A coding sequence cannot be revised once it's been established.

Zgodovina sprememb…

D3m ::

25% proti Zen
15-20% proti Zen+
|HP EliteBook|R5 6650U|

Zgodovina sprememb…

RegulusDraco ::

če pa velja kot si sedaj zapisal pa ne razumem zakaj zavraga si me šel porpavljat glede na to da sem zapisal isto reč?


troll AMDjevski.
A coding sequence cannot be revised once it's been established.

Zgodovina sprememb…

««
264 / 623
»»