Forum » Strojna oprema » AMD ZEN - nova X86 Jedra
AMD ZEN - nova X86 Jedra
Temo vidijo: vsi
Predator X ::
Ni videti razloga da ne bi.
Tudi to, da bo več placa za nora navijanja.
Poleg tega, ker gredo vs kocke skozi I/O kocko, ni privilegiranih in prikrašanih CPU clustrov.
MOgoče bo to končno razlog da dajo ven 8-kanalne TrheadRipper plate ven.
In/ali 64C ThreadRipperje v 1+8 chiplet konfiguraciji.
JSt se spomnm sam 64C je nemogoče
Jap, super bi bilo za TR. Za desktop pa vse na en die in to je to. Pa tud če ostane pr 8C.
Brane3 ::
Nieki gledam grafikuljo in par malenkosti mi ni jasno.
Instinct MI60 naj bi bil na 7nm, MI25 pa je "stara" Vega na 14 nm.
Zakaj nima pri drobljenju FP32/64 cifer novi MI60 bistveno višjih cifer ?
Če pogledam število shaderjev, je nekje enako - 4k vs starih 4k.
Ali pa ej pridobitev v tem da pač novi čip porabi 2x manj in jih lahko v enak volumen damo 2x več ?
To bi dalo nek dodaten smisel tistemu novemu Infinity Fabric obroču...
Instinct MI60 naj bi bil na 7nm, MI25 pa je "stara" Vega na 14 nm.
Zakaj nima pri drobljenju FP32/64 cifer novi MI60 bistveno višjih cifer ?
Če pogledam število shaderjev, je nekje enako - 4k vs starih 4k.
Ali pa ej pridobitev v tem da pač novi čip porabi 2x manj in jih lahko v enak volumen damo 2x več ?
To bi dalo nek dodaten smisel tistemu novemu Infinity Fabric obroču...
Brane3 ::
Re Epyc:
Glede na površino CPU chipletov se zdi, da so se odločili obdržati L2 v CPU chipletih.
Zanimivo bo videt ali ga bo tudi kaj na I/O chipletu ali mogoče celo kaj L4....
Glede na površino CPU chipletov se zdi, da so se odločili obdržati L2 v CPU chipletih.
Zanimivo bo videt ali ga bo tudi kaj na I/O chipletu ali mogoče celo kaj L4....
Brane3 ::
Še vedno ima lahko L3 ali L4. Seveda ne celoten L3 ( ta je itak segmentiran) ampak nek njegov segment.
Tadva nista v najbolj speed-kritičnih zadevah, poleg tega bi bilo mogoče v nekaterih scenarijih pametno imeti kaj L3 v centralnem hub-u...
Tadva nista v najbolj speed-kritičnih zadevah, poleg tega bi bilo mogoče v nekaterih scenarijih pametno imeti kaj L3 v centralnem hub-u...
Zgodovina sprememb…
- spremenilo: Brane3 ()
Predator X ::
Brane3 ::
Ja, zatipk. MIslu sem na L3. ja, videti je,d a ga CCX-imajo, vprašanje je, ali ga bo tudi kaj na I/O kocki...
ČE bi bilo gor kaj drugega, bi se najbrž s tem hvalili včeraj ( as in "we now have also L4!" ), tako pa je to mogoče specifika, o katerei bodo mogoče govorili naslednjič.
Ali pa mogoče pri Epyc-u to ni zahtevan optimum, pri nabritih TR in/ali C/A/PUjih bi pa znal biti...
ČE bi bilo gor kaj drugega, bi se najbrž s tem hvalili včeraj ( as in "we now have also L4!" ), tako pa je to mogoče specifika, o katerei bodo mogoče govorili naslednjič.
Ali pa mogoče pri Epyc-u to ni zahtevan optimum, pri nabritih TR in/ali C/A/PUjih bi pa znal biti...
gendale2018 ::
Re Epyc:
Glede na površino CPU chipletov se zdi, da so se odločili obdržati L2 v CPU chipletih.
Zanimivo bo videt ali ga bo tudi kaj na I/O chipletu ali mogoče celo kaj L4....
kot je že Predator rekel je L3 del CCXa, se pravi L1/L2 je del jedra, L3 del CCXa (se pravi ima 2700x dejansko 2x8MB L3)... seveda jim pa to ne preprečuje da dajo še nek skupen L4 na io del če pomaga pri performancu
še posebej pri epycih, ki so mišljeni kot dragi procesorji in ni hud problem če se izdelava malo podraži
si predstavljate zen3 64c/128t threadripper z 256 gb hbm2 na io delu... seveda z današnjimi cenami rama ne bo šlo.....
Ja, zatipk. MIslu sem na L3. ja, videti je,d a ga CCX-imajo, vprašanje je, ali ga bo tudi kaj na I/O kocki...
ČE bi bilo gor kaj drugega, bi se najbrž s tem hvalili včeraj ( as in "we now have also L4!" ), tako pa je to mogoče specifika, o katerei bodo mogoče govorili naslednjič.
Ali pa mogoče pri Epyc-u to ni zahtevan optimum, pri nabritih TR in/ali C/A/PUjih bi pa znal biti...
za apu bi prav prišlo par gb hbmja, če jim rata to spravit gor bo to prvi igpu uporaben za zahtevne uporabnike
ja sam mali poštar, kurac mi je oštar
čuvajte se žene, bit ćete jebene
čuvajte se žene, bit ćete jebene
Zgodovina sprememb…
- spremenilo: gendale2018 ()
Predator X ::
Mene trenutno zanima kakšen delay bo do rama. Mogoče se res skriva nekaj L4 oziroma kakšna zadeva, ki bi izboljšala performance arhitekture
Brane3 ::
gendale2018 je izjavil:
kot je že Predator rekel je L3 del CCXa, se pravi L1/L2 je del jedra, L3 del CCXa (se pravi ima 2700x dejansko 2x8MB L3)... seveda jim pa to ne preprečuje da dajo še nek skupen L4 na io del če pomaga pri performancu
To še ne izključuje L3, še posebej ker je ta lahko deljen preko IF, ki zagotavlja koherenco.
Pač lokalno banko L3 imaš na svojem četverčku, ostale so drugje, z različnimi latencami glede na izvirni četverček.
Ni videti nekih zadržkov, da neka banka L3 ne bi mogla biti na I/O kocki...
Zgodovina sprememb…
- spremenilo: Brane3 ()
gendale2018 ::
če te prav razumem bi ti imel nekako tako - vsak ccx ima svoj lokalni L3 + dostop do L3ja drugih ccxov (to dvoje je sedaj) + še nekaj L3 na io delu (novo)?
pol je imo pomembno samo še kaj je hitreje, da dodaten cache na io delu uporabljaš kot l3 ali kot l4
pol je imo pomembno samo še kaj je hitreje, da dodaten cache na io delu uporabljaš kot l3 ali kot l4
ja sam mali poštar, kurac mi je oštar
čuvajte se žene, bit ćete jebene
čuvajte se žene, bit ćete jebene
Brane3 ::
NE pravim da bi/ne bi to imel. Samo da je to videti možno.
MOgoče bi tak dodatek prav prišel pri orkestriranjju dela različnih CCX enot, če je razlog da bi si delile podatke v centralni enoti.
Ali da bi recimo počela write-combining za podatke, preden je batch za unit prebran ali zapisan ipd.
Ali da bi to pogruntal, da lahko stvar postavi v dual-use. Da recimo 16MB pride prav GPU enoti, če je tam baferiran tekoči slikovni frame ali kot cache za GPU, da mu je na voljo celotni RAM bandwidth za druge ali tretje stvari ipd ipd.
MOgoče bi tak dodatek prav prišel pri orkestriranjju dela različnih CCX enot, če je razlog da bi si delile podatke v centralni enoti.
Ali da bi recimo počela write-combining za podatke, preden je batch za unit prebran ali zapisan ipd.
Ali da bi to pogruntal, da lahko stvar postavi v dual-use. Da recimo 16MB pride prav GPU enoti, če je tam baferiran tekoči slikovni frame ali kot cache za GPU, da mu je na voljo celotni RAM bandwidth za druge ali tretje stvari ipd ipd.
Zgodovina sprememb…
- spremenilo: Brane3 ()
gendale2018 ::
lahko da bodo imeli tudi več različnih različic za različne čipe, pač odvisno kaj se kje najbolje obnese
za gpu bi pomoje prav prišlo še veliko več rama, ampak potem to ne bo ravno poceni... bi bil pa lahko veliko hitrejši kot trenutni.. afaik je zdaj za tisto vego na apujih hitrost rama velik bottleneck
na https://old.reddit.com/r/Amd/comments/9... je veliko ugibanja
za gpu bi pomoje prav prišlo še veliko več rama, ampak potem to ne bo ravno poceni... bi bil pa lahko veliko hitrejši kot trenutni.. afaik je zdaj za tisto vego na apujih hitrost rama velik bottleneck
na https://old.reddit.com/r/Amd/comments/9... je veliko ugibanja
ja sam mali poštar, kurac mi je oštar
čuvajte se žene, bit ćete jebene
čuvajte se žene, bit ćete jebene
Brane3 ::
MAm občutek, da se to ne končalo na klasični mantri 50% manjša poraba, 2x večja gostota, 25% višja hitrost posamezne enote, ampak bodo vstopili dodatni "množilniki" te vrste.
Tudi če je tak APU brez HBM2, bi se znal obnesti bistveno bolje od starega.
Ali da bi recimo novi TR dobil izvedbo z recimo 2C + 2G čipleta + HBM2 ali kaj petega.
To bi bla recimo zelo zanimiva kombinacija, iz več vzrokov. Dobil bi konbinacijo z izredno prepustnimi in low latency kanali med vsemi enotami in RAM-om, hkrati pa bi ta stvar imela GPU dele, ki s blizu klasični dGPU kombinaciji...
Tudi če je tak APU brez HBM2, bi se znal obnesti bistveno bolje od starega.
Ali da bi recimo novi TR dobil izvedbo z recimo 2C + 2G čipleta + HBM2 ali kaj petega.
To bi bla recimo zelo zanimiva kombinacija, iz več vzrokov. Dobil bi konbinacijo z izredno prepustnimi in low latency kanali med vsemi enotami in RAM-om, hkrati pa bi ta stvar imela GPU dele, ki s blizu klasični dGPU kombinaciji...
gendale2018 ::
tr z dobrim gpujem bi pomoje bil super, pa še pri cenah trja si lažje privoščijo še solidno količino hbm2 za gpu... poceni apu z dovolj hbm2 ne verjamem da je možen
še ena možnost je tudi 8c mobilni procesor + gpu + hbm2, to gre spet v drage izdelke in cena hbm2 ni tak problem
ubistvu imajo s tem dizajnom z ločenim io delom zelo fleksibilno arhitekturo s katero se da naredit marsikaj + relativno poceni ker so posamezni chipleti majhni in lažji za proizvodnjo pa še io del, ki ne bi profitiral veliko od 7nm procesa je še na starem cenejšem
ampak a ni zanimivo... že leta se selijo stvari iz northbridga/southbridga v procesorje, zdaj so šle pa spet ven
še ena možnost je tudi 8c mobilni procesor + gpu + hbm2, to gre spet v drage izdelke in cena hbm2 ni tak problem
ubistvu imajo s tem dizajnom z ločenim io delom zelo fleksibilno arhitekturo s katero se da naredit marsikaj + relativno poceni ker so posamezni chipleti majhni in lažji za proizvodnjo pa še io del, ki ne bi profitiral veliko od 7nm procesa je še na starem cenejšem
ampak a ni zanimivo... že leta se selijo stvari iz northbridga/southbridga v procesorje, zdaj so šle pa spet ven
ja sam mali poštar, kurac mi je oštar
čuvajte se žene, bit ćete jebene
čuvajte se žene, bit ćete jebene
Brane3 ::
V bistvu sem se to spraševal od začetka OPteronov, ko smo vzeli taprve dual plate s 140-tkami.
Če so vpeljali pojem kock, ki jih setavljaš in spajaš preko HT kanalov in če so imeli stalne jebe z uskladitvijo CPU dela z memkontrolerjem, zakaj hudiča niso dali vsak del na svojo kocko ? Ja, latenca se poveča, samo:
- Intel je potem, ko mu je zagorelo pod ritjo spravil latence skozi zunanji NB _nižje_ kot jih je imel AMD z vdelanim mekontorletjem
- AMDju je vedno kronično primanjkovalo denarja in nikakor ni mogel z Intlom tekmovati povsod hkrati.Če bi imeli take kocke od začetka, bi bilo veliko manj proizvodnih linij za veliko več izdelkov. Kjer bi rezultat lahko tekmoval z Intlom, super. Kjer ne bi, bi pač ustrezno spustili ceno...
Če so vpeljali pojem kock, ki jih setavljaš in spajaš preko HT kanalov in če so imeli stalne jebe z uskladitvijo CPU dela z memkontrolerjem, zakaj hudiča niso dali vsak del na svojo kocko ? Ja, latenca se poveča, samo:
- Intel je potem, ko mu je zagorelo pod ritjo spravil latence skozi zunanji NB _nižje_ kot jih je imel AMD z vdelanim mekontorletjem
- AMDju je vedno kronično primanjkovalo denarja in nikakor ni mogel z Intlom tekmovati povsod hkrati.Če bi imeli take kocke od začetka, bi bilo veliko manj proizvodnih linij za veliko več izdelkov. Kjer bi rezultat lahko tekmoval z Intlom, super. Kjer ne bi, bi pač ustrezno spustili ceno...
filip007 ::
Kaj so tista manjša jedra pri EPYC, to je zdaj modularen pristop.
Očitno AMD Starship preklican to je zdaj 64 jeder.
Očitno AMD Starship preklican to je zdaj 64 jeder.
Prenosnik, konzola, TV, PC upokojen.
Predator X ::
majšna "jedra" (die) so CCX (Core + LLC), tisto večje je uncore- I/O
Zgodovina sprememb…
- spremenilo: Predator X ()
hojnikb ::
takle nacin bi se lahko spravl na desktop; en ccx die za core, drug die za io pa grafiko, tretji die pa za hbm
#brezpodpisa
Predator X ::
FlyingBee ::
Nekako se zdi, da še ni popolne rešitve z latencami, naj bi bile nekatere aplikacije prav na to zelo občutljive.
Pa vse skupaj na pcb in v pcie režo.
takle nacin bi se lahko spravl na desktop; en ccx die za core, drug die za io pa grafiko, tretji die pa za hbm
Pa vse skupaj na pcb in v pcie režo.
Zgodovina sprememb…
- spremenil: FlyingBee ()
gendale2018 ::
V bistvu sem se to spraševal od začetka OPteronov, ko smo vzeli taprve dual plate s 140-tkami.
Če so vpeljali pojem kock, ki jih setavljaš in spajaš preko HT kanalov in če so imeli stalne jebe z uskladitvijo CPU dela z memkontrolerjem, zakaj hudiča niso dali vsak del na svojo kocko ? Ja, latenca se poveča, samo:
- Intel je potem, ko mu je zagorelo pod ritjo spravil latence skozi zunanji NB _nižje_ kot jih je imel AMD z vdelanim mekontorletjem
- AMDju je vedno kronično primanjkovalo denarja in nikakor ni mogel z Intlom tekmovati povsod hkrati.Če bi imeli take kocke od začetka, bi bilo veliko manj proizvodnih linij za veliko več izdelkov. Kjer bi rezultat lahko tekmoval z Intlom, super. Kjer ne bi, bi pač ustrezno spustili ceno...
to se še spomnim, ko so pri opteronih obljubljali da se bo dalo preko hypertransporta povezati s procesorjem še razne specializirane čipe, ki bi šli v cpu sockete...
Pomojem so hitro videli, da z gradbeno mehanizacijo ne bo nič in so večino truda preusmerili v Zen. Tko kot si rekel, AMD ni imel nikoli dovolj denarja, da bi istočasno razvijal Zen, nadgrajeval gradbeno mehanizacijo, razvijal čipe za konzole in še razvijal grafične kartice. In pač gradbena mehanizacija ni nikoli prešla na tako modularen sistem kot ga ima Zen.
Gradbena mehanizacija je bila pa že v osnovi sfaljena:
-prepočesen predpomnilnik/slab prefetch
-posamezno jedro ima samo 2 alu cevovoda + 2 agu cevovoda, ki ne moreta izvajati veliko koristnega (prej so imeli 3 alu/agu cevovoda, zen ima pa 4 alu + 2 agu)
-obe jedri v modulu si delita fpu
-na začetku je imel vsak modul samo en dekoder, ki lahko dekodira 4 ukaze za obe jedri
-relativno dolg cevovod + slab branch prediction
-računali so da bodo lahko uporabili proces, ki bo šel na visoke frekvence pri relativno nizki porabi, ampak gfju ni zneslo
Namesto da bi se ukvarjali z izboljševanjem tega, so naredili nova dobra jedra, dodali 'lepilo', ki jim omogoča da iz enega dizajna potegnejo ven vse od čipov za prenosnike do čipov za strežnike in nastal je Zen. Zen2 nadaljuje s trendi, ki jih je začel Zen.
ja sam mali poštar, kurac mi je oštar
čuvajte se žene, bit ćete jebene
čuvajte se žene, bit ćete jebene
FlyingBee ::
najmanj kar so zasrali, je bilo poimenovanje, težka gradbena mehanizacija za majhne čipe, kot da bi vedeli, da bo sranje od cpujev bilo počasno in potratno
Predator X ::
Ljudje so se končno mal umiril. AMD mal na hypa stvar pa vsi čakamo samo legit reviewe.
Noben ni pričakoval 2x 256Bit fpu oziroma 1x 512bit fpu.
Me tud zanima na kakšnih clockih laufa sam IF oziroma I/O chip, ali je kaj L4 oz. kaj podobnega.
Noben ni pričakoval 2x 256Bit fpu oziroma 1x 512bit fpu.
Me tud zanima na kakšnih clockih laufa sam IF oziroma I/O chip, ali je kaj L4 oz. kaj podobnega.
Brane3 ::
Ne vem če je vse ravno hype.
Teli recimo naj bi vedeli kaj več, pradvsem gledao iz strežniške dimenzije:
AMD EPYC 2 Rome - What We Know Will Change the Game
Teli recimo naj bi vedeli kaj več, pradvsem gledao iz strežniške dimenzije:
AMD EPYC 2 Rome - What We Know Will Change the Game
Predator X ::
Gre s epredvsem za FPU performance. V dveh letih prehitel Intel (fpu perf per core/clock).
Zgodovina sprememb…
- spremenilo: Predator X ()
Predator X ::
https://www.anandtech.com/show/13566/am...
true desktop workstation.
No ko pride TR 3000 bo druga stvar.
true desktop workstation.
No ko pride TR 3000 bo druga stvar.
D3m ::
|HP EliteBook|R5 6650U|
Jarno ::
gendale2018 je izjavil:
upam da se tole ugibanje uresniči
kaj je tukaj tako privlačnega?
16c/32t na consumer AM4 socketu in z nizkimi latencami.
Glede na to, da AMD s prehodom na 7nm obljublja -50% porabo pri enakih frekvencah, bi znalo biti zanimivo.
Chuck Norris je med števili 0.999... in 1 uspel vriniti konstanto imenovano CN.
#65W!
#65W!
AapocalypseE ::
Torej dobimo 2700X namesto 105W, 52.5W TDP.
Amazing
Kje je šele potem 105W pri 7nm.
5GHz jim ne uide do 105W.
Amazing
Kje je šele potem 105W pri 7nm.
5GHz jim ne uide do 105W.
Zgodovina sprememb…
- spremenil: AapocalypseE ()
D3m ::
50% je hudo optimistično. Malo z rezervo jemlji.
sem siguren, da bodo pustili TDP 65W.
sem siguren, da bodo pustili TDP 65W.
|HP EliteBook|R5 6650U|
Zgodovina sprememb…
- spremenil: D3m ()
Jarno ::
50% je hudo optimistično. Malo z rezervo jemlji.
sem siguren, da bodo pustili TDP 65W.
Pri enaki porabi najavljajo 25% povečano zmogljivost. Tudi na račun latenc in floating point izboljšav.
Chuck Norris je med števili 0.999... in 1 uspel vriniti konstanto imenovano CN.
#65W!
#65W!
Isotropic ::
RegulusDraco ::
50% je hudo optimistično. Malo z rezervo jemlji.
sem siguren, da bodo pustili TDP 65W.
Pri enaki porabi najavljajo 25% povečano zmogljivost. Tudi na račun latenc in floating point izboljšav.
vir?
toliko bo mogoče v res redkih programih, večinoma pa občutno manj.
saj je jasno zapisal, da bo CPU pri isti porabi wattov 25% zmogljivejši. Pri enaki zmogljivosti pa bo 50% varčnejši od zen+ generacije.
To je AMD trdil na tiskovni konferenci prejšnji teden.
Realno bodo pomojem porabo malenksot znižali, zmogljivost pa bo torej nekje med 100% (sigurno ne bo samo enako dober kot 2700x..morajo ga pohitriti) in 125% (best case, najbrž se bo to dalo doseči z navijanjem procesorja) procesorja AMD ryzen 2700x.
A coding sequence cannot be revised once it's been established.
Zgodovina sprememb…
- spremenil: RegulusDraco ()
Jarno ::
50% je hudo optimistično. Malo z rezervo jemlji.
sem siguren, da bodo pustili TDP 65W.
Pri enaki porabi najavljajo 25% povečano zmogljivost. Tudi na račun latenc in floating point izboljšav.
vir?
toliko bo mogoče v res redkih programih, večinoma pa občutno manj.
@5:35
Ne pozabit, da gre povečana zmogljivost tudi na račun povišanih frekvenc.
Chuck Norris je med števili 0.999... in 1 uspel vriniti konstanto imenovano CN.
#65W!
#65W!
D3m ::
RegulusDraco je izjavil:
50% je hudo optimistično. Malo z rezervo jemlji.
sem siguren, da bodo pustili TDP 65W.
Pri enaki porabi najavljajo 25% povečano zmogljivost. Tudi na račun latenc in floating point izboljšav.
vir?
toliko bo mogoče v res redkih programih, večinoma pa občutno manj.
saj je jasno zapisal, da bo CPU pri isti porabi wattov 25% zmogljivejši. Pri enaki zmogljivosti pa bo 50% varčnejši od zen+ generacije.
To je AMD trdil na tiskovni konferenci prejšnji teden.
Realno bodo pomojem porabo malenksot znižali, zmogljivost pa bo torej nekje med 100% (sigurno ne bo samo enako dober kot 2700x..morajo ga pohitriti) in 125% (best case, najbrž se bo to dalo doseči z navijanjem procesorja) procesorja AMD ryzen 2700x.
Ne. To so govorili za Zen in ne Zen+.
|HP EliteBook|R5 6650U|
Zgodovina sprememb…
- predlagal izbris: RegulusDraco ()
Isotropic ::
aha, glede frekvenc je druga ja.
vseeno pa intelovih 5ghz še vedno niti približno ne bo dosegal, prej 4.5.
vseeno pa intelovih 5ghz še vedno niti približno ne bo dosegal, prej 4.5.
RegulusDraco ::
ah, my bad.
Se pravi proti zen+ bo pohitritev v najboljšem primeru med 10 in 15%, če ne zvišajo porabe?
Pol pa morajo dvignit porabo. 10% pohitritev ni nč...
Se pravi proti zen+ bo pohitritev v najboljšem primeru med 10 in 15%, če ne zvišajo porabe?
Pol pa morajo dvignit porabo. 10% pohitritev ni nč...
A coding sequence cannot be revised once it's been established.
Zgodovina sprememb…
- spremenil: RegulusDraco ()
D3m ::
15-20% ob isti porabi.
Kar sploh ni slabo.
Kar sploh ni slabo.
|HP EliteBook|R5 6650U|
Zgodovina sprememb…
- predlagal izbris: RegulusDraco ()
RegulusDraco ::
proti zen. proti zen+ torej 10 % pohitritev, kar je neomembe vredno.
vsaj tako ti trdiš...da pohitritev v primerjavi s porabo velja za zen in ne zen+ generacijo.
vsaj tako ti trdiš...da pohitritev v primerjavi s porabo velja za zen in ne zen+ generacijo.
A coding sequence cannot be revised once it's been established.
Zgodovina sprememb…
- spremenil: RegulusDraco ()
D3m ::
25% proti Zen
15-20% proti Zen+
15-20% proti Zen+
|HP EliteBook|R5 6650U|
Zgodovina sprememb…
- predlagal izbris: RegulusDraco ()
RegulusDraco ::
če pa velja kot si sedaj zapisal pa ne razumem zakaj zavraga si me šel porpavljat glede na to da sem zapisal isto reč?
troll AMDjevski.
troll AMDjevski.
A coding sequence cannot be revised once it's been established.
Zgodovina sprememb…
- spremenil: RegulusDraco ()