» »

AMD ZEN - nova X86 Jedra

AMD ZEN - nova X86 Jedra

Temo vidijo: vsi
««
266 / 611
»»

FlyingBee ::

Ne sme biti prezgodaj, ker bodo kupci 2000 serije zamerili.

meho7 ::

Predator X je izjavil:

Za tiste, ki pravite, da R5 2600/X nista dovolj za 144Hz - 720p benchmark ULTRA
Zelo podobna zadeva :
Če uspete 4,2GHz ter 3600MHz DDR4 CL15 bo še hitrejši kot je tale R7 2700X...



Glede na BF5 bi rekel, da so kr začel uporabljat threade bolj optimistično .. BF1 samo 35-40% pri 16T.

Z FX 8370/gtx1080 mas 90fps on average @ 1080p
Battlefield igre so optimizirane za AMD hardware - sponzor

Zgodovina sprememb…

  • spremenil: meho7 ()

Predator X ::

Tole ni bench MPja.

FlyingBee ::

Zakaj potem na dx12 problemi. En čas se je veliko dx12 in amd skupaj govorilo.

Predator X ::

FlyingBee je izjavil:

Zakaj potem na dx12 problemi. En čas se je veliko dx12 in amd skupaj govorilo.



BF ni nikol delal lepo na DX12. Samo mantle laufa odlično. Pa tud ta je imel težave če so imel grafe manj VRAMA (leak)

FireSnake ::

Wrop je izjavil:

Ja, 29 % v določenem programu. Če bo v splošnem polovica tega, bo zmaga.


IPC je instructions per clock.
In tu se ne gre za specifičen program.

Številka je zelo visoka.
Poglej in se nasmej: vicmaher.si

Predator X ::

Ha ha ha, bolj je mislil na dolocene instrukcije ki jih uporablja program. Ce gledamo avx512 (fpu) je intel dalec spredaj

D3m ::

|HP EliteBook|R5 6650U|

FireSnake ::

To pa ni to.

IPC je število inštrikcij na cikel.

Če en program rabi 100 inštrukcij, da se izvede se:
- pri IPCju 1 izvede v 100 ciklih,
- IPCju 1.29 izvede v 77,5 ciklih

In to nima nobene veze s tem, kakšne vrste workload (spet nimam slovenske besede na jeziku) je.

Številke so zgolj simbolične - za lažjo razlago.
Poglej in se nasmej: vicmaher.si

Zgodovina sprememb…

  • spremenilo: FireSnake ()

Wrop ::

IPC definicija in številke ti sicer štimajo, zaključek pa niti ne.
IPC je vsekakor odvisen od (vrste) dela - množice ukazov, ki ga dobi procesor. Če boš poganjal igre bo imel procesor drugačen IPC, kot če boš brskal po spletu.

Predator X ::

FireSnake je izjavil:


In to nima nobene veze s tem, kakšne vrste workload (spet nimam slovenske besede na jeziku) je.


whaat?
Če bi blo tko simpl, potem lahko ryzen opravič več inštrukcij na cikel kot intel (glej agners blog).

Jarno ::

In to nima nobene veze s tem, kakšne vrste workload (spet nimam slovenske besede na jeziku) je.

Gre predvsem za to, da novi ryzen ni slabši od starega v nobenem "workloadu", ampak ga prekaša v "multiple dimensions". Tu dam prav.
Že z nižjimi latencami, izboljšanim "fpu-jem" in predpomnilnikom bo veselica.
Edina težava, ki jo vidim, je pomnilniška podhranjenost pri morebitni 16c/32t AM4 konfiguraciji. Morda pa bo 16c/16t. :D
#65W!

FireSnake ::

Wrop je izjavil:

IPC definicija in številke ti sicer štimajo, zaključek pa niti ne.
IPC je vsekakor odvisen od (vrste) dela - množice ukazov, ki ga dobi procesor. Če boš poganjal igre bo imel procesor drugačen IPC, kot če boš brskal po spletu.


A res?
IPC se, po tvoje, spreminja.

Daj tole prevedi malo bolj na strojni nivo.
Sama ušesa so me.
Poglej in se nasmej: vicmaher.si

Zgodovina sprememb…

  • spremenilo: FireSnake ()

Pebkac ::

FireSnake, ti nimaš pojma. IPC definitivno se spreminja glede na to kateri ukazi se izvajajo, v kakšnem vrstnem redu se izvajajo, pa še marsikaj drugega vpliva na to številko. Največ časa procesor zgubi takrat ko čaka na pomnilnik in zgubi tudi po 100+ ciklov brez da bi dokončal 1 inštrukcijo :))

FlyingBee ::

Dajmo se na st performance v cb15 omejiti. Omenja se 230 za zen2.

louser ::

AapocalypseE je izjavil:

louser je izjavil:

AapocalypseE je izjavil:

RTX 2080 and 2080Ti on Ryzen... will it bottleneck??


Nisem gledal, ampak zihr bottlenecka grafa.


Rdeči bodo raje izpustili ta video :))

Nisem rdeči, a v igrah še vedno nimamo spodobnih graf.

Predator X ::

FireSnake je izjavil:

Wrop je izjavil:

IPC definicija in številke ti sicer štimajo, zaključek pa niti ne.
IPC je vsekakor odvisen od (vrste) dela - množice ukazov, ki ga dobi procesor. Če boš poganjal igre bo imel procesor drugačen IPC, kot če boš brskal po spletu.


A res?
IPC se, po tvoje, spreminja.

Daj tole prevedi malo bolj na strojni nivo.
Sama ušesa so me.


Počak zdej, mi iščemo IPC v praksi ti nabijaš po svoje. Če se gremo po specsih ti že sama dokumentacija pove, da je IPC relativen glede na operacijo, ki jo izvaja procesor.
V osnovi lahko ryzen naredi 5 inštrukcij ( celo 6, ampak pod pogojem) per clock intel pa 4 in še to mora coda laufat direktno iz micro-cacha.

Pusti ti te tvoje razlage in bodimo bolj praktični. V praksi se avg. IPC izmeri tako, da se laufa več različnih aplikacij pri določenem clocku. In že takoj, če primerjamo FPU pri 512/256bit bo intel spredaj in to kar za ~2x, če bo uporabljal 512bit.

FireSnake ::

Pebkac je izjavil:

IPC definitivno se spreminja glede na to kateri ukazi se izvajajo, v kakšnem vrstnem redu se izvajajo, pa še marsikaj drugega vpliva na to številko.


Jaz sem ostal še v času PICev (in v asemblerju). Kjer sem si lahko izračunal, kdaj se bo program izvedel ... se posipam s pepelom.
Poglej in se nasmej: vicmaher.si

Zgodovina sprememb…

  • spremenilo: FireSnake ()

Wrop ::

FireSnake je izjavil:

Wrop je izjavil:

IPC definicija in številke ti sicer štimajo, zaključek pa niti ne.
IPC je vsekakor odvisen od (vrste) dela - množice ukazov, ki ga dobi procesor. Če boš poganjal igre bo imel procesor drugačen IPC, kot če boš brskal po spletu.


A res?
IPC se, po tvoje, spreminja.

Daj tole prevedi malo bolj na strojni nivo.
Sama ušesa so me.


Imaš program, ki je sestavljen iz določene (večkratne)množice ukazov. Število ciklov, ki jih program potrebuje, da se izvede, pa deliš s številom ukazov, ki jih cpe izvrši. Iz tega lahko izračunaš IPC.
(Večkratna)množica ukazov iz enega programa v večini primerov ni enaka (večkratni)množici drugega programa. Takoj, ko imaš dve različni večkratni množici ukazov, pa boš težko dobil isti IPC, saj se vsi ukazi ne izvedejo v enem ciklu.
Če računaš IPC enega programa, ki uporablja veliko FP operacij, bog ne daj, da je veliko trigonometričnih operacij, boš dobil precej različen IPC kot, če računaš IPC enega programa, ki uporablja veliko celoštevilčnih operacij. Če v naslednji generaciji cpe pohitriš samo en del ukazov, npr trigonometrične operacije, boš dobil višji IPC samo pri prvem programu, pri drugem pa se ne bo spremenil kaj veliko.
Če še vse to prenesem na zen2 in 29 % višji IPC glede na zen, ki so ga izmerili. Vemo, da so marsikaj dodelali in pohitrili. Zen je imel podporo za AVX2 ukaze. Torej operacije nad vektorji dolžine 256 bitov. Ni pa imel strojne podpore za računanje nad vektorji dolžine 256 bitov, ampak samo 128 bitov. Te vrste operacij je zen razdelil na dve podoperaciji. Recimo, da sta trajali dve enoti časa. Zen 2 pa je dobil še strojno podporo za računanje vektorjev dolžine 256 bitov in sedaj ista operacija traja samo eno enoto. IPC se je povečal za 2x za te ukaze. Profitirali bodo programi, ki uporabljajo te ukaze. Ostali ne. Ker programi niso sestavljeni samo iz AVX2 ukazov bo skupna pohitritev manjša.
Sicer je zen 2 dobil še vrsto drugih izboljšav, tako, da bodo vsi programi deležni večje hitrosti izvajanja. Ne moremo pa pohitritve programov, ki masovno uporabljajo AVX2 ukaze in so zaradi tega tudi več profitirali, prenesti na programe, ki teh ukazov ne uporabljajo v taki meri. 29 % višji IPC v teh specefičnih programih se zelo verjetno ne bo odražalo v 29 % višjem IPC pri ostalih programih. Kakšno po povprečje narastka IPC - raje hitrosti v igrah in ostalih vsakdanjih programih bomo še videli.

Predator X ::

Ryzen 3000 IPC ( CB R15) - ZEN 2 core.
Kot smo že za ZEN jedro, ponovno :

CB R15 3GHz test

Da obnovimo spomin:

zen je dosegel 123p (odvisn mal tud o ram speeda do ~125p)

Koliko točk bo po vašem dosegel ryzen z zen 2 jedrom
Jaz pravim :
CB R15 : Ryzen 3000 (zen2) @ 3GHz 144p

ps:prosim uporabite bolt

D3m ::

Toj staro. :) Zih je CB dobil kako novo revizijo vmes.
|HP EliteBook|R5 6650U|

Predator X ::

D3m je izjavil:

Toj staro. :) Zih je CB dobil kako novo revizijo vmes.


? imaš novejši test?

D3m ::

Recimo.

|HP EliteBook|R5 6650U|

Zgodovina sprememb…

  • spremenil: D3m ()

Predator X ::

D3m je izjavil:

Recimo.



Ne se hecat... jst pravm o 3GHz, ti daš nek test ki je relativen glede na frekvenco in hitrost rama.
Če se govori se govori o ST pri 3GHz v CBR15.

Zen core ima 125p z hitrejšim ramom
Zen+ core ima ~127-128p

Kolk bo ime Zen 2 pri 3GHz!

Zgodovina sprememb…

D3m ::

Sem spregledal, da želiš 3GHz.

Verjetno med 144 in 150.
|HP EliteBook|R5 6650U|

Zgodovina sprememb…

  • spremenil: D3m ()

FlyingBee ::

Tam okoli 140.

Zgodovina sprememb…

D3m ::

Premalo. Po tvojih izračunih je potlej IPC samo 2%.
|HP EliteBook|R5 6650U|

Zgodovina sprememb…

  • spremenil: D3m ()

AapocalypseE ::

Kje pa se da najt ryzen 3.0GHz 123p?

Wrop ::

183p pri 4,4 GHz, kar nanese 125p pri 3 GHz.

Predator X ::

AapocalypseE je izjavil:

Kje pa se da najt ryzen 3.0GHz 123p?


Jst sm benchal pa je blo 125p. Nekatere strani oz. z počasnjšim ramom je prišel na 123p.

D3m je izjavil:

Sem spregledal, da želiš 3GHz.

Verjetno med 144 in 150.


Oh, ja... zelo podobni kot : koliko si vozil v naselju... ena cifra med 50 in 70km/h :|
Izberte eno določeno cifro in pol primerjamo.

Zgodovina sprememb…

Pebkac ::

FireSnake je izjavil:

Pebkac je izjavil:

IPC definitivno se spreminja glede na to kateri ukazi se izvajajo, v kakšnem vrstnem redu se izvajajo, pa še marsikaj drugega vpliva na to številko.


Jaz sem ostal še v času PICev (in v asemblerju). Kjer sem si lahko izračunal, kdaj se bo program izvedel ... se posipam s pepelom.


Verjamem, da se v kakih zelo preprostih arhitekturah da natančno predvidet, koliko časa se bo program izvajal. Če določen ukaz vedno vzame X ciklov in se ukazi izvajajo zaporedno en za drugim, je to simpl. Ampak high-end CPUji že desetletja niso več tako preprosti. Ker so frekvence omejene s fiziko, so pač pogruntali en kup trikov, ki omogočajo izvajanje več ukazov istočasno (kjer je to možno - odvisno od programa). Ko uvedeš superscalar arhitekturo, dodaš pipelining, branch prediction, out of order execution,... se zadeve zelo zakomplicirajo in je težje predvidet, koliko ukazov se bo v danem trenutku izvajalo paralelno, koliko časa bo določen ukaz čakal, da so vsi operandi na voljo, ipd. Nekateri pravijo, da je danes assembler high-level jezik v primerjavi s tistim, kar se dejansko dogaja v procesorju :D

Potem pa je tu še problem v tem, da RAM ni sinhroniziran s CPU jedrom in je (relativno) zelo počasen, zato so uvedli več nivojev predpomnilnika. Tako da je zakasnitev dostopa do pomnilnika zdaj odvisna od tega, kje točno se podatki nahajajo. Najhitreje je seveda, če delaš direktno z registri, počasneje če dostopaš do L1, nato L2 in L3, RAM pa najpočasnejši.

Rezultat vsega tega je, da lahko IPC direktno primerjaš samo, če poganjaš isti program z istimi vhodnimi podatki. Zato so tudi razni standardizirani testi, kot je npr. Cinebench postali kar popularni.

AapocalypseE ::

2700X + 2080 vs. 8700K + 1080 Ti

Ahim ::

FireSnake je izjavil:

Pebkac je izjavil:

IPC definitivno se spreminja glede na to kateri ukazi se izvajajo, v kakšnem vrstnem redu se izvajajo, pa še marsikaj drugega vpliva na to številko.


Jaz sem ostal še v času PICev (in v asemblerju). Kjer sem si lahko izračunal, kdaj se bo program izvedel ... se posipam s pepelom.

Tudi tam nisi mogel izraunati IPC na splosno, ker se niso vsi ukazi izvajali en cikel (nekateri so se izvajali dva cikla). Pri superskalarnih CISC procesorjih je problem samo se bistveno vecji.

FlyingBee ::

Da ni FireSnake FakeSnake. Vse bolj se dozdeva, da je najmanj FailSnake.

Zgodovina sprememb…

Jarno ::

Brezveze se ukvarjati z IPC-jem na tako rigorozen način.
Sam imam raje izraz "single core/thread performance", vendar razumem, če kdo prihaja na dan z IPC-jem, da se pogosto misli v tej smeri.
Testi bodo pokazali, kje so izboljšave v zmogljivosti in na podlagi tega se bo lahko marsikdo odločil za nakup.

Recimo sam predvidevam okoli 2500-2700 točk v single thread performance pri passmark testu (2600X jih nabere 2139).
https://www.cpubenchmark.net/singleThre...

Upamo lahko, da bo izkoristek pri proizvodnji dober in da bo 8c pod 350€.
Še eno dobro vprašanje je, če bo nov chipset.
#65W!

Wrop ::

Jarno je izjavil:


Upamo lahko, da bo izkoristek pri proizvodnji dober in da bo 8c pod 350€.


Jaz mislim, da bodo najcenejši 8C/16T pod 300 €. Rekel bi da med 250-270€. To bo poceni roba.
Se še spomnim kako so eni pred prvim izidom Ryzen pravili, da 8C/16T ne bo pod 500 €, nekaj takega. Prodajali so se pa za 320 $.

Predator X ::

Upam, da bo 2x 4C die+ uncore die z hitrejšim IF.

Truga ::


512 cores in 1U.

Predator X ::

Kr konkretna zadeva... amd že prodaja MILAN, lulz.

Jarno ::

Predator X je izjavil:

Upam, da bo 2x 4C die+ uncore die z hitrejšim IF.

1x8 je lahko bolje od 2x4. Glede na to, da 7nm ponuja 2xdensity, je izvedljiv.
#65W!

Predator X ::

Jarno je izjavil:

Predator X je izjavil:

Upam, da bo 2x 4C die+ uncore die z hitrejšim IF.

1x8 je lahko bolje od 2x4. Glede na to, da 7nm ponuja 2xdensity, je izvedljiv.


Odvisn... bolj je imet 2400MHz IF + 2CCXx4C (~50ns za ddr4) kot pa 1200MHz IF in 1CCXx8C.
Razn, če bodo spremenil arhitekturo za AM4.

Zgodovina sprememb…

tikitoki ::

AapocalypseE je izjavil:

2700X + 2080 vs. 8700K + 1080 Ti



WTF. Kaj mas od testa razlicnih GPUjev z razlicnimi CPUji?

AapocalypseE ::

Da tebe jezim 8-)

gendale2018 ::

Predator X je izjavil:

Jarno je izjavil:

Predator X je izjavil:

Upam, da bo 2x 4C die+ uncore die z hitrejšim IF.

1x8 je lahko bolje od 2x4. Glede na to, da 7nm ponuja 2xdensity, je izvedljiv.


Odvisn... bolj je imet 2400MHz IF + 2CCXx4C (~50ns za ddr4) kot pa 1200MHz IF in 1CCXx8C.
Razn, če bodo spremenil arhitekturo za AM4.

jaz bi 2x6c za 3700x in 2x8c za 3800x 8-)

poor man's threadripper
ja sam mali poštar, kurac mi je oštar
čuvajte se žene, bit ćete jebene

Zgodovina sprememb…

AapocalypseE ::

UPDATE!

AMD "Zen 2" IPC 29 Percent Higher than "Zen"

https://www.techpowerup.com/249450/amd-...

As we demonstrated at our Next Horizon event last week, our next-generation AMD EPYC server processor based on the new 'Zen 2' core delivers significant performance improvements as a result of both architectural advances and 7nm process technology. Some news media interpreted a 'Zen 2' comment in the press release footnotes to be a specific IPC uplift claim. The data in the footnote represented the performance improvement in a microbenchmark for a specific financial services workload which benefits from both integer and floating point performance improvements and is not intended to quantify the IPC increase a user should expect to see across a wide range of applications. We will provide additional details on 'Zen 2' IPC improvements, and more importantly how the combination of our next-generation architecture and advanced 7nm process technology deliver more performance per socket, when the products launch.

Treer ::

Ehehe, je že damage control tu! ;(( IPC bo verjetno največ 10% boljši in nekaj višje bodo najbrž frekvence; morda ujamejo po single threadu 7700k, morda še to ne :))

D3m ::

od kdaj pa TPU izdeluje procesorje.
|HP EliteBook|R5 6650U|

AapocalypseE ::

Kaj ma TPU veze z zgoraj napisanim?

Update Nov 14: AMD has issued the following statement regarding these claims

FlyingBee ::

Eh, 29% je itak za širšo množico nepomemben podatek.

AapocalypseE ::

Ja, saj so hitro odgovorili pri amdju, da je to specifično samo za ta program.

Realno 15% pa bi že bilo lepo.
««
266 / 611
»»