Forum » Strojna oprema » AMD ZEN - nova X86 Jedra
AMD ZEN - nova X86 Jedra
Temo vidijo: vsi
mahone ::
Predator X je izjavil:
Za tiste, ki pravite, da R5 2600/X nista dovolj za 144Hz - 720p benchmark ULTRA
Zelo podobna zadeva :
Če uspete 4,2GHz ter 3600MHz DDR4 CL15 bo še hitrejši kot je tale R7 2700X...
Glede na BF5 bi rekel, da so kr začel uporabljat threade bolj optimistično .. BF1 samo 35-40% pri 16T.
Z FX 8370/gtx1080 mas 90fps on average @ 1080p
Battlefield igre so optimizirane za AMD hardware - sponzor
Zgodovina sprememb…
- spremenil: mahone ()
Predator X ::
FireSnake ::
Ja, 29 % v določenem programu. Če bo v splošnem polovica tega, bo zmaga.
IPC je instructions per clock.
In tu se ne gre za specifičen program.
Številka je zelo visoka.
Poglej in se nasmej: vicmaher.si
Predator X ::
Ha ha ha, bolj je mislil na dolocene instrukcije ki jih uporablja program. Ce gledamo avx512 (fpu) je intel dalec spredaj
FireSnake ::
To pa ni to.
IPC je število inštrikcij na cikel.
Če en program rabi 100 inštrukcij, da se izvede se:
- pri IPCju 1 izvede v 100 ciklih,
- IPCju 1.29 izvede v 77,5 ciklih
In to nima nobene veze s tem, kakšne vrste workload (spet nimam slovenske besede na jeziku) je.
Številke so zgolj simbolične - za lažjo razlago.
IPC je število inštrikcij na cikel.
Če en program rabi 100 inštrukcij, da se izvede se:
- pri IPCju 1 izvede v 100 ciklih,
- IPCju 1.29 izvede v 77,5 ciklih
In to nima nobene veze s tem, kakšne vrste workload (spet nimam slovenske besede na jeziku) je.
Številke so zgolj simbolične - za lažjo razlago.
Poglej in se nasmej: vicmaher.si
Zgodovina sprememb…
- spremenilo: FireSnake ()
Wrop ::
IPC definicija in številke ti sicer štimajo, zaključek pa niti ne.
IPC je vsekakor odvisen od (vrste) dela - množice ukazov, ki ga dobi procesor. Če boš poganjal igre bo imel procesor drugačen IPC, kot če boš brskal po spletu.
IPC je vsekakor odvisen od (vrste) dela - množice ukazov, ki ga dobi procesor. Če boš poganjal igre bo imel procesor drugačen IPC, kot če boš brskal po spletu.
Predator X ::
Jarno ::
In to nima nobene veze s tem, kakšne vrste workload (spet nimam slovenske besede na jeziku) je.
Gre predvsem za to, da novi ryzen ni slabši od starega v nobenem "workloadu", ampak ga prekaša v "multiple dimensions". Tu dam prav.
Že z nižjimi latencami, izboljšanim "fpu-jem" in predpomnilnikom bo veselica.
Edina težava, ki jo vidim, je pomnilniška podhranjenost pri morebitni 16c/32t AM4 konfiguraciji. Morda pa bo 16c/16t.
#65W!
FireSnake ::
IPC definicija in številke ti sicer štimajo, zaključek pa niti ne.
IPC je vsekakor odvisen od (vrste) dela - množice ukazov, ki ga dobi procesor. Če boš poganjal igre bo imel procesor drugačen IPC, kot če boš brskal po spletu.
A res?
IPC se, po tvoje, spreminja.
Daj tole prevedi malo bolj na strojni nivo.
Sama ušesa so me.
Poglej in se nasmej: vicmaher.si
Zgodovina sprememb…
- spremenilo: FireSnake ()
Pebkac ::
FireSnake, ti nimaš pojma. IPC definitivno se spreminja glede na to kateri ukazi se izvajajo, v kakšnem vrstnem redu se izvajajo, pa še marsikaj drugega vpliva na to številko. Največ časa procesor zgubi takrat ko čaka na pomnilnik in zgubi tudi po 100+ ciklov brez da bi dokončal 1 inštrukcijo
louser ::
AapocalypseE je izjavil:
AapocalypseE je izjavil:
RTX 2080 and 2080Ti on Ryzen... will it bottleneck??
Nisem gledal, ampak zihr bottlenecka grafa.
Rdeči bodo raje izpustili ta video
Nisem rdeči, a v igrah še vedno nimamo spodobnih graf.
Predator X ::
IPC definicija in številke ti sicer štimajo, zaključek pa niti ne.
IPC je vsekakor odvisen od (vrste) dela - množice ukazov, ki ga dobi procesor. Če boš poganjal igre bo imel procesor drugačen IPC, kot če boš brskal po spletu.
A res?
IPC se, po tvoje, spreminja.
Daj tole prevedi malo bolj na strojni nivo.
Sama ušesa so me.
Počak zdej, mi iščemo IPC v praksi ti nabijaš po svoje. Če se gremo po specsih ti že sama dokumentacija pove, da je IPC relativen glede na operacijo, ki jo izvaja procesor.
V osnovi lahko ryzen naredi 5 inštrukcij ( celo 6, ampak pod pogojem) per clock intel pa 4 in še to mora coda laufat direktno iz micro-cacha.
Pusti ti te tvoje razlage in bodimo bolj praktični. V praksi se avg. IPC izmeri tako, da se laufa več različnih aplikacij pri določenem clocku. In že takoj, če primerjamo FPU pri 512/256bit bo intel spredaj in to kar za ~2x, če bo uporabljal 512bit.
FireSnake ::
IPC definitivno se spreminja glede na to kateri ukazi se izvajajo, v kakšnem vrstnem redu se izvajajo, pa še marsikaj drugega vpliva na to številko.
Jaz sem ostal še v času PICev (in v asemblerju). Kjer sem si lahko izračunal, kdaj se bo program izvedel ... se posipam s pepelom.
Poglej in se nasmej: vicmaher.si
Zgodovina sprememb…
- spremenilo: FireSnake ()
Wrop ::
IPC definicija in številke ti sicer štimajo, zaključek pa niti ne.
IPC je vsekakor odvisen od (vrste) dela - množice ukazov, ki ga dobi procesor. Če boš poganjal igre bo imel procesor drugačen IPC, kot če boš brskal po spletu.
A res?
IPC se, po tvoje, spreminja.
Daj tole prevedi malo bolj na strojni nivo.
Sama ušesa so me.
Imaš program, ki je sestavljen iz določene (večkratne)množice ukazov. Število ciklov, ki jih program potrebuje, da se izvede, pa deliš s številom ukazov, ki jih cpe izvrši. Iz tega lahko izračunaš IPC.
(Večkratna)množica ukazov iz enega programa v večini primerov ni enaka (večkratni)množici drugega programa. Takoj, ko imaš dve različni večkratni množici ukazov, pa boš težko dobil isti IPC, saj se vsi ukazi ne izvedejo v enem ciklu.
Če računaš IPC enega programa, ki uporablja veliko FP operacij, bog ne daj, da je veliko trigonometričnih operacij, boš dobil precej različen IPC kot, če računaš IPC enega programa, ki uporablja veliko celoštevilčnih operacij. Če v naslednji generaciji cpe pohitriš samo en del ukazov, npr trigonometrične operacije, boš dobil višji IPC samo pri prvem programu, pri drugem pa se ne bo spremenil kaj veliko.
Če še vse to prenesem na zen2 in 29 % višji IPC glede na zen, ki so ga izmerili. Vemo, da so marsikaj dodelali in pohitrili. Zen je imel podporo za AVX2 ukaze. Torej operacije nad vektorji dolžine 256 bitov. Ni pa imel strojne podpore za računanje nad vektorji dolžine 256 bitov, ampak samo 128 bitov. Te vrste operacij je zen razdelil na dve podoperaciji. Recimo, da sta trajali dve enoti časa. Zen 2 pa je dobil še strojno podporo za računanje vektorjev dolžine 256 bitov in sedaj ista operacija traja samo eno enoto. IPC se je povečal za 2x za te ukaze. Profitirali bodo programi, ki uporabljajo te ukaze. Ostali ne. Ker programi niso sestavljeni samo iz AVX2 ukazov bo skupna pohitritev manjša.
Sicer je zen 2 dobil še vrsto drugih izboljšav, tako, da bodo vsi programi deležni večje hitrosti izvajanja. Ne moremo pa pohitritve programov, ki masovno uporabljajo AVX2 ukaze in so zaradi tega tudi več profitirali, prenesti na programe, ki teh ukazov ne uporabljajo v taki meri. 29 % višji IPC v teh specefičnih programih se zelo verjetno ne bo odražalo v 29 % višjem IPC pri ostalih programih. Kakšno po povprečje narastka IPC - raje hitrosti v igrah in ostalih vsakdanjih programih bomo še videli.
Predator X ::
Predator X ::
Predator X ::
Recimo.
Ne se hecat... jst pravm o 3GHz, ti daš nek test ki je relativen glede na frekvenco in hitrost rama.
Če se govori se govori o ST pri 3GHz v CBR15.
Zen core ima 125p z hitrejšim ramom
Zen+ core ima ~127-128p
Kolk bo ime Zen 2 pri 3GHz!
Zgodovina sprememb…
- spremenilo: Predator X ()
D3m ::
Sem spregledal, da želiš 3GHz.
Verjetno med 144 in 150.
Verjetno med 144 in 150.
|HP EliteBook|R5 6650U|
Zgodovina sprememb…
- spremenil: D3m ()
D3m ::
Premalo. Po tvojih izračunih je potlej IPC samo 2%.
|HP EliteBook|R5 6650U|
Zgodovina sprememb…
- spremenil: D3m ()
Predator X ::
AapocalypseE je izjavil:
Kje pa se da najt ryzen 3.0GHz 123p?
Jst sm benchal pa je blo 125p. Nekatere strani oz. z počasnjšim ramom je prišel na 123p.
Sem spregledal, da želiš 3GHz.
Verjetno med 144 in 150.
Oh, ja... zelo podobni kot : koliko si vozil v naselju... ena cifra med 50 in 70km/h
Izberte eno določeno cifro in pol primerjamo.
Zgodovina sprememb…
- spremenilo: Predator X ()
Pebkac ::
IPC definitivno se spreminja glede na to kateri ukazi se izvajajo, v kakšnem vrstnem redu se izvajajo, pa še marsikaj drugega vpliva na to številko.
Jaz sem ostal še v času PICev (in v asemblerju). Kjer sem si lahko izračunal, kdaj se bo program izvedel ... se posipam s pepelom.
Verjamem, da se v kakih zelo preprostih arhitekturah da natančno predvidet, koliko časa se bo program izvajal. Če določen ukaz vedno vzame X ciklov in se ukazi izvajajo zaporedno en za drugim, je to simpl. Ampak high-end CPUji že desetletja niso več tako preprosti. Ker so frekvence omejene s fiziko, so pač pogruntali en kup trikov, ki omogočajo izvajanje več ukazov istočasno (kjer je to možno - odvisno od programa). Ko uvedeš superscalar arhitekturo, dodaš pipelining, branch prediction, out of order execution,... se zadeve zelo zakomplicirajo in je težje predvidet, koliko ukazov se bo v danem trenutku izvajalo paralelno, koliko časa bo določen ukaz čakal, da so vsi operandi na voljo, ipd. Nekateri pravijo, da je danes assembler high-level jezik v primerjavi s tistim, kar se dejansko dogaja v procesorju
Potem pa je tu še problem v tem, da RAM ni sinhroniziran s CPU jedrom in je (relativno) zelo počasen, zato so uvedli več nivojev predpomnilnika. Tako da je zakasnitev dostopa do pomnilnika zdaj odvisna od tega, kje točno se podatki nahajajo. Najhitreje je seveda, če delaš direktno z registri, počasneje če dostopaš do L1, nato L2 in L3, RAM pa najpočasnejši.
Rezultat vsega tega je, da lahko IPC direktno primerjaš samo, če poganjaš isti program z istimi vhodnimi podatki. Zato so tudi razni standardizirani testi, kot je npr. Cinebench postali kar popularni.
Ahim ::
IPC definitivno se spreminja glede na to kateri ukazi se izvajajo, v kakšnem vrstnem redu se izvajajo, pa še marsikaj drugega vpliva na to številko.
Jaz sem ostal še v času PICev (in v asemblerju). Kjer sem si lahko izračunal, kdaj se bo program izvedel ... se posipam s pepelom.
Tudi tam nisi mogel izraunati IPC na splosno, ker se niso vsi ukazi izvajali en cikel (nekateri so se izvajali dva cikla). Pri superskalarnih CISC procesorjih je problem samo se bistveno vecji.
FlyingBee ::
Da ni FireSnake FakeSnake. Vse bolj se dozdeva, da je najmanj FailSnake.
Zgodovina sprememb…
- spremenil: FlyingBee ()
Jarno ::
Brezveze se ukvarjati z IPC-jem na tako rigorozen način.
Sam imam raje izraz "single core/thread performance", vendar razumem, če kdo prihaja na dan z IPC-jem, da se pogosto misli v tej smeri.
Testi bodo pokazali, kje so izboljšave v zmogljivosti in na podlagi tega se bo lahko marsikdo odločil za nakup.
Recimo sam predvidevam okoli 2500-2700 točk v single thread performance pri passmark testu (2600X jih nabere 2139).
https://www.cpubenchmark.net/singleThre...
Upamo lahko, da bo izkoristek pri proizvodnji dober in da bo 8c pod 350€.
Še eno dobro vprašanje je, če bo nov chipset.
Sam imam raje izraz "single core/thread performance", vendar razumem, če kdo prihaja na dan z IPC-jem, da se pogosto misli v tej smeri.
Testi bodo pokazali, kje so izboljšave v zmogljivosti in na podlagi tega se bo lahko marsikdo odločil za nakup.
Recimo sam predvidevam okoli 2500-2700 točk v single thread performance pri passmark testu (2600X jih nabere 2139).
https://www.cpubenchmark.net/singleThre...
Upamo lahko, da bo izkoristek pri proizvodnji dober in da bo 8c pod 350€.
Še eno dobro vprašanje je, če bo nov chipset.
#65W!
Wrop ::
Upamo lahko, da bo izkoristek pri proizvodnji dober in da bo 8c pod 350€.
Jaz mislim, da bodo najcenejši 8C/16T pod 300 €. Rekel bi da med 250-270€. To bo poceni roba.
Se še spomnim kako so eni pred prvim izidom Ryzen pravili, da 8C/16T ne bo pod 500 €, nekaj takega. Prodajali so se pa za 320 $.
Jarno ::
Predator X je izjavil:
Upam, da bo 2x 4C die+ uncore die z hitrejšim IF.
1x8 je lahko bolje od 2x4. Glede na to, da 7nm ponuja 2xdensity, je izvedljiv.
#65W!
Predator X ::
Predator X je izjavil:
Upam, da bo 2x 4C die+ uncore die z hitrejšim IF.
1x8 je lahko bolje od 2x4. Glede na to, da 7nm ponuja 2xdensity, je izvedljiv.
Odvisn... bolj je imet 2400MHz IF + 2CCXx4C (~50ns za ddr4) kot pa 1200MHz IF in 1CCXx8C.
Razn, če bodo spremenil arhitekturo za AM4.
Zgodovina sprememb…
- spremenilo: Predator X ()
tikitoki ::
AapocalypseE je izjavil:
2700X + 2080 vs. 8700K + 1080 Ti
WTF. Kaj mas od testa razlicnih GPUjev z razlicnimi CPUji?
gendale2018 ::
Predator X je izjavil:
Predator X je izjavil:
Upam, da bo 2x 4C die+ uncore die z hitrejšim IF.
1x8 je lahko bolje od 2x4. Glede na to, da 7nm ponuja 2xdensity, je izvedljiv.
Odvisn... bolj je imet 2400MHz IF + 2CCXx4C (~50ns za ddr4) kot pa 1200MHz IF in 1CCXx8C.
Razn, če bodo spremenil arhitekturo za AM4.
jaz bi 2x6c za 3700x in 2x8c za 3800x
poor man's threadripper
ja sam mali poštar, kurac mi je oštar
čuvajte se žene, bit ćete jebene
čuvajte se žene, bit ćete jebene
Zgodovina sprememb…
- spremenilo: gendale2018 ()
AapocalypseE ::
UPDATE!
AMD "Zen 2" IPC 29 Percent Higher than "Zen"
https://www.techpowerup.com/249450/amd-...
As we demonstrated at our Next Horizon event last week, our next-generation AMD EPYC server processor based on the new 'Zen 2' core delivers significant performance improvements as a result of both architectural advances and 7nm process technology. Some news media interpreted a 'Zen 2' comment in the press release footnotes to be a specific IPC uplift claim. The data in the footnote represented the performance improvement in a microbenchmark for a specific financial services workload which benefits from both integer and floating point performance improvements and is not intended to quantify the IPC increase a user should expect to see across a wide range of applications. We will provide additional details on 'Zen 2' IPC improvements, and more importantly how the combination of our next-generation architecture and advanced 7nm process technology deliver more performance per socket, when the products launch.
AMD "Zen 2" IPC 29 Percent Higher than "Zen"
https://www.techpowerup.com/249450/amd-...
As we demonstrated at our Next Horizon event last week, our next-generation AMD EPYC server processor based on the new 'Zen 2' core delivers significant performance improvements as a result of both architectural advances and 7nm process technology. Some news media interpreted a 'Zen 2' comment in the press release footnotes to be a specific IPC uplift claim. The data in the footnote represented the performance improvement in a microbenchmark for a specific financial services workload which benefits from both integer and floating point performance improvements and is not intended to quantify the IPC increase a user should expect to see across a wide range of applications. We will provide additional details on 'Zen 2' IPC improvements, and more importantly how the combination of our next-generation architecture and advanced 7nm process technology deliver more performance per socket, when the products launch.
Treer ::
Ehehe, je že damage control tu! IPC bo verjetno največ 10% boljši in nekaj višje bodo najbrž frekvence; morda ujamejo po single threadu 7700k, morda še to ne
AapocalypseE ::
Kaj ma TPU veze z zgoraj napisanim?
Update Nov 14: AMD has issued the following statement regarding these claims
Update Nov 14: AMD has issued the following statement regarding these claims
AapocalypseE ::
Ja, saj so hitro odgovorili pri amdju, da je to specifično samo za ta program.
Realno 15% pa bi že bilo lepo.
Realno 15% pa bi že bilo lepo.