» »

AMD ZEN - nova X86 Jedra

AMD ZEN - nova X86 Jedra

Temo vidijo: vsi
««
13 / 622
»»

Brane22 ::

hojnikb je izjavil:

Seveda maš 11 procesov če je vsak tab v svojem. To še pa ne pomeni, da ko boš ti renderiral neko stran, da bo stvar efektivno izkoristila recimo 4 jedra.


Saj jih ne rabim. Koliko CPU moči pa rabiš za renderiranje htmla, ki recimo teče v nekem threadu ?

Takrat ozko grlo ni CPU power threada, prekopava po HTMLU in oblikuje svojo bazo primitiv, ampak vse ostalo- brskanej po cacheu, čakanje na FLASH, čakanje na podatke, da prikapljajo po linku itd itd.

hojnikb ::

>Saj jih ne rabim. Koliko CPU moči pa rabiš za renderiranje htmla, ki recimo teče v nekem threadu ?

Nastavi svojga amdja na 500Mhz and find out.


Isto opažam pri core2 duo in taistem baytrail-t čipu. Po passmark imata oba približno enak performance (mogoče malenkost manj za baytrail-t), a kjub temu je nalaganje in sam performance celga brskalnika opazno slabši na baytrail. Pa ne prihaja do nobenga throttlanja ali česa podobnega.

Disk in ram ni issue; ram je isto hiter (single ddr3 1333 proti dual ddr2 667), disk ni nikol na 100% (ssd).
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

Brane22 ::

hojnikb je izjavil:

Nastavi svojga amdja na 500Mhz and find out.


Not even close. To bi postavilo vse threade na 500MHz core in ne samo teh.

Kar pa spet ne nasprotuje temu, da bi ustrezen sw komot ustvaril pač več threadov na več coreih in tako dosegel iskani efekt.

Isotropic ::

bi, samo koliko bi jih lahko izkoristil, je pa druga.
threade lahko prestaviš na željeno jedro z affinity, konec koncev je pa itak vseeno, če pač cel cpu daš na 500mhz pa je.

Zgodovina sprememb…

Brane22 ::

Isotropic je izjavil:

bi, samo koliko bi jih lahko izkoristil, je pa druga.


Kaj točno naj bi imejevalo izkoristek ? Saj če imaš veliko procesov, to najbrž pomeni da si jih štarrtal z namenom izvajati relativno neodvisne taske, a ne.

Zakaj bi sicer odpiral nov proces ? In če imaš veliko procesov, zakaj točno bi se naj v njih več počasnejših coerov obneslo slabše od enega hitrega ?

SuperVeloce ::

Brane22 je izjavil:

hojnikb je izjavil:

Seveda maš 11 procesov če je vsak tab v svojem. To še pa ne pomeni, da ko boš ti renderiral neko stran, da bo stvar efektivno izkoristila recimo 4 jedra.


Saj jih ne rabim. Koliko CPU moči pa rabiš za renderiranje htmla, ki recimo teče v nekem threadu ?

Takrat ozko grlo ni CPU power threada, prekopava po HTMLU in oblikuje svojo bazo primitiv, ampak vse ostalo- brskanej po cacheu, čakanje na FLASH, čakanje na podatke, da prikapljajo po linku itd itd.

Kaj ti sanjaš html? Dejanski html je zelo zelo mali del obremenitve pri brskanju. Javascript in druščina te bo zmatrala...
ryzen 5900x, MSI 5700xt Gaming X, 2x16GB 3600CL16, 850evo+860qvo, Fractal Mini C

Brane22 ::

Za JS imaš zelo hitre engineje in ga lahko šibaš preko več threadov.

Kje je torej ta nerešljivi problem ?

IN BTW, JS je bolj interpreterski jezik , ki v osnovi ni mišljen za razbijanje atomov in težke numerične simulacije ampak bolj za lahko premetavanje podatkov predvsem v tekstualni obliki, preden jih požre renderer. Vsaka aplikacija, kjer JS požre znaten del CPU časa, je verjetno zgrešeno zastavljena.

m0LN4r ::

Ste tko off topic, da več z ničemer od ZEN nima veze. Rajši poglejmo, če so obvladajoči 3d stacking uporabili: http://wccftech.com/amd-next-generation...
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

fr4nc ::

hojnikb je izjavil:

yet z vsako generacijo vidimo pri mobilnih čipih bolsi single thread, core count nonsense se je pa ustavil pr 4.

kr poglej apple.


A nimajo flagshipi mobilnikov 6+ jeder (ponavadi 4 hitrejša jedra in 4 počasnejša)?
Quad-core 2 GHz Cortex-A53 & quad-core 1.5 GHz Cortex-A53
Quad-core 1.44 GHz Cortex-A53 & dual-core 1.82 GHz Cortex-A57
Quad-core 1.5 GHz Cortex-A53 & Quad-core 2 GHz Cortex-A57
Quad-core 1.5 GHz Cortex-A53 & Quad-core 2 GHz Cortex-A57
Quad-core 1.5 GHz Cortex-A53 & Quad-core 2.1 GHz Cortex-A57
itd.

Apple pa je tako ali tako 3 leta za vsemi kar se tiče hardwara...



Lp
"Rad pomagam, če je le možno" by Fr4nc; blog(2): http://cpuwars.wordpress.com/
"I just love to share the truth!!" by Fr4nc; http://intelvsamd.wordpress.com/

hojnikb ::

Brane22 je izjavil:

Za JS imaš zelo hitre engineje in ga lahko šibaš preko več threadov.

Kje je torej ta nerešljivi problem ?

IN BTW, JS je bolj interpreterski jezik , ki v osnovi ni mišljen za razbijanje atomov in težke numerične simulacije ampak bolj za lahko premetavanje podatkov predvsem v tekstualni obliki, preden jih požre renderer. Vsaka aplikacija, kjer JS požre znaten del CPU časa, je verjetno zgrešeno zastavljena.


Očitno je že težko rešljiv problem, če brskalnik na cpuju z boljšim single thread (recimo core2 duo) deluje boljše od kakega baytrail (quad core na nizki frekvenci).

fr4nc je izjavil:

hojnikb je izjavil:

yet z vsako generacijo vidimo pri mobilnih čipih bolsi single thread, core count nonsense se je pa ustavil pr 4.

kr poglej apple.


A nimajo flagshipi mobilnikov 6+ jeder (ponavadi 4 hitrejša jedra in 4 počasnejša)?
Quad-core 2 GHz Cortex-A53 & quad-core 1.5 GHz Cortex-A53
Quad-core 1.44 GHz Cortex-A53 & dual-core 1.82 GHz Cortex-A57
Quad-core 1.5 GHz Cortex-A53 & Quad-core 2 GHz Cortex-A57
Quad-core 1.5 GHz Cortex-A53 & Quad-core 2 GHz Cortex-A57
Quad-core 1.5 GHz Cortex-A53 & Quad-core 2.1 GHz Cortex-A57
itd.

Apple pa je tako ali tako 3 leta za vsemi kar se tiče hardwara...



Lp


To so pač hibridne zadeve, aktivnih jeder je afaik lahko samo 4. Razn če se je to kej spremenilo. Pa še ta big.little se bo skenclal z prihajajočim snappy-om.
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

filip007 ::

Novi Snapdragon 820 bo imel samo 4 jedra, Mediatek Helio x20 pa 10 jeder, po povejte zdaj kdo bo boljši hitrost proti poraba.
Prenosnik, konzola, TV, PC upokojen.

Jst ::

Intel ima vsaj 2 ekipi, ki delata vsak svoje. Eno v Izraelu, vsaj eno (če ne dve) pa v USA. In delajo tako na evoluciji arhitekture, kot from grounds up.

AMD ima pa eno ekipo razvijalcev; v bistvu je kar čudež, da so vsaj toliko konkurenčni, kot so. Ideja Bulldozerja je bila sicer dobra, ampak če se prav spomnim, ko je v enem modulu delala ena enota, so bile drugi idle. To je (bil) hud bottleneck. Upam, da so se toliko naučili, da bo Zen uravnotežena arhitektura, brez kakšnih velikih notranjih ozkih grl.
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|

filip007 ::

Se pravi, modul sta dva jedra in ena FPU enota, kar pomeni zamorjen sistem po domače. Še dobro, da so naredili zakompliciran CPU, ker drugače ne bi bili tako popularni kot so.
Prenosnik, konzola, TV, PC upokojen.

fr4nc ::

hojnikb je izjavil:

To so pač hibridne zadeve, aktivnih jeder je afaik lahko samo 4. Razn če se je to kej spremenilo. Pa še ta big.little se bo skenclal z prihajajočim snappy-om.


A tako...no to pa nisem vedel.
Potem se mi zdi to fail kar delajo (2x 4 jedra).
V čem je dejansko prednost tega (2x4 jedra) napram enemu čišu z 4 jedri (ki lahko prilagaja hitrost)?

Lp
"Rad pomagam, če je le možno" by Fr4nc; blog(2): http://cpuwars.wordpress.com/
"I just love to share the truth!!" by Fr4nc; http://intelvsamd.wordpress.com/

hojnikb ::

uizi taski na power efficient jedrih, heavy pa na performance jedrih.
#brezpodpisa

filip007 ::

Ja saj je logično, no more delati dva močna in dva šibka jedra istočasno.
Prenosnik, konzola, TV, PC upokojen.

fr4nc ::

hojnikb je izjavil:

uizi taski na power efficient jedrih, heavy pa na performance jedrih.


Ja to že ja. Ampak Intel ima isti čip za vse taske...če veš kaj mislim?
Pač čip deluje pri manjši napetosti in nižjem množilniku - kolikor vem moj telefon tudi zmore...zato ne razumem 4+4 jedra...

Lp
"Rad pomagam, če je le možno" by Fr4nc; blog(2): http://cpuwars.wordpress.com/
"I just love to share the truth!!" by Fr4nc; http://intelvsamd.wordpress.com/

Jst ::

>Se pravi, modul sta dva jedra in ena FPU enota,

Splitting hairs now; modul so tri jedra, dva računata int, eden float.
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|

hojnikb ::

fr4nc je izjavil:

hojnikb je izjavil:

uizi taski na power efficient jedrih, heavy pa na performance jedrih.


Ja to že ja. Ampak Intel ima isti čip za vse taske...če veš kaj mislim?
Pač čip deluje pri manjši napetosti in nižjem množilniku - kolikor vem moj telefon tudi zmore...zato ne razumem 4+4 jedra...

Lp


a53 jedro na 1ghz bo bolj power efficient kot recimo a57 na 0.7ghz ( delajmo se da sta pri teh frekvecah enako zmogljiva )
#brezpodpisa

Jarno ::

Jst je izjavil:

>Se pravi, modul sta dva jedra in ena FPU enota,

Splitting hairs now; modul so tri jedra, dva računata int, eden float.


Mislim, da so tukaj pri AMD-ju zavajali in so dejansko podvajali (skromne) float resourse za vsako int jedro.
Posredni dokaz je skoraj identičen performance na FX4x00 in FX8x00, ko je igra podpirala 4 jedra.
i7 se je npr. odrezal dosti bolje kot i3, gre pa za za dve polni jedri proti štirim.

Jst ::

>Mislim, da so tukaj pri AMD-ju zavajali in so dejansko podvajali (skromne) float resourse za vsako int jedro.

Niso. Samo problem je bil, vsaj v prvi iteraciji, da če je bila ena INT enatoa zasedena, je druga idlala. Bilo je pa možno imeti 2 modula in v vsakem poganjati en thread, ki je laufal na INT jedru. Prave paralelizacije znotraj samega jedra pa ni bilo. To je bil tako velik kiks, da prvo nisem verjel rezultatom, ki sem jih dobival. Potem se je sicer malo izkrastiziralo, in sem bil šokiran, kako so lahko sploh tole furali v bulldozerju (1. gen, za naslednje ne vem; vem pa, da je bil cache ekskluziven in tudi v naslednjih generacijah, cache prediktor ni oddigral svoje vloge, katero bi človek mislil, da bo).
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|

Brane22 ::

AMD je zavajal smao pri uvodnem marketingu. Nenehno so govorili, kako jih modul stane samo malo več kot konvencionalno jedro in kako bo osem takih v novih octacoreih.

Takrat je stvar zgledala res vabljivo. Nato pa so pokazali čipe z do 4 moduli, ker so oni pač polovičke modula šteli kot jedro.

Kar se FPU tiče, je deljen ampak je tudi IIRC iz dveh polovičk in lahko fura bodisi 2 128-bitna opa ali en 256-bitni op na vsak cikel, kakorkoli se že to deli potem med corei.

Mali zajeb je bil v tem, da so corei z deljenim L2 metali ven cachelineje iz L2 svojemu paru.+, če je bil sw pisan tako, da določenih stvari ni vzel v ozir ( kar je bilo dostikrat slučaj).

Sice pa se mi zdi vpliv SSE dostikrat precenjen in sama zasnova sploh ne tako napačna.

Zajeb je bil mogoče v ogromni latenci L3, čeprav naj bi bilo to pri Bulldozerju mnogo blažje kot pri Phenomu.

filip007 ::

Mini jedra z visokimi lantencami potem, saj več niso morali stlačiti v 32nm. No Zen ima dosti placa potem, če bo 16nm ali celo 14nm.
Prenosnik, konzola, TV, PC upokojen.

Brane22 ::

Saj to je point. Rafinirali so dosedanji pristop, ga adaptirali novim priložnostim, zahtevam in možnostim procesov ter ga natempirali na prihajajoči 14nm node.

Ko bo ta prišel, bi naj vse skupaj kliknilo. Zen bo prinesel IPC, izvedba in process pa šparovnost in peak performance, novi GPU shaderji se bodo lahko lotili marsičesa, povezovalna logika pa bo programju omogočila efektivni izkoristek vsega.

BTW, je kdo poštekal eno od zanimivih pridobitev Carriza ? Saj HSA pomeni enotni dostop k pomnilniku že prej, ampak s prejšnjo generacijo je to šlo skozi dve vodili ( "Garlic" in "Onion"), vsako s svojim kompromisom. Sedaj je vodilo poenoteno in dostop z vseh strani poteka brez teh pomislekov. Not a small feat, ni pa ravno v vsaki novici. Nisem pa našel, če to velja tudi za Godavari.

hojnikb ::

>Godavari

Godaveri je samo clock bump Kaverija.


Sicer pa ja, Carrizo zgleda zanimiv za laptope, sam kaj ko je izbira laptopov ena velika žalost.
#brezpodpisa

Isotropic ::

Brane22 je izjavil:

AMD je zavajal smao pri uvodnem marketingu. Nenehno so govorili, kako jih modul stane samo malo več kot konvencionalno jedro in kako bo osem takih v novih octacoreih.

Takrat je stvar zgledala res vabljivo. Nato pa so pokazali čipe z do 4 moduli, ker so oni pač polovičke modula šteli kot jedro.

Kar se FPU tiče, je deljen ampak je tudi IIRC iz dveh polovičk in lahko fura bodisi 2 128-bitna opa ali en 256-bitni op na vsak cikel, kakorkoli se že to deli potem med corei.

Mali zajeb je bil v tem, da so corei z deljenim L2 metali ven cachelineje iz L2 svojemu paru.+, če je bil sw pisan tako, da določenih stvari ni vzel v ozir ( kar je bilo dostikrat slučaj).

Sice pa se mi zdi vpliv SSE dostikrat precenjen in sama zasnova sploh ne tako napačna.

Zajeb je bil mogoče v ogromni latenci L3, čeprav naj bi bilo to pri Bulldozerju mnogo blažje kot pri Phenomu.

sam koncept je bil dober, izvedba pa slaba, zelo slaba.
http://www.anandtech.com/show/5057/the-...

zraven jih je zajebal še GF, ki so počakali z 32nm node za ~2 leti, da postanejo malo dobičkonosni :D
kljub temu, da je bil v board of directors GFja nekdanji direktor amdja (dejansko ta, ki je odcepil fabrko, mislim pa da tudi zdruzil amd+ati).

je pa res, da bi amd danes brez grafike še bolj tenko piskal.
k so grafike najbolj dobičkonosne v celi firmi.

Zgodovina sprememb…

Brane22 ::

iz linka:

The Real Shortcomings: Branch Misprediction Penalty and Instruction Cache Hit Rate"
L1 instruction cache does not seem to cope well with 2-threads.


Both quite solveable on Linux.

Zato pravim da BD ni napačen. Folku Win igre štekajo, kar mu je zbilo ceno. Linux crowd pa tako lahko dobi zanimiv recimo mu 8-jedrnik na visoki frekvenci praktično zastonj.

Dr_M ::

Potem je ta cpu zanimiv za najvec 1.5% folka. Premalo, da bi AMD prezivel.
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

Brane22 ::

KO grem v štacuno, me ne zanima AMDjevo preživetje ampak poceni stuff.

Slednje pa je pomembno na srednji in dolgi rok, za kar bo poskrbel Zen na eni strani in Qualcom etc na drugi.

Ampak tudi če Zena ne bi bilo, Excavator sploh ne bi bil slab na 14 nm, sploh sedaj ko je vse več stuffa ki gre na namenski HW in/ali GPU.

Poglej napredek na 32nm in kaj so sploh uspeli spraviti ven iz tega, nato pa poglej kaj bi to naneslo na poštenem 14nm procesu.

Ja, ST ni šel kaj prida gor, ampak Exc je rojen za veliko število jeder, sedaj pa ko bo GPU onboard ob HSA, SSE niti ni tako ključen, pravzaprav postaja odveč.

Sedaj bi na 14nm tudi Excavator komot sekal.

m0LN4r ::

Nekateri še vedno furajo Quade iz 2007/8 na desktopu.
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

filip007 ::

Intel že izdeluje s 14nm, najcenejši FX je okoli 80€, najcenejša plošča 60€, samo kupuješ že par let staro robo.
Prenosnik, konzola, TV, PC upokojen.

m0LN4r ::

Ful je recimo zanimiva primerjava med Q6600(105w) in nov Skylake i3-6100(47w) oz. 6100T(37w)

Razlika je slabih 9 let in nov i3 porabi 2-3x manj za večji performance z dvemi jedri+HT,
ter povrh tega ima zelo močan in napreden iGPU HD 530, ter napredne varčevalne funkcije.

Zanimivo je tudi, da ima i7-6700T ravnotako 35W in HD 530, pa je teoretično 2x i3 2c/4t
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

Zgodovina sprememb…

  • spremenil: m0LN4r ()

pegasus ::

Dr_M je izjavil:

Potem je ta cpu zanimiv za najvec 1.5% folka.
Dvomim. Poglej si to, boš mogoče bolje razumel zakaj.

Dr_M ::

Ce niti ti nisi ziher, a se naj sploh trudim odpret link?

KO grem v štacuno, me ne zanima AMDjevo preživetje ampak poceni stuff.


Ce AMD ne prezivi, bos se vedno lahko kupil poceni robo? Bodo procesorji nastajali s spontanim samovzigom?
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

Zgodovina sprememb…

  • spremenil: Dr_M ()

gddr85 ::

kaj pa bo, samo intel?

hojnikb ::

sj arm napada ;)
#brezpodpisa

gddr85 ::

...bogi intel ;)

SuperVeloce ::

Res so bogi :)), malo jih sicer fizika praska, ampak mislim da še niso rekli zadnje in bo vsaj nekaj prednosti vedno ostalo
ryzen 5900x, MSI 5700xt Gaming X, 2x16GB 3600CL16, 850evo+860qvo, Fractal Mini C

m0LN4r ::

AMD mimogrede spet odšušča 5%
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

D3m ::

m0LN4r je izjavil:

AMD mimogrede spet odšušča 5%


Več bo outsource.
|HP EliteBook|R5 6650U|

Brane22 ::

Kot sem razumel, se bo outsource nanašal na spremne zadeve ( extra čipovje ipd) in še to verjetno v prvi fazi, dokler ne pride denar.

Qushaak ::

m0LN4r je izjavil:

Ful je recimo zanimiva primerjava med Q6600(105w) in nov Skylake i3-6100(47w) oz. 6100T(37w)

Razlika je slabih 9 let in nov i3 porabi 2-3x manj za večji performance z dvemi jedri+HT,
ter povrh tega ima zelo močan in napreden iGPU HD 530, ter napredne varčevalne funkcije.

Zanimivo je tudi, da ima i7-6700T ravnotako 35W in HD 530, pa je teoretično 2x i3 2c/4t

iGPU predstavlja kar velik delež TDP-ja (gledla emm informacije v HWiNFO) - v grobem 25-30% sigurno. Tako da je prej razlike v "CPU delu" 3.5-4.5x.
Ni niti približno tako hiter napredek kot včasih, samo še vedno dovolj. Za dosti programov, ki so eno-nitni(Procesorski) pa učinkovitost precej pada. Pri 4 jedrih je izkoriščenost samo 25%, pri 6 jedrih pa 17%. Tukaj ima precej programske opreme (ne pa vsa) še ogromno rezerve, če se da kaj paralelno napisat.

Brane22 ::

Brane22 ::

x45 ::

AMD x4 965 BE, 8 gb ddr3 1600, SSD Samsung, 960 GT
Xeon x3430, 8 GB DDR3, Matrox grafa

x45 ::

Edit:

Vidim 4 alu in 4 fpu in še dva ( skupaj 10 ) - slika
AMD x4 965 BE, 8 gb ddr3 1600, SSD Samsung, 960 GT
Xeon x3430, 8 GB DDR3, Matrox grafa

opeter ::

fr4nc je izjavil:

Apple pa je tako ali tako 3 leta za vsemi kar se tiče hardwara...


Hmm ... marsikdo se s tem ne bi strinjal. Glej:
RN: Specifikacije pomenijo malo

Citat:
To pomeni, da Samsungov Note 5 pametni telefon na platformi Android OS kljub osem-jedrnim procesorjem in 4GB RAM dosega nižjo zmogljivost kot iPhone 6S z dvo-jedrnim procesorjem in 2GB RAM.

Hrabri mišek (od 2015 nova serija!) -> http://tinyurl.com/na7r54l
18. november 2011 - Umrl je Mark Hall, "oče" Hrabrega miška
RTVSLO: http://tinyurl.com/74r9n7j

klinker ::

opeter je izjavil:

fr4nc je izjavil:

Apple pa je tako ali tako 3 leta za vsemi kar se tiče hardwara...


Hmm ... marsikdo se s tem ne bi strinjal. Glej:
RN: Specifikacije pomenijo malo

Citat:
To pomeni, da Samsungov Note 5 pametni telefon na platformi Android OS kljub osem-jedrnim procesorjem in 4GB RAM dosega nižjo zmogljivost kot iPhone 6S z dvo-jedrnim procesorjem in 2GB RAM.



Raje ne odgovarjaj na take troll poste ker ves kaj se pol razvije, sploh ko je Apple v debati.
To se da na ignore, pa naj taki naprej drkajo na stevilke :)

Jarno ::

x45 je izjavil:

Edit:
Vidim 4 alu in 4 fpu in še dva ( skupaj 10 ) - slika


Morda se motim, ampak napredek napram bulldozer arhitekturi bi naj predstavljala 2 dodatna alu pipelina in seveda precej širši fpu (prej 128+128bit, sedaj 2x toliko).
Če upoštevamo še nov koncept jedra.
 Bulldozer

Bulldozer

Zgodovina sprememb…

  • spremenil: Jarno ()

hojnikb ::

Bomo vidl, kak se bo to v praksi obnesl...

Držim pesti, da bo zadeva killer jedro, da se intel malo zbudi.
#brezpodpisa
««
13 / 622
»»