» »

AMD ZEN - nova X86 Jedra

AMD ZEN - nova X86 Jedra

Temo vidijo: vsi
««
59 / 611
»»

hojnikb ::

kaj ti nucajo dodatni shaderji, če jih nemorš nahranit.
#brezpodpisa

Predator X ::

Sej polaris je bolj memory ucinkovit

hojnikb ::

sam ne x2 bolj
#brezpodpisa

D3m ::

hojnikb je izjavil:

kaj ti nucajo dodatni shaderji, če jih nemorš nahranit.


Torej bo podpiral DDR3 1866. >:D

Ne nakladaj.
|HP EliteBook|R5 6650U|

Zgodovina sprememb…

Brane22 ::

Kdaj pride HBM2 ? A to še ne bo v tem Raven-something ?

hojnikb ::

D3m je izjavil:

hojnikb je izjavil:

kaj ti nucajo dodatni shaderji, če jih nemorš nahranit.


Torej bo podpiral DDR3 1866. >:D

Ne nakladaj.

tudi z ddr4-4000 bo takšen gpu lačen bandwidth-a

malo za občutek; gpu v macu, ki ima enak shader konfig kot tale zen apu
https://www.techpowerup.com/gpudb/2898/...

ma 80GB/s bandwidth-a. DDR4-4000 ima 64GB/s. Torej če hočeš, da takšen gpu nebo lačen bandwidth-a, rabiš vsaj dual channel ddr4-5000, da bo sit. In to na 850Mhz, kaj šele če bodo višji clocki (kar sigurno bodo)
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

gddr85 ::

bojo gor napopal hbm...much, much bandwidth

hojnikb ::

na poceni apujih ne
#brezpodpisa

D3m ::

Na poceni ne. Dragi modeli ja.

hojnikb je izjavil:

D3m je izjavil:

hojnikb je izjavil:

kaj ti nucajo dodatni shaderji, če jih nemorš nahranit.


Torej bo podpiral DDR3 1866. >:D

Ne nakladaj.

tudi z ddr4-4000 bo takšen gpu lačen bandwidth-a

malo za občutek; gpu v macu, ki ima enak shader konfig kot tale zen apu
https://www.techpowerup.com/gpudb/2898/...

ma 80GB/s bandwidth-a. DDR4-4000 ima 64GB/s. Torej če hočeš, da takšen gpu nebo lačen bandwidth-a, rabiš vsaj dual channel ddr4-5000, da bo sit. In to na 850Mhz, kaj šele če bodo višji clocki (kar sigurno bodo)


In kje je problem? Če bo OEM dal samo single channel dokupiš dodaten modul in vstaviš v laptop.
|HP EliteBook|R5 6650U|

Zgodovina sprememb…

  • spremenil: D3m ()

Brane22 ::

Who cares. Tole pišem na Athlonu 5370, pa je čisto dovolj za večino stvari, če odmislimo igre. Pa dela na 2.2 GHz s šparovnimi jedri in en DDR3 kanal ima na ubogih 1600MHz.

RR bo na 35W TDP pomeni ogromen skok naprej.

D3m ::

Mojega sem sparil z dodatnim RAM modulom, da sem izkoristil dual-channel.
|HP EliteBook|R5 6650U|

Zgodovina sprememb…

  • spremenil: D3m ()

Brane22 ::

In koneckoncev, tudi nakup modela v high-end delu ima smisel.

Če bi se rad približal bandwidthu diskretne kartice, plačaj.

D3m je izjavil:

Mojega sem sparil z dodatnim RAM modulom, da sem izkoristil dual-channel.


KAbini ? Ta ima samo en kanal. Lahko daš dva modula gor, ampak sta na istem kanalu.

Tako imam jaz gor 16GB -2x po 8GB. RAMa sta sicer sposobna delati na 1866 in čez a BIOS nastavi frekvenco kanal na 1600MHz zaradi dodatnih kapacitivnih obremenitev.

Zgodovina sprememb…

  • spremenilo: Brane22 ()

D3m ::

Seveda.

hojko

Moj APU ima 256SP VLIW4 dual-channel. :D

Brane22 je izjavil:

In koneckoncev, tudi nakup modela v high-end delu ima smisel.

Če bi se rad približal bandwidthu diskretne kartice, plačaj.

D3m je izjavil:

Mojega sem sparil z dodatnim RAM modulom, da sem izkoristil dual-channel.


KAbini ? Ta ima samo en kanal. Lahko daš dva modula gor, ampak sta na istem kanalu.

Tako imam jaz gor 16GB -2x po 8GB. RAMa sta sicer sposobna delati na 1866 in čez a BIOS nastavi frekvenco kanal na 1600MHz zaradi dodatnih kapacitivnih obremenitev.


Trinity.

Imam pa še Brazosa E-450, ki ima prostor za dodatni ram samo ne podpira dual-channel :(
|HP EliteBook|R5 6650U|

Zgodovina sprememb…

  • spremenil: D3m ()

hojnikb ::

fora je ker je nesmisel met tok shaderjov na visokih frekvencah, če jih nemorš zafilat. Naj dajo potem 384SP maks, če se mislijo držat ddr4

In kje je problem? Če bo OEM dal samo single channel dokupiš dodaten modul in vstaviš v laptop.

Ocena bandwitha je z dvema moduloma.
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

Brane22 ::

Mogoče je fora v tem, da pri danem bandwidthu ti shaderjji lahko delajo z nižjo frekvenco in tako nižjo napetostjo, torej večjim učinkom na Watt porabe.

hojnikb ::

to da je na nižji frekvenci večja učinkovitost je jasno, ampak kaj ti nuca tok shaderjov, če bodo sestradani bandwidth-a. Kr primerjaj dedicated grafike z isti shader konfigom in apuje, pa boš vidu
#brezpodpisa

hamez66 ::

A ni fora APUja tudi v tem, da lahko GPU del dostopa direktno do CPUjevih registrov, kjer je bandwidth neprimerno večji? Se pravi je lahko bandwidth do rama tudi malo nižji, kot pri dedicated grafičnih (za isti performance).

Lahko, da narobe razmišljam..

Zgodovina sprememb…

  • spremenilo: hamez66 ()

Brane22 ::

hojnikb je izjavil:

to da je na nižji frekvenci večja učinkovitost je jasno, ampak kaj ti nuca tok shaderjov, če bodo sestradani bandwidth-a. Kr primerjaj dedicated grafike z isti shader konfigom in apuje, pa boš vidu


Nuca ti za večji učinek na Watt. Če si omejen s TDP 35W recimo, potem nima veze bandwith, če za shaderej zmanjka štroma. Če pa jih lahko spraviš v neko delovno točko optimuma energijske porabe, na koncu iztržiš več.

hamez66 ::

Oz. verjetno ne do CPUjevih registrov, ampak do l2 in l3 cacha. Ne vem, malo na glas razmišljam. :))

Brane22 ::

V bistvu ja. To mi je zelo všeč. Na Kabiniju ni L3 ampak že dostop do L2 ogromno pomeni, če to znaš izkoristiti seveda.

Predator X ::

hojnikb je izjavil:

sam ne x2 bolj

res je.
- Je pa DDR4.

HBM zna popraviti zadevo za iGPU. HBM zna tud CPUju pomagat v določenih primerih.

Wrop ::

Shaderji -> nesmisel imet tolk shaderjev na visokih frekvencah? Shaderji in napetost? Kaj??? A je to kaka novodobna terminologija za katero nekateri še ne vemo? ;((

Mogoče pa nekateri ne vejo o čem se sploh pogovarjajo. Res, ne vem :))

Brane22 ::

Wrop je izjavil:

Shaderji -> nesmisel imet tolk shaderjev na visokih frekvencah? Shaderji in napetost? Kaj??? A je to kaka novodobna terminologija za katero nekateri še ne vemo? ;((

Mogoče pa nekateri ne vejo o čem se sploh pogovarjajo. Res, ne vem :))


Iskrenost je lepa in v splošnem zaželjena lastnost.

Naj ti pomagam - poraba je odvisna od veliko parametrov. Recimo frekvence in napetosti, pri katerih deluje dani sklop. Pri sodobnem CMOSu gre dinamični del porabe v grobem linearno s frekvenco. vsak preklop vsakega stikala stane toliko in toliko fJ.

AMpak za sposobnost dela na dani frekvenci rabiš vsaj določeno napetost. Cena preklopa pa raste s kvaddratom napetosti IIRC. Se pravi, če je tvoj silicij sposoben dela daleč nad 1GHz, ti pa ga goniš na recimo 300MHz, bo takrat delal pri minimalni napetosti in cena takih preklopov bo daleč nižja, kot bi bila pri istem sklopu, katerega "meso" je sposobno dela pri mogoče 500MHz na ful gasu.

Wrop ::

Lepo da si razložil porabo pri CMOS tranzistorju in povezavo med napetosjo in porabo pri določeni frekvenci glede na maksimalno sposobnosjo preklapljanja tranzistorjev.
Samo še vedno pogrešam razlago stavka
nesmisel imet tolk shaderjev na visokih frekvencah
ali pa kakšna je povezava med shaderji in napetosjo.

Če sem bolj direkten: nekako se mi zdi, da se ne ve kaj shader sploh pomeni. Mogoče je pa to kak nov izum hojnikbja.

hojnikb ::

mogoce pa ti ne razumes dolocenih zadev.
nemors povecevat shader enote, ne da bi zram tudi temu primerno ppvecal memory bandwith.

kot bi mel v8 motor, gor pa cevi za gorivo od polo 1.0
#brezpodpisa

Brane22 ::

hojnikb je izjavil:

mogoce pa ti ne razumes dolocenih zadev.
nemors povecevat shader enote, ne da bi zram tudi temu primerno ppvecal memory bandwith.

kot bi mel v8 motor, gor pa cevi za gorivo od polo 1.0


Zakaj ne ? Ladijski dizli imajo ogromno kubaturo za dano moč, hkrati pa zelo visok izkoristek na nizkih obratih motorja.

hojnikb ::

ne govorimo o izkoristku, ampak performancu
#brezpodpisa

Brane22 ::

Za ladijski motor to dolča performance - izkoristek.

Podobni parametri veljajo za mnoge APUje.

hojnikb ::

govora je o 1300mhz in 768sp, kar je defenitivno hud bottleneck z ddr4
#brezpodpisa

Brane22 ::

Zakaj ?

Komot si lahko zmislim kar nekaj OpenCL ali HSA scenarijev, kjer to prav pride, ker GPU del obdeluje bloke, ki so efektivno v L2/L3 na čipu.

hojnikb ::

to je niša znotraj niše znotraj niše.

lets face it, amd ne tišči dobre grafike v cpuje zato, da bodo dobili hpcjaši hardon. Ampak zato da se del "gaming" populacije premakne iz konzol in cheapo grafik na apu.
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

D3m ::

Še insider povrhu. Hojko preseneča.
|HP EliteBook|R5 6650U|

pegasus ::

Ko vam bojo game devi začeli razlagat čez par let, kolk je HSA kul, boste gamerji dobili tolk velke hardone, da se boste sabljali z njimi ...

hojnikb ::

seveda, vsi gaming stroji bodo sli iz dedicated grafik na apu. sur
#brezpodpisa

D3m ::

Seveda in tvoje staro prepričanje bo zamrlo.
|HP EliteBook|R5 6650U|

Predator X ::

hojnikb je izjavil:

seveda, vsi gaming stroji bodo sli iz dedicated grafik na apu. sur


HSA? iGPU boost CPU.

Zgodovina sprememb…

Wrop ::

hojnikb je izjavil:

mogoce pa ti ne razumes dolocenih zadev.
nemors povecevat shader enote, ne da bi zram tudi temu primerno ppvecal memory bandwith.

kot bi mel v8 motor, gor pa cevi za gorivo od polo 1.0


Katerih zadev ne razumem? A kakšna je smiselnost števila shaderjev in višina frekvence? Enkrat govoriš o shaderjih drugič o shader enotah.
Mogoče si se pa res infiltriral v kak hardware dev team kjer uporabljate interno terminologijo in nam zunanjim nočete deliti vašega znanja.:'(

Komot lahko v8 motor dela na ceveh za gorivo od polota 1.0. Samo dodati je potrebno eno dodatno posodo bližje motorju, kjer se nabira gorivo, tudi takrat, ko motor ne potrebuje toliko goriva. Ekvivalent v računalništvu je dodajanje predpomnilnika.

Mogoče pa bi lahko podal kako informacijo kakšna je neka splošna ocena razmerja dostopov do podatkov, ki se nahajajo v grafičnih predpomnilnikih glede na vse dostope v glafičnem pomnilniku.

hojnikb ::

apu grafike ze imajo od nekdaj dostop do l2ja, pa ni videt, da to prinasa kak spodobn gain, ker performance se vedno skalira z visanjem frekvenc rama.
ce bi igpu imel svoj l2, bi seveda bla druga zgodba. tko je pa shared z cpujem in seveda obe zadevi thrashata tist bogi l2 in gainov ni.

again, for the last time. za bolsi gpu (vec shaderjov, visje core frekvence) je treba dvignat tudi memory bandwidth. a mislis da amd/nvidia zastonj rineta hbm/gddr5x na svoje grafike, ce je le ta mizernega pomena ?

apuji (vsaj tisti bolsi z recimo vec kot 512sp) obvezno rabijo ondie hbm, sicer je brezveze rinat tolk velik gpu gor. razn ce se gres brane22 scenarij, kjer das vecji gpu in ga downclockas do minimuma (performance gre dol, pravtako potreba po bandwithu) for the sake of efficiency. ampak tak efficiency stane.
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

hojnikb ::

Komot lahko v8 motor dela na ceveh za gorivo od polota 1.0. Samo dodati je potrebno eno dodatno posodo bližje motorju, kjer se nabira gorivo, tudi takrat, ko motor ne potrebuje toliko goriva. Ekvivalent v računalništvu je dodajanje predpomnilnika.

ta ideja mogoce deluje efektivno pri serijskem racunanju aka general purpose cpu kot je x86. v takem primeru lahko lepo zafilujes ze l1 z prihajajocimi instructioni.
seveda ta ideja deluje tudi pri gpujih, ampak ne v taksni meri. zato je se vedno potreba po hitrem sekundarnem ramu, da je shader array vedno zaposlen.
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

Jarno ::

Hojnikb ima delno prav. Ne moreš imeti npr 64MB fbo-jev v predpomnilniku. Shaderji efektivno pretakajo iz enega bufferja v drugega in tukaj je bandwidth ključnega pomena.
No, po drugi strani bi znalo držati, da kompleksni-počasni shaderji ne potrebujejo toliko pretočnosti, ker se shaderji izvajajo na internih registrih in je zahteva po bandwidthu zmanjšana, ker v tem primeru podatki curljajo počasi.

hojnikb ::

evo link do nekaj relavantnih postov @senitel
https://slo-tech.com/forum/t620484/p502...
https://slo-tech.com/forum/t620484/p502...
https://slo-tech.com/forum/t620484/p502...

pa se enkrat limam dedicated ekvivalent zen apuju
https://www.techpowerup.com/gpudb/2898/...

Bandwidth: 80.0 GB/s


zdej pa hitro poiscite ddr4 stick, ki bo sposoben taksnega bandwidtha :)
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

Predator X ::

ZEN apu 7nm
Ryzen 4C/8T , no L3
2304CU
8GB/16GB hbm 2
2020

Pico itx 35w tdp

Zgodovina sprememb…

Wrop ::

apu grafike ze imajo od nekdaj dostop do l2ja, pa ni videt, da to prinasa kak spodobn gain, ker performance se vedno skalira z visanjem frekvenc rama.


APU grafični procesorji imajo lahko tudi svoj L2. Ne vem kaj je zate spodobn gain. To, da zmogljivost raste z višanjem frekvenc rama pa je itak jasno, saj to velja tudi za CPU.

again, for the last time. za bolsi gpu (vec shaderjov, visje core frekvence) je treba dvignat tudi memory bandwidth. a mislis da amd/nvidia zastonj rineta hbm/gddr5x na svoje grafike, ce je le ta mizernega pomena


A kdo pravi, da prepustnost do pomnilnika ni potrebno tudi povečati? To je vsem jasno, da ga je tudi potrebno. Potrebno je pa še kaj drugega narediti, da se lahko poveča hitrost procesorja za 10x, kjer se ob tem poveča prepustnost do glavnega pomnilnika samo za 2x.

apuji (vsaj tisti bolsi z recimo vec kot 512sp) obvezno rabijo ondie hbm, sicer je brezveze rinat tolk velik gpu gor. razn ce se gres brane22 scenarij, kjer das vecji gpu in ga downclockas do minimuma (performance gre dol, pravtako potreba po bandwithu) for the sake of efficiency. ampak tak efficiency stane.


Saj vemo, da bo hbm zelo dobrodošel za apuje. Kdo trdi, da ne bo?

ta ideja mogoce deluje efektivno pri serijskem racunanju aka general purpose cpu kot je x86. v takem primeru lahko lepo zafilujes ze l1 z prihajajocimi instructioni.
seveda ta ideja deluje tudi pri gpujih, ampak ne v taksni meri. zato je se vedno potreba po hitrem sekundarnem ramu, da je shader array vedno zaposlen.


Ideja dodatnih predpomnilnikov vedno pride v poštev, pa naj se gre za CPU ali GPU. Za CPU je L1 že zdavnaj premalo, da bi bil dovolj. Je tudi razlika ali primerjaš motor v4 in v8 ali v4 in v512.

Škoda, da še vedno ne dobim odgovora, kakšna je povezava med shaderji in frekvenco ter shaderji in napetosjo?

filip007 ::

Na Youtube je en video, ko je nekdo izklopil L1,L2 na Celeron 1.6GHz in dobil ven 386, kar bistvo pomeni več bolje je.
Palačinka z Ajvarjem in stopljenim sirom v mikrovalovki.

Grey ::

Wrop je izjavil:

apu grafike ze imajo od nekdaj dostop do l2ja, pa ni videt, da to prinasa kak spodobn gain, ker performance se vedno skalira z visanjem frekvenc rama.


APU grafični procesorji imajo lahko tudi svoj L2. Ne vem kaj je zate spodobn gain. To, da zmogljivost raste z višanjem frekvenc rama pa je itak jasno, saj to velja tudi za CPU.

again, for the last time. za bolsi gpu (vec shaderjov, visje core frekvence) je treba dvignat tudi memory bandwidth. a mislis da amd/nvidia zastonj rineta hbm/gddr5x na svoje grafike, ce je le ta mizernega pomena


A kdo pravi, da prepustnost do pomnilnika ni potrebno tudi povečati? To je vsem jasno, da ga je tudi potrebno. Potrebno je pa še kaj drugega narediti, da se lahko poveča hitrost procesorja za 10x, kjer se ob tem poveča prepustnost do glavnega pomnilnika samo za 2x.

apuji (vsaj tisti bolsi z recimo vec kot 512sp) obvezno rabijo ondie hbm, sicer je brezveze rinat tolk velik gpu gor. razn ce se gres brane22 scenarij, kjer das vecji gpu in ga downclockas do minimuma (performance gre dol, pravtako potreba po bandwithu) for the sake of efficiency. ampak tak efficiency stane.


Saj vemo, da bo hbm zelo dobrodošel za apuje. Kdo trdi, da ne bo?

ta ideja mogoce deluje efektivno pri serijskem racunanju aka general purpose cpu kot je x86. v takem primeru lahko lepo zafilujes ze l1 z prihajajocimi instructioni.
seveda ta ideja deluje tudi pri gpujih, ampak ne v taksni meri. zato je se vedno potreba po hitrem sekundarnem ramu, da je shader array vedno zaposlen.


Ideja dodatnih predpomnilnikov vedno pride v poštev, pa naj se gre za CPU ali GPU. Za CPU je L1 že zdavnaj premalo, da bi bil dovolj. Je tudi razlika ali primerjaš motor v4 in v8 ali v4 in v512.

Škoda, da še vedno ne dobim odgovora, kakšna je povezava med shaderji in frekvenco ter shaderji in napetosjo?

Seveda je razlika med motorji. Več valjev kot imaš, manj si varčen (več shaderjev, več štroma). Tako na oko, bi rekel, da je povezava v tem, da hitreje kot delujejo, več naredijo, a če je napetost manjša naredijo manj kot bi sicer. Input energy = output power (ogrevanje in compute moč). Se pravi, visoka frekvenca gre z roko v roki skupaj z višino napetosti, ki jo potrebuješ. Ta pa je odvisna od kvalitete materiala (koliko dobro ti dihta valj v motorju). Manj kot imaš tesnenja, večji tlak (napetost) potrebuješ za proizvodnjo enakega outputa v primerjavi z dobrim motorjem.

Tudi prepustnost pomnilnika ni tako povezana. Če bi bilo to res, potem bi weak point bil HDD/SSD, ki zmorejo bistveno nižje hitrosti. In tudi primerjati hitrost DDR4 z VRAMom na kartici ne gre direktno, ker gre za drugačno stvar. Kartico nafilaš s kodo, ki se izvaja neposredno na grafični kartici. Hitrost RAMa nima nobenega bistvenega pomena za to. Prepustnost VRAMa na grafični kartici pa ima veliko večji pomen za zmogljivost grafične kartice. RAM na računalniku podaja in išče kodo z diska v RAM na kartici. Od tam naprej pa se hitrost RAMa na računalniku ne pozna. Kjer se pozna hitrost RAMa računalnika je v tem, kako hitro je sposoben prenesti podatke z SDDja v RAM na kartici. Večje kot so teksture in fajli, ki jih program potrebuje, boljše je če je hitrejši.

Zgodovina sprememb…

  • spremenilo: Grey ()

Wrop ::

Saj. Procesor je večino časa zehal in čakal na ukaze in podatke iz glavnega pomnilnika. Tudi če bi povečal prepustnost pomnilnika za 5x, kar bi bilo zelo drago, bi procesor se vedno večino časa spal. Majhen predpomnilnik in malo večji predpomnilnik za prvim predpomnilnikom rešita precej prepada med hitrostjo procesorja in glavnega pomnilnika.

hojnikb ::

ta logika deluje super pri procesorjih, kjer je serijski workload. Pri grafikah pa malo manj, ker rabiš za dosti scen kr "ogromen" predpomnilnik, da zadeva ne spi. Ker seveda tak predpomnilnik stane (*khm* Iris Pro *khm*) more bit pač zadnje nivojski spomin (gddr5 itd..) kar se da hiter.
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

D3m ::

Bolje, da se drugače pogovarjamo.

Koliko bo Raven Ridge hitrejši od Godaveri?

Jaz pravim, da 30%-40%
|HP EliteBook|R5 6650U|

hojnikb ::

sepravi glih mišji kakec bolše od bristol ridge. Švoh

spomnimo; najbolši godaveri ima 512SP in 866Mhz. Če ima raven 1300Mhz in 768SP, je to več kot x2 boost predn sploh upoštevamo arhitekturne izboljšave.
Torej 30-40% uplift je _zelo_ slab
#brezpodpisa

Zgodovina sprememb…

  • spremenil: hojnikb ()

D3m ::

Saj zato pa je to moje osebno mnenje. :)
|HP EliteBook|R5 6650U|
««
59 / 611
»»