Forum » Strojna oprema » AMD Bulldozer
AMD Bulldozer
Temo vidijo: vsi
PrimozR ::
A ste upoštevali, da je TDP i3 2120 65 W? Pa da primerljivo čipovje pri AMD-ju za low end (pisarniški) komp porabi več, ker ima vgrajen še grafični čip?
M-XXXX ::
D3m ::
Ajoj HD 2000. Jo imam v službi na službenem pcju, i5 2400 nč posebnega, sam za prikazovanje namizja je dobra.
|HP EliteBook|R5 6650U|
PrimozR ::
Brane2 ::
Zdaj sem šel gledat bistvo patcha za "BD cache aliasing problem", ki je šel v kernel 3.2.
Tip pravi, da gre za zadevo, ki je AMD v okvirih familije F15h ne bo spreminjal.
Zdej kaj to pomeni za Piledriverja ne vem a je v okvirjih familija 15h ali ne več.
V glavnem, gre za tole:
Instrukcijski cache modula je 64kiB 2-way associative. Dve banki po 32kb torej. Finta je v tem, da je cache tagiran s fizičnimi naslovi, indeksiran pa z virtualnimi.
Kaj to pomeni ?
Najmanjša grnulacija je pri cachiranju 4kiB, torej PAGESIZE. Ena linija cachea znaša 64 byteov. Če vemo, da ima cache 64kiB, pomeni, da je organiziran kot 1024 linij po 64 byteov. Ker je razdeljen ( 2-way) na dve neodvisni polovici, ima vsaka 1024/2=512 linij. Te linije so znotraj vsake polovice razdeljeni na 8 bank po 4K- velikost osnovnega pagea.
To pomeni, da spodnjih 6 bitov ( A0-A5) iskanega virtualnega naslova določa konkretni iskani byte v liniji, naslednjih 6 (A6-A11) pa številko linije znotraj banke ( skupaj biti pokrijejo A0-A11= natanko 4K naslovov, kar je PAGESIZE), naslednji trije biti -A12-A14 pa določajo številko banke znotraj polovice.
ker se pretvorba naslovov v MMU enoti vrši na granulaciji 4kiB ali več, je to tudi velikost banke pri cachiranju. Hkrati je tudi spodnjih 12 bitov naslova, ki določa pozicijo naslova v strani pri virtualnem naslovu enakih kot pri fizičnem.
Če še enkrat pogledate prvi odebeljen stavek, boste videli, da logika pri čekiranju ali je dani naslov v cacheu ali ne ne uprablja samo virtualni ali fizični naslov, ampak mešanico obeh.
Spodnjih 12 bitov je itak vedno enakih pri obeh tipih naslovov ( se pravi virtualni naslov se tam vendo ujema s fizičnim), ampak trije nad tem pa niso.
Kre pretvorba virtualnega naslvoa vedno vzame nekaj časa, tudi če je ta cachiran v TLBju, je AMD tu usekal bližnjico. ZA spodnjih 12 bitov mu ni treba čakati, ravno tako za naslednje tri. Tako lahko dobi osnovno idejo, ali bi znal imeti naslov v cacheu, ki ga potem potrdi, ko iz TLB cacheja pridejo preostali najvišji biti fizičnega naslova. Tako lahko logika že gre spekulativno iskat podatek, ki ga potem morebiti zavrže, če pač odgovor TLBja ne bo taprav.
Ampak hec nastane v tem, da taka zasnova ne zna delati v scenarijih, kjer se več virtualnih naslovov zna preslikati v en fizičen.
Ker so vse naslovne linije nad 32kiB (A15) fizične in ker se spodnjih 12 linij (A0-A11) itak vedno ujema med fizičnim in virtualnim naslovom, lahko torej razlika nastopi na linijah od A12 do A14.
Med normalnim delom načeloma ni razloga, zakaj bi prišlo do podvajanja naslovov ampak instrukcijski cache je deljen med dvema polovicama modula in vsako lahko izvaja svoj program. Tako ima lahko iste knjižnice, vendar na drugih fizičnih naslovih.
Eden razlog za to je randomizacija naslovov ASLR kot zaščita pred napadi tipa stack-overflow, drugi pa recimo drugo zaporedje, v katerem je bila linkana za dani program. Temu ustrezne ima vsak program svoje TLB preslikave ker pač vidi različne dele fizičnega pomnilnika na različnih virtualnih koncih.
Če dva programa hočeta hrkati izvajati kodo na isti fizični strani, jo bo logika naložila v cache.
Če se biti A12-A14 v njunem vitualnem naslovnem prostoru za isti fizični kos kode ne razlikujejo, bo vse v najlepšem redu. En program bo zahteval instrukcijo na naslovu X in logika jo bo šla iskat in pustila v eni banki L1 in nato agresivno zafilala preostanek ker bo pričakovala naslednje zahteve. Ko drugi CPU skoči v to knjižnico, ga ta kos programa že čaka.
Ampak če se biti A12-A14 pri tej preslikavi med programoma razlikujejo, potem nastopijo težave. Vsaka polovica cachea lahko cachira samo svojih 32kIB RAM-a, kar znese 8 strani po 4kIB. Pri tem pa je njena granulacija 64KB. Torej so njene meje lahko samo na večkratniku 64KB.
Prva torej lahko cachira na 0-32kiB, 64-96kiB, 124-144kiB... druga pa na 32-64kiB,96-128kiB itd itd.
Tako ni teorije, da bi vsak program videl svoj del virtualni naslov v svoji polovici. Lahko je samo v določeni polovici in v njenih okvirih samo v določeni banki 4kiB. Tako vsak od coreov sproži cache miss in logika gre iskat iz L2 spet podatke v L1i, kar povzroča veliko višje latence.
V glavnem, da ne tupim, fix je že v kernelu. Sestoji se iz tega da ALSR, če je vklopljen, pusti pri miru A12-A14 ( kar sicer deloma zjebe randomizacijo v 32-bitnih okoljih, ampak...) + dodaten fix. TA je lahko:
- ta, da se koda vedno nalaga na naslove, kjer je A12-A14 konstanten. To pomeni 1/8 naslovnega prostora, ki pa je v 64-bitnem okolju itak ogromen, poleg tega to velja samo za programsko kodo, ki itak ne zavzema veliko v povprečju
- ta, da se ista koda vsake knjižnice vendo naloži v isti naslov ali vsaj naslov, kjer se virtualni biti A-12-A14 ne razlikujejo.
V glavnem, no big deal.
Aja, pa Moronix je v svojem stilu spet prehiteval in šel checkirat "Bulldozer cache alias impact" v okolju, ker do nejga ne more priti- multithreadani aplikaciji, ki hkrati laufa na vseh jedrih...
V glavnem to je to. Vsaj mislim, da je tako.
Grem še enkrat brat zadevo za vsak slučaj...
Tip pravi, da gre za zadevo, ki je AMD v okvirih familije F15h ne bo spreminjal.
Zdej kaj to pomeni za Piledriverja ne vem a je v okvirjih familija 15h ali ne več.
V glavnem, gre za tole:
Instrukcijski cache modula je 64kiB 2-way associative. Dve banki po 32kb torej. Finta je v tem, da je cache tagiran s fizičnimi naslovi, indeksiran pa z virtualnimi.
Kaj to pomeni ?
Najmanjša grnulacija je pri cachiranju 4kiB, torej PAGESIZE. Ena linija cachea znaša 64 byteov. Če vemo, da ima cache 64kiB, pomeni, da je organiziran kot 1024 linij po 64 byteov. Ker je razdeljen ( 2-way) na dve neodvisni polovici, ima vsaka 1024/2=512 linij. Te linije so znotraj vsake polovice razdeljeni na 8 bank po 4K- velikost osnovnega pagea.
To pomeni, da spodnjih 6 bitov ( A0-A5) iskanega virtualnega naslova določa konkretni iskani byte v liniji, naslednjih 6 (A6-A11) pa številko linije znotraj banke ( skupaj biti pokrijejo A0-A11= natanko 4K naslovov, kar je PAGESIZE), naslednji trije biti -A12-A14 pa določajo številko banke znotraj polovice.
ker se pretvorba naslovov v MMU enoti vrši na granulaciji 4kiB ali več, je to tudi velikost banke pri cachiranju. Hkrati je tudi spodnjih 12 bitov naslova, ki določa pozicijo naslova v strani pri virtualnem naslovu enakih kot pri fizičnem.
Če še enkrat pogledate prvi odebeljen stavek, boste videli, da logika pri čekiranju ali je dani naslov v cacheu ali ne ne uprablja samo virtualni ali fizični naslov, ampak mešanico obeh.
Spodnjih 12 bitov je itak vedno enakih pri obeh tipih naslovov ( se pravi virtualni naslov se tam vendo ujema s fizičnim), ampak trije nad tem pa niso.
Kre pretvorba virtualnega naslvoa vedno vzame nekaj časa, tudi če je ta cachiran v TLBju, je AMD tu usekal bližnjico. ZA spodnjih 12 bitov mu ni treba čakati, ravno tako za naslednje tri. Tako lahko dobi osnovno idejo, ali bi znal imeti naslov v cacheu, ki ga potem potrdi, ko iz TLB cacheja pridejo preostali najvišji biti fizičnega naslova. Tako lahko logika že gre spekulativno iskat podatek, ki ga potem morebiti zavrže, če pač odgovor TLBja ne bo taprav.
Ampak hec nastane v tem, da taka zasnova ne zna delati v scenarijih, kjer se več virtualnih naslovov zna preslikati v en fizičen.
Ker so vse naslovne linije nad 32kiB (A15) fizične in ker se spodnjih 12 linij (A0-A11) itak vedno ujema med fizičnim in virtualnim naslovom, lahko torej razlika nastopi na linijah od A12 do A14.
Med normalnim delom načeloma ni razloga, zakaj bi prišlo do podvajanja naslovov ampak instrukcijski cache je deljen med dvema polovicama modula in vsako lahko izvaja svoj program. Tako ima lahko iste knjižnice, vendar na drugih fizičnih naslovih.
Eden razlog za to je randomizacija naslovov ASLR kot zaščita pred napadi tipa stack-overflow, drugi pa recimo drugo zaporedje, v katerem je bila linkana za dani program. Temu ustrezne ima vsak program svoje TLB preslikave ker pač vidi različne dele fizičnega pomnilnika na različnih virtualnih koncih.
Če dva programa hočeta hrkati izvajati kodo na isti fizični strani, jo bo logika naložila v cache.
Če se biti A12-A14 v njunem vitualnem naslovnem prostoru za isti fizični kos kode ne razlikujejo, bo vse v najlepšem redu. En program bo zahteval instrukcijo na naslovu X in logika jo bo šla iskat in pustila v eni banki L1 in nato agresivno zafilala preostanek ker bo pričakovala naslednje zahteve. Ko drugi CPU skoči v to knjižnico, ga ta kos programa že čaka.
Ampak če se biti A12-A14 pri tej preslikavi med programoma razlikujejo, potem nastopijo težave. Vsaka polovica cachea lahko cachira samo svojih 32kIB RAM-a, kar znese 8 strani po 4kIB. Pri tem pa je njena granulacija 64KB. Torej so njene meje lahko samo na večkratniku 64KB.
Prva torej lahko cachira na 0-32kiB, 64-96kiB, 124-144kiB... druga pa na 32-64kiB,96-128kiB itd itd.
Tako ni teorije, da bi vsak program videl svoj del virtualni naslov v svoji polovici. Lahko je samo v določeni polovici in v njenih okvirih samo v določeni banki 4kiB. Tako vsak od coreov sproži cache miss in logika gre iskat iz L2 spet podatke v L1i, kar povzroča veliko višje latence.
V glavnem, da ne tupim, fix je že v kernelu. Sestoji se iz tega da ALSR, če je vklopljen, pusti pri miru A12-A14 ( kar sicer deloma zjebe randomizacijo v 32-bitnih okoljih, ampak...) + dodaten fix. TA je lahko:
- ta, da se koda vedno nalaga na naslove, kjer je A12-A14 konstanten. To pomeni 1/8 naslovnega prostora, ki pa je v 64-bitnem okolju itak ogromen, poleg tega to velja samo za programsko kodo, ki itak ne zavzema veliko v povprečju
- ta, da se ista koda vsake knjižnice vendo naloži v isti naslov ali vsaj naslov, kjer se virtualni biti A-12-A14 ne razlikujejo.
V glavnem, no big deal.
Aja, pa Moronix je v svojem stilu spet prehiteval in šel checkirat "Bulldozer cache alias impact" v okolju, ker do nejga ne more priti- multithreadani aplikaciji, ki hkrati laufa na vseh jedrih...
V glavnem to je to. Vsaj mislim, da je tako.
Grem še enkrat brat zadevo za vsak slučaj...
On the journey of life, I chose the psycho path.
x45 ::
Machiavelli je izjavil:
En update Jan-Feb 2012 pride B3 stepping
( manjša poraba štroma in manj oddane toplote na istih clockih kot na B2,in rahel popravek v performancu 5-8%,večji overclock,višji stock clocki itd..)
Cons: Slower than the Phenom II X6 CPUs in a Clock for clock review(s). B3 revision coming to resolve this issue among a few more.
Other Thoughts: Within the B3 stepping revision, expect minor tweaks to the following:
1) L1, L2 and L3 latencies
2) Cache Thrashing Issues
3) Modified Algorithms for Branch Prediction
4) Healthy Bump in Processor Frequency
5) Slight Frequency increase via NB Controller
6) "Total Intelligent Control" For example programs and applications should look at the module design approach and the ability for the processor to intelligently turn off and/or turn on specific cores that it believes is hindering performance for maximum performance.
7) Power will be improved but not my much.
Hmm bomo videli lol
kje je link od tega ?
to bi naj bil že Pildiver ali zgolj B3 stepping?
x45 ::
zgolj s tole masko je score višji za 10 do 20% kot pravijo:
http://techreport.com/articles.x/21865/2
http://techreport.com/articles.x/21865/2
M-XXXX ::
zgolj s tole masko je score višji za 10 do 20% kot pravijo:
http://techreport.com/articles.x/21865/2
Še ene 10% pa bo že skoraj primerljiv s tastaro AMD generacijo
Brane2 ::
To z masko je zasilna "rešitev", ki niti ne reši vsega.
Tisti patch za Linux kernel je veliko boljša rešitev.
No, saj. Ko pride Piledriver, bo zaradi mlačnega sprejema Bulldozerja poceni, obenem pa bistveno hitrejši, tako po jedru kot po številu jeder.
Takrat pridejo tudi nove plate ven z novim 10x0 čipsetom, verjetno bodo pametni 8GiB RAM ploščki tudi cenejši in takrat pa bi bil mogoče pameten čas za upgrade.
SPloh ker bodo SW orodja in njih dodelave za Bulldozer verjetno kar nekaj časa zunaj in bodo kar fino razhroščene.
No ja. Stvar je optimizirana za novo kodo. S staro bo delala ampak hitrosti ne bodo blazne. Z novo, optimizirano kodo se ji bo pa utrgalo.
Tisti patch za Linux kernel je veliko boljša rešitev.
No, saj. Ko pride Piledriver, bo zaradi mlačnega sprejema Bulldozerja poceni, obenem pa bistveno hitrejši, tako po jedru kot po številu jeder.
Takrat pridejo tudi nove plate ven z novim 10x0 čipsetom, verjetno bodo pametni 8GiB RAM ploščki tudi cenejši in takrat pa bi bil mogoče pameten čas za upgrade.
SPloh ker bodo SW orodja in njih dodelave za Bulldozer verjetno kar nekaj časa zunaj in bodo kar fino razhroščene.
zgolj s tole masko je score višji za 10 do 20% kot pravijo:
http://techreport.com/articles.x/21865/2
Še ene 10% pa bo že skoraj primerljiv s tastaro AMD generacijo
No ja. Stvar je optimizirana za novo kodo. S staro bo delala ampak hitrosti ne bodo blazne. Z novo, optimizirano kodo se ji bo pa utrgalo.
On the journey of life, I chose the psycho path.
Zgodovina sprememb…
- spremenil: Brane2 ()
x45 ::
To z masko je zasilna "rešitev", ki niti ne reši vsega.
Tisti patch za Linux kernel je veliko boljša rešitev.
No, saj. Ko pride Piledriver, bo zaradi mlačnega sprejema Bulldozerja poceni, obenem pa bistveno hitrejši, tako po jedru kot po številu jeder.
Takrat pridejo tudi nove plate ven z novim 10x0 čipsetom, verjetno bodo pametni 8GiB RAM ploščki tudi cenejši in takrat pa bi bil mogoče pameten čas za upgrade.
SPloh ker bodo SW orodja in njih dodelave za Bulldozer verjetno kar nekaj časa zunaj in bodo kar fino razhroščene.
zgolj s tole masko je score višji za 10 do 20% kot pravijo:
http://techreport.com/articles.x/21865/2
Še ene 10% pa bo že skoraj primerljiv s tastaro AMD generacijo
No ja. Stvar je optimizirana za novo kodo. S staro bo delala ampak hitrosti ne bodo blazne. Z novo, optimizirano kodo se ji bo pa utrgalo.
maska je en pokazatelj kako neralni so prvi testi BD ja, ker lahko dodaš vsaj + 10 % k scorom. Poleg tega je blo že nekaj testov kjer, je prehitel vse intele oz je bil zlo visoko ( npr kompleksni izračuni - to je objavil samo AMD ker ostali ne testirajo tega + 570 %).
če k temu dodamo še:
pildiver jedro oz B3 step oz BD 2
višji clocki na B3
patch
ima zadeva lep potencial
še en test kjer se vidi da BD 1 porabi manj v idle kot ostali CPU ji:
http://www.bit-tech.net/hardware/cpus/2...
Zgodovina sprememb…
- spremenilo: x45 ()
Brane2 ::
1. frekvence ne bodo bistveno višje.
2. patch ne bo prinesel veliko v vsakdanjem miksu aplikacij
3. Piledriver ne bo prav veliko izboljšan
4. spet nakladaš. Kako ima po tvoje tam BD-1 nižjo porabo, če ga na maxu sesujate oba zanimiva intla- 2500K in 2600K ?
Kar se prej omenjenega tiče, velja predvsem za Linux- ki zanima mene. V svetu zaprte kode je možnost sprememb pač omejena.
Kar je v bistvu fino. Čip bo pač toliko cenejši...
EDIT: Aja, mislu si idle porabo- hja ampak tudi tam je razlika minimalna- par W...
2. patch ne bo prinesel veliko v vsakdanjem miksu aplikacij
3. Piledriver ne bo prav veliko izboljšan
4. spet nakladaš. Kako ima po tvoje tam BD-1 nižjo porabo, če ga na maxu sesujate oba zanimiva intla- 2500K in 2600K ?
Kar se prej omenjenega tiče, velja predvsem za Linux- ki zanima mene. V svetu zaprte kode je možnost sprememb pač omejena.
Kar je v bistvu fino. Čip bo pač toliko cenejši...
EDIT: Aja, mislu si idle porabo- hja ampak tudi tam je razlika minimalna- par W...
On the journey of life, I chose the psycho path.
Zgodovina sprememb…
- spremenil: Brane2 ()
Brane2 ::
BTW, kako je zdaj s tem Piledriverjem in B3 ?
Če prav zastopim, je B3 samo novi revision BD-1 in ta bo na voljo čez par mesecev, predvidoma jan-feb2012.
Piledriver -BD2 pa pride ven tam nekje junija 2012.
Je to nekako to ?
Če prav zastopim, je B3 samo novi revision BD-1 in ta bo na voljo čez par mesecev, predvidoma jan-feb2012.
Piledriver -BD2 pa pride ven tam nekje junija 2012.
Je to nekako to ?
On the journey of life, I chose the psycho path.
PrimozR ::
maska je en pokazatelj kako neralni so prvi testi BD ja, ker lahko dodaš vsaj + 10 % k scorom. Poleg tega je blo že nekaj testov kjer, je prehitel vse intele oz je bil zlo visoko ( npr kompleksni izračuni - to je objavil samo AMD ker ostali ne testirajo tega + 570 %).
10% lahko dodaš samo v tvojih mislih, v praksi ne. Če so rezultati takšni kot so, so takšni kot so. Kaj meni pomaga, če vem da bi bil proc z nekaj dela pri izdelovalcu OSa lahko 10% hitrejši, ampak enostavno ni? Popolnoma nič. Važne so številke ob nakupu izdelka, neke obljube za izboljšave pa niso nekaj pretirano vredne, saj so zlahka le prazne obljube. Not that you'll understand.
PrimozR ::
Hmnja, v bistvu nič pametnega, še najbolj reprezentativen je PCMark, vsi ostali trije testi pokažejo preveliko razliko na račun zmogljivejšega GPU-ja. Ni pa neke direktne primerjave CPU jeder.
Isotropic ::
HPC testi. nekateri stestirajo cpu, nekateri pa cpu + memory. ne vme, zakaj jih anandtech ne izvaja vec, vcasih so imeli dinamiko tekočin in trk dveh vozil.
PrimozR ::
Ker se takšnih stvari dandanes ne izvaja več na osebnih računalnikih, ampak na HPC clustrih, kjer se uporablja serverski HW? Pa ker gre za drage naložbe kupci verjetno sami naredijo neke teste oz. primerjave, tudi glede na tip izračunov in programsko opremo, ki jo bodo uporabljali. Verjetno pa je zadaj še birokracija oz. 'dobavljivost' določene znamke :)
eieieie1 ::
To z masko je zasilna "rešitev", ki niti ne reši vsega.
Tisti patch za Linux kernel je veliko boljša rešitev.
No, saj. Ko pride Piledriver, bo zaradi mlačnega sprejema Bulldozerja poceni, obenem pa bistveno hitrejši, tako po jedru kot po številu jeder.
Takrat pridejo tudi nove plate ven z novim 10x0 čipsetom, verjetno bodo pametni 8GiB RAM ploščki tudi cenejši in takrat pa bi bil mogoče pameten čas za upgrade.
SPloh ker bodo SW orodja in njih dodelave za Bulldozer verjetno kar nekaj časa zunaj in bodo kar fino razhroščene.
zgolj s tole masko je score višji za 10 do 20% kot pravijo:
http://techreport.com/articles.x/21865/2
Še ene 10% pa bo že skoraj primerljiv s tastaro AMD generacijo
No ja. Stvar je optimizirana za novo kodo. S staro bo delala ampak hitrosti ne bodo blazne. Z novo, optimizirano kodo se ji bo pa utrgalo.
maska je en pokazatelj kako neralni so prvi testi BD ja, ker lahko dodaš vsaj + 10 % k scorom. Poleg tega je blo že nekaj testov kjer, je prehitel vse intele oz je bil zlo visoko ( npr kompleksni izračuni - to je objavil samo AMD ker ostali ne testirajo tega + 570 %).
če k temu dodamo še:
pildiver jedro oz B3 step oz BD 2
višji clocki na B3
patch
ima zadeva lep potencial
še en test kjer se vidi da BD 1 porabi manj v idle kot ostali CPU ji:
http://www.bit-tech.net/hardware/cpus/2...
In na tej isti strani je i5 2500k v skoraj vseh testih bistveno boljši od DRAŽJEGA fx 8150... V idle je razlika zelo mala, v load pa kar velika in to v prednosti i5 2500k/ i7 2600k... Da ne govorimo o tem da se moreš ZELO potruditi, da najdeš nek benchmark, kjer je rezultat da fx 8150 ima manjšo porabo kot i5 2500k / i7 2600k
Brane2 ::
Aja, ne vem če je kdo videl novico. ARM A15 je doživel svoj tape-out na 20nm.
Prvi primerki v prodaji bodo čez eno leto. Skorajda se že ujeli tavelike igralce na x86 sceni, kar se geometrije tiče.
Prvi primerki v prodaji bodo čez eno leto. Skorajda se že ujeli tavelike igralce na x86 sceni, kar se geometrije tiče.
On the journey of life, I chose the psycho path.
Machiavelli ::
zgolj s tole masko je score višji za 10 do 20% kot pravijo:
http://techreport.com/articles.x/21865/2
Z tole masko je takole
Več modulov ko spneš da delajo eno delo ali manj dela bo razultat rahlo boljši, bo narjeno hitreje a ostalo delo čaka...
Več modulov ko razlepiš narazen lahko več dela na enkrat izvajaš a počasneje in če to še razlepiš v jedra bo še počasneje a še več dela na 1x....
Torej tu nastane problem poimenovanja 8 CORE,mislim če bi zadevo lepo optimizirali z tem patchom balanc nek lep kje da se limajo kje razlimajo bi bil avređ performanc 5-15% boljši v določenih scenarijih....
tako se stopnjuje v + in - ....
Windows trenutno vsako thread obdeluje kot jedro,ker neve za module in z mask 55 aka patch v določenih scenarijih če bi pravilno šaltalo bi bilo 5-15% boosta
Nigaaazz
x45 ::
Hmnja, v bistvu nič pametnega, še najbolj reprezentativen je PCMark, vsi ostali trije testi pokažejo preveliko razliko na račun zmogljivejšega GPU-ja. Ni pa neke direktne primerjave CPU jeder.
ja res v tvojih mislih samo PIPI. praksa je pač praksa kot si napisal. in apu je že zdaj boljši od vseh intelovih apu jev. Score gain pa je lepo za ta nove
Machiavelli je izjavil:
zgolj s tole masko je score višji za 10 do 20% kot pravijo:
http://techreport.com/articles.x/21865/2
Z tole masko je takole
Več modulov ko spneš da delajo eno delo ali manj dela bo razultat rahlo boljši, bo narjeno hitreje a ostalo delo čaka...
Več modulov ko razlepiš narazen lahko več dela na enkrat izvajaš a počasneje in če to še razlepiš v jedra bo še počasneje a še več dela na 1x....
Torej tu nastane problem poimenovanja 8 CORE,mislim če bi zadevo lepo optimizirali z tem patchom balanc nek lep kje da se limajo kje razlimajo bi bil avređ performanc 5-15% boljši v določenih scenarijih....
tako se stopnjuje v + in - ....
Windows trenutno vsako thread obdeluje kot jedro,ker neve za module in z mask 55 aka patch v določenih scenarijih če bi pravilno šaltalo bi bilo 5-15% boosta
in če prav zračunaš so scori z masko ( ki v tstih ki krožijo ponetu ni uporabjena ) večji med 12 in 24 % in to za BD1 B2 !!
Zgodovina sprememb…
- spremenilo: x45 ()
Brane2 ::
Z tole masko je takole
Več modulov ko spneš da delajo eno delo ali manj dela bo razultat rahlo boljši, bo narjeno hitreje a ostalo delo čaka...
Več modulov ko razlepiš narazen lahko več dela na enkrat izvajaš a počasneje in če to še razlepiš v jedra bo še počasneje a še več dela na 1x....
Tole z affinity masko je nepopolna rešitev, ki je Linuxovci niso implementirali, ker so šli v kompletno rešitev. Te si closed source ne more privoščiti, ker pač proizvajalec OS nima vpliva na proizvajalce vseh knjižnic in programov.
On the journey of life, I chose the psycho path.
Zgodovina sprememb…
- spremenil: Brane2 ()
Machiavelli ::
Je do opazil tole
Phenom jedro score 1.0
Fx 1 core 0,75,1 modul score 1.0
Fx 4 modul kot 4 core score 4.0
Fx 4 modul kot 8 core score 6.0
Phenom x6 score 6.0
Se mi zdi da ker varčujejo so phenom x4 jedro razkosal in limal v module,
Varčevanje z 32nm,varčevanje z l2 shared,varčevanje z odpustom uslužbencev itd..
Zaslužek phenom x4 razkosan prodaš za 200eur-250eur not bad...
Phenom jedro score 1.0
Fx 1 core 0,75,1 modul score 1.0
Fx 4 modul kot 4 core score 4.0
Fx 4 modul kot 8 core score 6.0
Phenom x6 score 6.0
Se mi zdi da ker varčujejo so phenom x4 jedro razkosal in limal v module,
Varčevanje z 32nm,varčevanje z l2 shared,varčevanje z odpustom uslužbencev itd..
Zaslužek phenom x4 razkosan prodaš za 200eur-250eur not bad...
Nigaaazz
Brane2 ::
Lej, zdaj počasi postaja jasno, zakaj je šlo pri BD.
Gre za riskanten met, kar pa je pri AMDju v navadi. Morajo reskirat. V teh novih geometrijah je cel cirkus. Vsi rinejo v nove postopke, ki so pa čista loterija. Mogoče bo, mogoče ne in če bo, vprašanje kakšen bo efekt.
Intel si to lahko privošči, ker cel preostanek vesolja, ki bi mogoče šel delat svoj x86 stroj lahko je*e z licencami.Tako ima zaslužke, ki omogočajo to agresivnost.
AMD je moral najti svojo formulo "okrog riti v žep" in ta je morala vzeti v ozir, da se AMD ne more kosati z Intlom v novih postopkih, čeprav mu je blizu. Zasnovali so zadevo, ki je samo prvi korak in ki jo mislijo evoluirati tako kot so od prvega Opterona prišli do Thubana.
In pri optimizaciji je tako, če zadevo v enem področju optimiziraš, jo boš drugje pesimiziral. Glede na to Bulldi ni slab, mislim kot zasnova.
Jedro ima vse poggoje da ob optimizirani kodi gate trga "za male pare". Delo compilerja je pač ceneje od silicija, kar se lepo vidi.
Če hočeš dobrega Intla, ki BDja VEDNO ujame, tudi v optimalnih področjih, trga pa gate tudi izven, ti bo gate raztrgala tudi njegova cena.
Glede na to se mi zdi zasnova fajn. Pričakujem pa, da me bodo nehali nategovati s prodajanjem enega modula kot dveh celih polnovrednih coreov.
In pa, da bom dobil vsaj ekvivalent Thubana- recimo šestmodulni čip. Tudi če bo na račun mogoče manj L3...
Pravzaprav bi bilo lepo videt dva zlimana die-a v eni pakungi. Recimo BD2- z 4 ali 6 moduli na enem, na drugem pa kak soliden naslednik HD6950 Oba povezana načipu preko posebej širokega in hitrega HT linka. pa 1GB RAMa, vse skupaj za eno podnožje. Nekakšen Mega-Trinity...
Gre za riskanten met, kar pa je pri AMDju v navadi. Morajo reskirat. V teh novih geometrijah je cel cirkus. Vsi rinejo v nove postopke, ki so pa čista loterija. Mogoče bo, mogoče ne in če bo, vprašanje kakšen bo efekt.
Intel si to lahko privošči, ker cel preostanek vesolja, ki bi mogoče šel delat svoj x86 stroj lahko je*e z licencami.Tako ima zaslužke, ki omogočajo to agresivnost.
AMD je moral najti svojo formulo "okrog riti v žep" in ta je morala vzeti v ozir, da se AMD ne more kosati z Intlom v novih postopkih, čeprav mu je blizu. Zasnovali so zadevo, ki je samo prvi korak in ki jo mislijo evoluirati tako kot so od prvega Opterona prišli do Thubana.
In pri optimizaciji je tako, če zadevo v enem področju optimiziraš, jo boš drugje pesimiziral. Glede na to Bulldi ni slab, mislim kot zasnova.
Jedro ima vse poggoje da ob optimizirani kodi gate trga "za male pare". Delo compilerja je pač ceneje od silicija, kar se lepo vidi.
Če hočeš dobrega Intla, ki BDja VEDNO ujame, tudi v optimalnih področjih, trga pa gate tudi izven, ti bo gate raztrgala tudi njegova cena.
Glede na to se mi zdi zasnova fajn. Pričakujem pa, da me bodo nehali nategovati s prodajanjem enega modula kot dveh celih polnovrednih coreov.
In pa, da bom dobil vsaj ekvivalent Thubana- recimo šestmodulni čip. Tudi če bo na račun mogoče manj L3...
Pravzaprav bi bilo lepo videt dva zlimana die-a v eni pakungi. Recimo BD2- z 4 ali 6 moduli na enem, na drugem pa kak soliden naslednik HD6950 Oba povezana načipu preko posebej širokega in hitrega HT linka. pa 1GB RAMa, vse skupaj za eno podnožje. Nekakšen Mega-Trinity...
On the journey of life, I chose the psycho path.
Rippy ::
Ta modularni pristop je sicer fajn ampak akhitektura niti ni. Je zelo zmogljiva ampak potrebuje skoraj laboratorijske pogoje (in workload), da ni nekje bottleneck. Čim pridemo v "real world" ne bo nikoli dosegla svoj potencjal pa naj se še tako trudijo z optimizacijami.
Brane2 ::
Ne bi reku. AMD v glavnem cilja na serverski trg, tam pa pogoje lahko upenališ. Ravno tkao pri zahtevnih simulacijah itd.
Tudi na Linuxu bi stvar morala sekati.
Poleg tega, x86 kot tak ne bo šel nikamor več. S temi tranzistorji bo x86 laufal tako kot laufa danes več ali manj, kar se unithread performansa tiče. Poglej, v kaj se je spustil Intel s Sandyjem-E, da je dosegel za odtenek boljši rezultat.
Če se pa gremo paralelizacijo itd, potem je zadosti začetni korak stroj, ki je približno raven današnjim v normalnih pogojih in ki trga v paralelnih zadevah. BD je tak kot je skoraj tam. Matra ga prevelika poraba in nek očiten "zajeb u koracima", ki bo uštiman s Piledriverjem, če ne prej.
Tudi na Linuxu bi stvar morala sekati.
Poleg tega, x86 kot tak ne bo šel nikamor več. S temi tranzistorji bo x86 laufal tako kot laufa danes več ali manj, kar se unithread performansa tiče. Poglej, v kaj se je spustil Intel s Sandyjem-E, da je dosegel za odtenek boljši rezultat.
Če se pa gremo paralelizacijo itd, potem je zadosti začetni korak stroj, ki je približno raven današnjim v normalnih pogojih in ki trga v paralelnih zadevah. BD je tak kot je skoraj tam. Matra ga prevelika poraba in nek očiten "zajeb u koracima", ki bo uštiman s Piledriverjem, če ne prej.
On the journey of life, I chose the psycho path.
Machiavelli ::
Pipa v procu je predouga al pregloboka,latence so previsoke,performanc na core je slab...3-4leta nazaj mogoče je bila to inovacija...
Nigaaazz
jest10 ::
Machiavelli, inovacija je. Samo žal izvedba malo peša, ter cenovna umestitev ni primerna zmogljivosti.
Tej seriji morajo konkretno spustiti ceno, novo pa dobro pokrpati.
Tej seriji morajo konkretno spustiti ceno, novo pa dobro pokrpati.
Machiavelli ::
fx8170 B3 199eur
fx8150 150eur
fx8120 130eur
fx6100 100eur
fx4100 80eur
fx2100 60eur
fx8150 150eur
fx8120 130eur
fx6100 100eur
fx4100 80eur
fx2100 60eur
Nigaaazz
Tarzan ::
Imam občutek, da se bosta tokrat oba playerja vrgla v daljšanje pipelinov. Mogoče z integrirano grafiko zadeva pride lahko bolj do izraza.
Brane2 ::
Mam soliden občutek, da se bo Phenomova zgodba ponovila.
Če se ne motim, sem bil prvi, ki je ubodel Ph1 tu in ugotovil,d a gre za v osnovi solidno a nespolirano idejo.
In da je bil Ph2 ohoho korak naprej.
Le da tle nisem šel v nakup. ker ob trenutnih problemih nimam časa za to.
@Machiavelli:
Ja, tiste cene se zdijo bolj realne.
Če se ne motim, sem bil prvi, ki je ubodel Ph1 tu in ugotovil,d a gre za v osnovi solidno a nespolirano idejo.
In da je bil Ph2 ohoho korak naprej.
Le da tle nisem šel v nakup. ker ob trenutnih problemih nimam časa za to.
@Machiavelli:
Ja, tiste cene se zdijo bolj realne.
On the journey of life, I chose the psycho path.
Jst ::
zgolj s tole masko je score višji za 10 do 20% kot pravijo:
http://techreport.com/articles.x/21865/2
Ajoj. Tole sem jaz govoril, še preden so se spomnili testirati in dati na internet. Poglej datume mojih postov ter datume teh benchmarkov...
---
>Gre za riskanten met [BD], kar pa je pri AMDju v navadi.
Se strinjam in upam, da se bo tale osnova izkazala za dobro idejo v prihodnosti.
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|
Machiavelli ::
Nč pol q3-q4 2012 za božička ARM platforma :D
AMD+ATI Fusion
AMD
ATI
ARM
Trinity
?
AMD+ATI Fusion
AMD
ATI
ARM
Trinity
?
Nigaaazz
Zgodovina sprememb…
- spremenil: Machiavelli ()
deadbeef ::
AMD's Bulldozer server benchmarks are here, and they're a catastrophe
http://arstechnica.com/business/news/20...
http://arstechnica.com/business/news/20...
Machiavelli ::
Pa dobro no..ni lih tolk horror glede na to da je to šele kaj 3-4 revizija proca....
Samo cena-performanc je mimo...
cena bi morala biti bistveno nižja performanc pa niha učasih enak učasih slab učasih boljši od prejšne generacije....
ko pa gledaš povprečje paje prejšna generacija močnejša in varčnejša lol
Samo cena-performanc je mimo...
cena bi morala biti bistveno nižja performanc pa niha učasih enak učasih slab učasih boljši od prejšne generacije....
ko pa gledaš povprečje paje prejšna generacija močnejša in varčnejša lol
Nigaaazz
Machiavelli ::
Danes sem dobil B3 revizijo FX serije Prilagam osebne slike Premierno !! :D
Mal smeha neškodi kaj ? :D
Mal smeha neškodi kaj ? :D
Nigaaazz
Dr_M ::
Psihiater vaju klice.
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.
Machiavelli ::
Mogoče se pa z FX om da obsevat rakave bolnike ? Dobra ideja bom prašu psihijatra xD
Nigaaazz
Dr_M ::
Mogoce bi lohk pozdravu tvoj tumor na...hm..pac tumor v tvoji glavi.
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.
Zgodovina sprememb…
- spremenil: Dr_M ()
eieieie1 ::
Haha, smo pa mal živčni? :D
@x45
Kaj je point tega, da lepiš en test, kjer je AMD boljši, če pa je v vseh ostalih testih na tej strani slabši? Res te ne razumem. To vbistvu delaš pri vsakem AMD procesorju...
@x45
Kaj je point tega, da lepiš en test, kjer je AMD boljši, če pa je v vseh ostalih testih na tej strani slabši? Res te ne razumem. To vbistvu delaš pri vsakem AMD procesorju...
Zgodovina sprememb…
- spremenil: eieieie1 ()