AnandTech - Na 22. konferenci Hot Chips, katera vsako leto poteka na Stanfordski univerzi, je AMD razkril nekaj podrobnosti o zasnovi njegovih prihajajočih procesorjev. Pri Anandtechu so spisali obširen članek na to temo.
Naj ponovimo, AMD pripravlja nove procesorje za vse tri segmente trga (low end/low power, mainstream, high end), temelječe na arhitekturah Bobcat, Llano in Bulldozer. Kjer bo Lliano le derivat obstoječega Phenoma II, so pri preostalih dveh AMDjevi inženirji konkretno zavihali rokave.
Bobcat - Atom s podporo dinamičnemu razvrščanju ukazov
Zaradi želje po zmanjšanju porabe energije je bil Atom prvi Intelov procesor po P6, ki ni podpiral neurejenega izvajanja ukazov, čeprav omenjena tehnika zaradi izogibanja podatkovnim nevarnostnim zmanjša zastoje v cevovodu in posledično precej pripomore k zmogljivosti stroja.
AMD želi z vpeljavo te tehnike v svoje nizko energijske procesorje zmanjšati razlike v zmogljivosti netbook/nettop računalnikov in njihovimi polnokrvnimi brati, oziroma izboljšati razmerje med zmogljivostjo in porabo energije, s tem pa predstavlja konkurenco tudi Intelovim CULV procesorjem. Glede na to, da so ostali detajli mikroarhitekture (z izjemo več nitnosti, katere Bobcat jedro ne podpira, in implementacije preimenovanja registrov na bolj energijsko varčen način) skupaj s taktom procesorja identični Atomu, lahko pričakujemo opazen dvig zmogljivosti.
Bobcat bo za razliko od Atoma naprodaj le v integrirani obliki, na silicijevi rezini pa bo vedno še grafično jedro. Prvo manifestacijo nove arhitekture bo tako predstavljal Ontario, kateri bo vseboval dve Bobcat jedri, podrobnosti o grafičnem jedru pa ostajajo še skrite. Izdelan bo v 40nm tehniki (Atomi so izdelani v 45nm) in bo tako TSMCjev prvi x86 procesor, dobavljiv pa naj bi bili okrog novega leta.
Buldožer
Bulldozer prinaša veliko novost na področju simultanega izvajanja več (če smo natančni dveh) niti na enem procesorskem jedru. Namesto enega razvrščevalnika in izvršilne enote za celoštevilčne operacije in enega razvrščevalnika in izvršilne enote za operacije v plavajoči vejici (kar AMD poimenuje tudi celoštevilčno jedro in jedro za delo s plavajočo vejico), ima Bulldozer eno celoštevilčno jedro več. AMD trdi, da so na ta način relativno malo povečali velikost ene sredice (+12%), ampak konkretno pripomogli k hitrosti izvajanja dveh niti hkrati (seveda se predpostavlja, da uporabnik izvaja večji delež celoštevilčnih operacij).
Vsako celoštevilčno jedro bo imelo po 16 KB lastnega L1 predpomnilnika, dvo vhodna enota za delo s plavajočo vejico pa bo lahko brala podatke z obeh. Vsa tri "jedra" si bodo delila skupen L2 predpomnilnik. Razlike v mikroarhitekturi bodo še daljši cevovod, posledično izboljšano napovedovanje skokov in agresivnejši vnaprejšni bralnik ukazov.
Končni izdelki bodo vsebovali od 1 do 4 takšna jedra in bodo klasificirani kot 4 do 8 jedrniki. Poleg tega bodo novi procesorji vsebovali ekvivalent Intelovemu Turbo Boostu, ki omogoča izklop posameznih jeder (torej parov jeder po standardni klasifikaciji) v aplikacijah z nizko stopnjo paralelnosti in dvig takta preostalih jeder. Datuma izida Buldožerja s strani AMDja ni bilo, se pa špekulira da bo to enkrat poleti 2011. Procesorji bodo izdelani v 32nm tehnologiji.
Tole ni prepozno,ki je še tako daleč,kaj bo še vse do takrat.Še Intel bo predstavu dva nova podnožja,gor pa dal iste proce kot zdej sam mal imena bo popravu
Stare novice to so že 22.8 predstavili na konferenci. Meni je zanimivo le to, da bodo bobcata proizvajali pri TSMC in ne pri global foundries. Najverjetneje skušajo celotne njihove kapacitete prišparati za buldozer platformo. To bo idealna kombinacija zame; boldozer za na mizotorej za konkretno delo in večjederni cortex A9 za na kolena =) Le da bo cena pri obeh konkurenčna, ter podpora Linuxu odlična!
@desperados, to da proizvajajo pri TSMC, je vzrok v tem, da ATIjeve grafične kartice je vedno proizvajal TSMC in tudi trenutno arhitektura grafičnih kartic ni kompatibilna z Global Foundries proizvodnjim procesom. Torej lahko bojo obstoječo arhitekturo uporabili, drugače bi morali novo zasnovati. Kar sem sicer mislil, da z 6xxx serijo tudi bojo naredili, ampak zgleda, da bodo vztrajali pri TSMC.
Stare novice to so že 22.8 predstavili na konferenci. Meni je zanimivo le to, da bodo bobcata proizvajali pri TSMC in ne pri global foundries. Najverjetneje skušajo celotne njihove kapacitete prišparati za buldozer platformo. To bo idealna kombinacija zame; boldozer za na mizotorej za konkretno delo in večjederni cortex A9 za na kolena =) Le da bo cena pri obeh konkurenčna, ter podpora Linuxu odlična!
Koliko vem, Global Foundries ne proizvaja 40 nm čipov, tako da ostane "le" TSMC.
Tapeout se je že zgodil sredi Q2, na 32nm gredo v Q4, torej je možno, da bodo strežniški buldožerji na policah že maja oz. junija 2011, za desktop pa verjetno septembra.
Končni izdelki bodo vsebovali od 1 do 4 takšna jedra in bodo klasificirani kot 4 do 8 jedrniki.
Verjetno si mislil 2 do 8 jedrniki?
Glede na to kaj prikazujejo slike, niso naredili nekega konkretnega čudeža, ki bi na eno INT jedro (ne modul) pohitril število operacij. Če niso razširili in zoptimizirali še česa, kar iz teh slik in teksta ni vidno, bo tole bolj bogo. Glede na to, da naj bi bil buldožer na novo načrtovan od temeljev upajmo da ima res kakšne skrite adute. Je pa res, da so zgruntali dvonitnost ob samo 12% povečanju modula, kar je precejšen dosežek. Zanima me kako bodo zadevo na koncu prodajali, kot dvojedernik s štirimi nitmi, ali kot štirijedernik?
Meni po vseh teh razlagah o bulldožerju ni čisto jasno, v čem naj bi bila njegova bistvena prednost in kako naj bi to laufalo.
A je tista slikca zamenjava za en ali dva klasična corea ?
Če je za enega ( in bom v novem čipu kot quad-core zamenjavo dobil 4 take) potem fajn, če je za dve, potem se sprašujem čemu trud,saj boš bolj ali manj na istem, če ne slabšem...
Kolk so z to arhitekturo ustvarl dober razmerje hitrost/število tranzistorjev ne moreš iz arhitekturnega opisa videt, to pač moraš teste počakat. Lahko pa vidiš iz tega opisa, da bo vse sodobne stvari imel notri vključene, ter da bo v 32nm. Iz tega pa lahko sklepaš, da bo ta razmerja kar dober.
Kolikor je meni znano, želijo oba nova CPUja naresti čim višje frekvenčna, še posebaj buldožer.
@Brane2, JohanP
Prednost obeh naj bi bila v ezy (cheap) izdelavi, mali porabi, visokih frekvencah. Buldožer izumlja še tisto +1/2 jedra zadevo, pa prefetching so baje porihtal (hitrejši predpomnilnik).
Prednost obeh naj bi bila v ezy (cheap) izdelavi, mali porabi, visokih frekvencah. Buldožer izumlja še tisto +1/2 jedra zadevo, pa prefetching so baje porihtal (hitrejši predpomnilnik).
Eh, to je marketing Bullshit. Saj tudi Phenom je "brez težav delal na 3GHz", potem pa je bilo potrebno več kot leto in Phenom II, da so prišli na to mukoma.
Kar se prefetchinga tiče, ta pri Phenomu nikoli ni bil slab- prav lepo je delal.
Bo treba počakat,d a se razkadi Bullshit in vidimo, kaj dejanjsko je na stvari.
Kaj vam ni jasno buldožer bo osem jedernik z naprednim Hyper trejdingom v še manjšem procesu, torej 8x2=16niti napredni HT pomeni da nuca samo takrat ko je to potrebno ko ni varčuje,ko pa obremeniš eno ali več jeder na pouno pa začne delit preko pipc na druga jedra.Poleg tega bo kompaktibilno z 7xx in 8xx chipseti v kolikor so am3,dual chanel ddr3 in v kolikor bo proizvajalec dal podporo v biosu.Podpiral bo tako dual kot quad chanell, quad chanel bo na novih ploščah skupaj z izidom novih buldotou.Amd nezamuja z igro vse je znano bilo že kar dougo časa in obstoječi phenomi x6 so kar dobri za p/p tako da naslednja zadeva od amdja zna biti celo konkurenčna q2 2011 veliko novosti bo...
zoom ne :D Bo 4-jedrnik z naprednim HT-jem, torej fejk 8-jedrnik :D
Pa learn to read, je bila novica da prihaja novo podnožje ;) Pa (na desktopu) quad channela ne bo, razen če misliš kupovati serverske plate in Opterone. Geez, koliko natolcevanja, podrptega s pomanjkanjem kakršnekoli oblike :D
zoom ne :D Bo 4-jedrnik z naprednim HT-jem, torej fejk 8-jedrnik :D
Pa learn to read, je bila novica da prihaja novo podnožje ;) Pa (na desktopu) quad channela ne bo, razen če misliš kupovati serverske plate in Opterone. Geez, koliko natolcevanja, podrptega s pomanjkanjem kakršnekoli oblike :D
Bulldozer-based implementations built on 32nm SOI with HKMG are scheduled to arrive in 2011 for both servers and desktops, as the 16-core Opteron processor codenamed Interlagos and as the 4- or 8-core desktop processor codenamed Zambezi.[4] Buldo arhitektura,Orchi zasnova na Buldotu, ime Zambezi ,Zambezi je 4jedernik z htjom=8"jeder" ali pa 8jedrou z htjom =16"jeder" .da nebi skakali direkt na 16 tredio bo Zambezi baje tudi v izdaji 6jedernika z htjom torej = 12"jeder" :)
Pa še to koji Hase je to prevaju pa dal toto novico??
realno je tko : Here is what we know for sure about the upcoming Orochi processor: it is going to be the second 32nm product from AMD after the upcoming Llano Fusion core is built, it uses a set of 4 Bulldozer modules that bring 8 processing cores and 8 threads with integration of AMD's unique SMT alternative. Torej 4je moduli z 8jeder ki imajo še Napredni ht 8x2=16 nwm v čem je blem :)
Pa še to koji Hase je to prevaju pa dal toto novico??
realno je tko : Here is what we know for sure about the upcoming Orochi processor: it is going to be the second 32nm product from AMD after the upcoming Llano Fusion core is built, it uses a set of 4 Bulldozer modules that bring 8 processing cores and 8 threads with integration of AMD's unique SMT alternative. Torej 4je moduli z 8jeder ki imajo še Napredni ht 8x2=16 nwm v čem je blem :)
Sam dobro moraš prebrati lol. 4 moduli so 4 dejanska jedra toliko jih bo max imel desktop. In teh 4 jeder je v bistvu 8 threading jeder.
Pa še to koji Hase je to prevaju pa dal toto novico??
realno je tko : Here is what we know for sure about the upcoming Orochi processor: it is going to be the second 32nm product from AMD after the upcoming Llano Fusion core is built, it uses a set of 4 Bulldozer modules that bring 8 processing cores and 8 threads with integration of AMD's unique SMT alternative. Torej 4je moduli z 8jeder ki imajo še Napredni ht 8x2=16 nwm v čem je blem :)
Sam dobro moraš prebrati lol. 4 moduli so 4 dejanska jedra toliko jih bo max imel desktop. In teh 4 jeder je v bistvu 8 threading jeder.
Nemešaj HTja z dejanskimi jedri !
The first products will be 4 unit processors with EIGHT LOGICAL cores.!! ( On the server side we will see products use multiple Bulldozer dies to achieve up to 16 logical cores.)
Kakor vemo logična jedra so dejanska fizična mar ne?? + ht posebi ?
No kakorkoli že če mi do zna odgovorit,?
Nwm zakaj bi mešali drek zdaj ima AMD x6 ki je "enak" intelu x4/8,zakaj bi bil produkt x4/8 za high end market? x6/12 ali x8/16 se zdi bolj logično mar ne? ker niti niso enake kot surovo jedro rabimo 2 surova jedra z HTjom da bi dobili moč tretjega surovega .... pač na grobo povedano...torej x6= x4/8 nwm no pojasnitve rabim...
Ne logično jedro je skoraj protipomenka od fizično jedro, pač logično v računalniškem slovarju pomeni kako se hardware navzven predstavi, kako delujejo logika sistema. in navzven bo en tak modul viden res kot 2 jedrnik, čeprav gre dejansko za eno jedro z dvemi nitni.
Pač isto bo kot intel jao, sam drugače poimenovan. Maš i7 920 z 4/8, prav tako bo buldožer desktop 4/8, medtem ko server bo vse do 8/16.
No v bistvu je ta modul ene vrsta mešanica fizičnih dveh jeder in fizičnega enega jedra. Ampak večino stvari bosta imela skupnega obe logični jedri, imela pa bosta kar svoj L1 cache naprimer. Ampak če imata 90% vsega skupnega temu ne moremo upravičeno reči kar 2 jedri.
Ne logično jedro je skoraj protipomenka od fizično jedro, pač logično v računalniškem slovarju pomeni kako se hardware navzven predstavi, kako delujejo logika sistema. in navzven bo en tak modul viden res kot 2 jedrnik, čeprav gre dejansko za eno jedro z dvemi nitni.
Pač isto bo kot intel jao, sam drugače poimenovan. Maš i7 920 z 4/8, prav tako bo buldožer desktop 4/8, medtem ko server bo vse do 8/16.
No v bistvu je ta modul ene vrsta mešanica fizičnih dveh jeder in fizičnega enega jedra. Ampak večino stvari bosta imela skupnega obe logični jedri, imela pa bosta kar svoj L1 cache naprimer. Ampak če imata 90% vsega skupnega temu ne moremo upravičeno reči kar 2 jedri.
No tu se strinjam,ampak amd x6 vs amd x4/8 se mi zdi da bo nova serija le 5-10% hitrejša in 30% izboljšana od obstoječe ampak na drugi strani nekako ni logično izdajat x4/8 za high end market ko pa intel beži....
No nekej sem razmišlju in gledu sliko in se mi zdi da je to dejansko 8jedr ki se na 1 modul "dva jedra" pogovarjata na principu htja,in 4je moduli skupaj 8jeder.samo omenjajo da je samo 4jeder od teh pravih torej je lahko 4drugih sintetičnih ampak na svojem posebi mestu,npr pri intelu je skupaj na jedru tu pa posebaj.In sodeč po tej logiki je sintetično jedro ki je posebaj toliko bolj izkoriščeno in pripomore več kot pri intel principu,torej bi to sintetik jedro lahko dalo moč 70-80% moči surovega medtem ko intel princip ht da 40-50% moči surovega.
Intelov HT da 0 do kake 20% pohitritev. In tudi AMDjeva večnitnost ne bo mogla neka revolucije naredit iz teh številk. Na sliki je samo razvrščevalnik ukazov, procesorja sploh ni na sliki, tisto desno je pa Intelov razvrščevalnik. Procesor je pa spodaj, kamor kažejo puščice in je en sam v obeh primerih.
Buldožer modul je sestavljen iz treh delov. Dva dela sta za celoštevilčne operacije. Delujeta neodvisno. Skupni bo del za operacije v plavajoči vejici in SIMD ukaze. Če modulu pravite jedro, se je potrebno zavedati razlike med Intelovim HT in AMD poimenovanjem jeder. Oba lahko izvajata dve niti na enem jedru (modulu). Intel ima iz skupnega razvrševalnika 6 izhodov(3x load/save + 3x računske enote). Nato pa mora eden razvrševalnik ukaze iz dveh niti razvrstiti tako, da najbolj zaposlijo enote. Pri buldožerju pa imata dve celočetevilčni jedri vsak svoj razvrščevalnik. Ima pa še skupni FP razvrševalnik.
Zadeva je toliko drugačna od obstoječih rešitev, da dokler se ne pojavijo testi na različnih tipih aplikacij, je zelo težko karkoli konkretnega govort.
Tukaj so še druge stvari, kot je daljši cevovod in konkretno drugačna pomnilniška hierarhija - Phenom 2 je mel 64kB, 512kB in 6MB (L1, L2, L3), Bager bo mel pa 16kB*2, za L2 se z nekih slik špekulira na 2MB (na modul), za L3 se pa ne ve.
Tukaj so še druge stvari, kot je daljši cevovod in konkretno drugačna pomnilniška hierarhija - Phenom 2 je mel 64kB, 512kB in 6MB (L1, L2, L3), Bager bo mel pa 16kB*2, za L2 se z nekih slik špekulira na 2MB (na modul), za L3 se pa ne ve.
Če manjši L1 implicira na to, da bo vsaj 4-way, potem fajn. En glavobol na Phenomu je bil samo 2-way L1 in nezmožnost ročno prefetchat v željeni nivo predpomnilnika.
važno je da bo hitra mašinca, pa tud če bo 4 x 8 x 16 jeder in treadov :) bo vsaj malce prizemljilo cene i7 procesorjev, mogoče pa se ponovijo časi amd K7 (slotA) ko je bil procesor ~20% hitrejši in cca 20% cenejši, ter je bila zaradi veliekga povpraševanja dobavljivost zelo omejena
Zadeva je toliko drugačna od obstoječih rešitev, da dokler se ne pojavijo testi na različnih tipih aplikacij, je zelo težko karkoli konkretnega govort.
Tukaj so še druge stvari, kot je daljši cevovod in konkretno drugačna pomnilniška hierarhija - Phenom 2 je mel 64kB, 512kB in 6MB (L1, L2, L3), Bager bo mel pa 16kB*2, za L2 se z nekih slik špekulira na 2MB (na modul), za L3 se pa ne ve.
mislm da bo skupen, nism pa ziher (beri Anandtech)
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|
When only one thread is active it has full access to all shared resources.
Če prav razumem: En modul lahko hkrati poganja dve niti. V primeru ene niti, pa le ta izkorišča potencial celotnega modula. torej oba INT jedra za eno nit.
Če je to res + 4x decode + daljše pipice bo zadeva lahko hudo hitra.
berem dalje....
EDIT: Ma pomojem ni tako, deljeni viri so verjetno cache in FP.
Če manjši L1 implicira na to, da bo vsaj 4-way, potem fajn. En glavobol na Phenomu je bil samo 2-way L1 in nezmožnost ročno prefetchat v željeni nivo predpomnilnika.
Za Bobcata je omenjeno tole:
The Bobcat core has a 3-cycle 64KB L1 (32KB instruction + 32KB data cache) that’s 8-way set associative. The L2 cache is a 17-cycle, 512KB 16-way set associative cache.
Pomoje bi mogl bit zelo neumni, da bi potem v buldožerja dali PP z manjšo asociativnostjo.
Pa še to koji Hase je to prevaju pa dal toto novico??
realno je tko : Here is what we know for sure about the upcoming Orochi processor: it is going to be the second 32nm product from AMD after the upcoming Llano Fusion core is built, it uses a set of 4 Bulldozer modules that bring 8 processing cores and 8 threads with integration of AMD's unique SMT alternative. Torej 4je moduli z 8jeder ki imajo še Napredni ht 8x2=16 nwm v čem je blem :)
En modul IMA napredni HT. Torej je ENO jedro z 'naprednim HT-jem', kar da dve niti. Torej štirje moduli dajo 8 threadov, ne 8 jeder in 16 threadov.
Pa je bilo že višje v temi povedano, da bo 8-core Zambezi imel samo 4 module. Marketing pač.
Pa da ti še poboldam, it uses a set of 4 Bulldozer modules that bring 8 processing cores and 8 threads with integration of AMD's unique SMT alternative. Thread je nit ;)
EDIT: ah, so me že prehiteli, parkrat... Zoom pomojem da mal preveč razmišljaš.
Kolikor sem jaz razumel so naredili, da ima 1 modul 2 jedra ki sta sposobna poganjati 4 niti, kar je 4 logični procesorji. Desktop bi naj imel 2 modula server pa 4 in 8 modulov.
Komaj čakam da pride ven če bo cena primerna nabavim takoj.
When you look long into an abyss, the abyss looks into you
1 modul ima dva jedra. 1 modul je sposoben poganjati dve niti. 1 modul se OSu predstavi kot dva jedra.
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|