» »

Cray že ponuja dvojedrne Opterone

Cray že ponuja dvojedrne Opterone

Cray XD1

AnandTech - Te dni se vse novice vrtijo okoli AMD-jeve predstavitve dvojedrnih procesorjev. Kot poroča Anandtech, so strežniški Opteroni iz serije 800 dobavljivi že danes, vašo denarnico pa najcenejši stanjša za 1.512$. Če ne potrebujete štiri procesorskega sistema, bodo po napovedih 21. maja na voljo dvojedrni Opteroni serije 200, namenjeni dvoprocesorskim sistemom. Najcenejši iz te družine, ki bije pri 1.8 GHz, bo stal 851$.

Tudi Cray, širnemu občinstvu poznan kot izdelovalec super računalnikov, je včeraj na svojih spletnih straneh sporočil, da bo z junijem mogoče naročiti izvedenke njihovih sistemov z novimi procesorji.

Sistemi, zgrajeni okrog Opteronov, so bili načrtovani tako, da lahko sprejmejo dvojedrne različice procesorjev. Zmogljivost Cray XD1, ki ga običajno poganja 288 enojedrnih Opteronov 200, pri tem pa zmore 744 gigaflopov, bo z zamenjavo procesorjev narasla na 1.2 teraflopa.

58 komentarjev

«
1
2

Thomas ::

Zanimivo. Za dobrih 50%.

Spc ::

1.2 teraflopa.

8-O

Golden eye ::

kaj je že pomen en flop?! Dej razložte mal da bo folk vedu kok je to kaj hiter >:D :D

Utk ::

floating-point operacije, na sekundo.

gfighter ::

FLOPS - Floating point operations per second - število računskih operacij z plavajočo vejico, ki jih je nek računalnik sposoben obdelati v eni sekundi.
Catapultam habeo. Nisi pecuniam omnem mihi dabis, ad caput saxum immane mittam

Thomas ::

To so take imperialne mere. Podobno kot seženj, klaftra, osem mernikov in podobno.

Jest bi meterski sistem. Koliko bit flipov na sekundo. Se reče, koliko bitov na sekundo je sistem zmožen prižgati ali ugasniti. Tale jih je kakšnih 100 bilijonov. 10^14 bfs. Bitflips.

Tic ::

Lep je.

.
Nekoč bo tudi to.
persona civitas ;>

gfighter ::

Crayi so bili zmerom lepi na pogled, samo doma pa ne verjamem da bo kdaj kdo od nas imel kakšnega:D. Kvečjemu čez 15 let v mobitelu:P.
Catapultam habeo. Nisi pecuniam omnem mihi dabis, ad caput saxum immane mittam

K & K ::

za primerjavo...

koliko je pa kej pentium4ka ali pa amd64 zmogliv?

Thomas ::

Skoraj tisočkrat manj.

BluPhenix ::

Lol bitflip ... kje jih pobiraš.
Koliko bitov je sposoben prižgat v eni sekundi ... lol še enkrat, kaj štejejo tudi periferne naprave, ram vsi pipelini, tudi tisti ki trenutno mečkajo bite, ki bojo v kratkem flushani in za sedanjo operacijo ne štejejo? lol

Za hitrost prižiganja in ugašanja bitov je mera, imenuje se frekvenca, da bi pa štel vse ki se prižigajo in ugašajo, what for? Sej ne vsi sodelujejo v operaciji. Tudi CISC procesor za eno operacijo obrne več bitov kot RISC, pomeni torej da je RISC slabši, počasnejši?

FLOP je kar uredu mera za primerjavo.

Thomas ::

Ja no, bit flip ima mogoče že preveč rezerviran pomen za nehoteno preklapljanje med biti. Ki je pa čedalje redkejše.

Vendar hoteno prižiganje in ugašanje bitov je objektivna mera, koliko smo izračunali po eni strani, po drugi pa je to "krivo" za sipanje toplote, za porabljanje energije.

Recimo bit write/erase per second. To je dobra mera, pomeni pa povsem isto.




BTW - koliko biten pa je flop? 16? 32? 80? 128?

BluPhenix ::

BTW - koliko biten pa je flop? 16? 32? 80? 128?


? Ti bi imel na 32 bitnem CISC procesorju 128 bitne floating point spremenljivke? To bi bilo pa res hitro obračanje podatkov.

Sej ni važno kolko je biten. To je mera koliko operacij s plavajočo vejoco lahko naredi procesor. Če je 32 biten vzaneš 32 bitne operacije, če je pa 8 bitem pa 8 bitne.

Ne vem točno kaj misliš pod hoteno "užiganje" in "ugašanje" tranzistorjev. Tisto ki ga uporebnik hoče, sistem hoče, ali tisto ki ga more izvesti procesor da pravilno deluje z vso periferijo.

Je pa res to, da je od tega koliko preklopov vršijo tranzistorji in koliko so ti preklopi hitri odvisno segrevanje.

Thomas ::

Ja no, moraš vedet, da vsak computing lahko optimiziraš na čas, ali pa na porabljeno energijo.

V splošnem to ni isto.

Termodinamika je osnova vsakega computinga, marketinška latovščina prodajalcev procesorjev in računalnikov pa ni zelo merodajna.

En link.

Pa še en link.

> Sej ni važno kolko je biten

Ene tolk, kot katero miljo uporabljaš. Standardno, Angleško, Francosko, morsko ...

:))

BigWhale ::

> Ene tolk, kot katero miljo uporabljaš. Standardno, Angleško,
> Francosko, morsko ...

Ce ne drug, bo pa NASA vedla, das je to se kr pomembna zadeva ;)

Thomas ::

NASA je na BluePhoenix like ošabnost spičila par milijard dolarjev. Ni "važno, kok je bitov, ni važno, kok je metrov".

Morali bi se naučiti kej iz te napake in subito preiti na bit write erase (ali bit flip) nomenklaturo. Potem bomo vsi vedeli, o čem se pogovarjamo.

BluPhenix ::

Ošabnost?

Kaj je ošabnost to, da vem kako hardware-sko deluje procesor in kako se ga naredi? Kolikor sklepam iz tvojih postov tebi ni preveč jasno kako delujejo procesorji na hardverskem nivoju, čemu služijo kateri sestavni deli. Ti kot ponavadi nabijaš neko teorijo ki jo kao obvladaš in se vedeš kot da veš več kot ostali. No, sprijazni se že enkrat da ni tako...

Nehaj žaliti in "osebno napadati" ljudi, ki se ne strinjajo s tabo, ne obvladaš vsega. Ne delaj se pametnega na področjih katerih ne poznaš osnov.

Thomas, v mikroprocesorskih krogih se je primla ena precej uporabna mera - MIPS. Veš kaj to je? Je precej uporabna zadeva, ki lepo pove zmogljivost procesorja.

Thomas si štekal zakaj sem napisal ni važno kolko je bitov?

Morali bi se naučiti kej iz te napake in subito preiti na bit write erase (ali bit flip) nomenklaturo. Potem bomo vsi vedeli, o čem se pogovarjamo.


Kaj je to bit write/erase po tvoje, kateri write/erase bomo gledali, jedra procesorja, periferije, pomnilnika (flash ali eeprom?)... kot sem že napisal je FLOP čisto uredu primerjalna mera, med drugim zato, ker lahko z njo primerjaš različne arhitekture med seboj.
Po tvoji logiki bi bil boljši procesor, ki bi za seštevek dveh števil moral premetati več bitov, da bi dobil rezultat?

Kje si pa našel skovanko bit-flip? Jaz o čem takem v 5 letih na FE še nisem slišal, pa tudi v vsej literaturi, ki sem jo prebral ne. Al je to neka nova marketing oznaka?

OwcA ::

Dokler nek (touringov) računski stroj obravnavamo povsem abstraktno je spreminjanje enega bita (bodisi na enoto časa, bodisi energije) povsem smiselna mera, ker so le-ti osnovna enota v informacijski teoriji.

Kdaj in v kakšni meri je to praktično, je pa druga stvar.
Otroška radovednost - gonilo napredka.

Thomas ::

> Kaj je to bit write/erase po tvoje

To je takrat, ko v registru procesorja ena 1 postane 0 ali pa ko ena 0 postane 1.

To je takrat, ko se to isto zgodi v RAMu, ali kadarkoli na poti iz procesorja v RAM ali nazaj.

Kaj hudiča ti tukaj ni jasno?

> Thomas, v mikroprocesorskih krogih se je primla ena precej uporabna mera - MIPS. Veš kaj to je?

Seveda da vem. Million Operations Per Second. Ampak je isti drek. Koliko bitne inštrukcije so, o katerih se pogovarjamo?

> kot sem že napisal je FLOP čisto uredu primerjalna mera

Ti si to že napisal, hkrati pa ne znaš povedati, na koliko bitnih številih se te floating point operacije vršijo. Jest pravim, da nikakor ni vseeno če na 32 ali na 128, naprimer.

> Po tvoji logiki bi bil boljši procesor, ki bi za seštevek dveh števil moral premetati več bitov, da bi dobil rezultat?

Odvisno, na kaj imamo optimiziran procesor. Če ga imamo na čas, se večkrat splača angažirati več tega bit write erasea. Če pa na energijo (minimalno možno porabo energije), potem pa naj se zamenja čimmanj bitov, ker se pri preklapljanju porablja energija.

> Kje si pa našel skovanko bit-flip? Jaz o čem takem v 5 letih na FE še nisem slišal

I don't care.

Na, mau preber.

Ireverzibilni computing vedno zahteva pretvarjanje energije v toploto. Tako v osnovi delujejo vsi naši računalniki, pa ti rečeš kar hočeš.

Thomas ::

Sicer pa da ne bi kdo reku, da MIPSov samo jest ne maram, pa da sem se to izmislil ...

Link.

MIPS is a Misleading Indicator of Processor Speed


Kdor malo misli s svojo glavo, temu hitro pritrdi. Ma kje so že MIPS testi. Zgodovina stara.

Flopsi so pa ista figa, ista.

BluPhenix ::

Če pa na energijo (minimalno možno porabo energije), potem pa naj se zamenja čimmanj bitov, ker se pri preklapljanju porablja energija.

Porablja energija? Zakaj in kako, če že tako obvladaš...

Seveda da vem. Million Operations Per Second. Ampak je isti drek. Koliko bitne inštrukcije so, o katerih se pogovarjamo?

Kaj ima veze kolko so bitne inštrukcije, sedaj pa mi res to razloži, ker me prav zanima tvoja razlaga kako si to predstavljaš.

Odvisno, na kaj imamo optimiziran procesor. Če ga imamo na čas, se večkrat splača angažirati več tega bit write erasea.

Zakaj se splača uporabiti več tega write erasea? Skozi več logičnih elementov kot gre signal, daljša je zakasnitev.? Je al ni tako?

Ti si to že napisal, hkrati pa ne znaš povedati, na koliko bitnih številih se te floating point operacije vršijo. Jest pravim, da nikakor ni vseeno če na 32 ali na 128, naprimer.

To sem ti že napisal, če se ti ne da brat ni moj problem. Če ne razumeš pa sploh.

Flopsi so pa ista figa, ista.

A in bit-flipi niso. U ta procesor naredi 10^6 bitflipov na sekundo, ampak kaj ko jih le 1/100 uporabi za inštrukcije ... lol

Ireverzibilni computing vedno zahteva pretvarjanje energije v toploto. Tako v osnovi delujejo vsi naši računalniki, pa ti rečeš kar hočeš.

Kje sem pa jaz rekel, da računalniki ne proizvajajo toplote?

Thomas ::

> Porablja energija? Zakaj in kako, če že tako obvladaš...

Preprosto zato, ker moraš dovesti delo, če hočeš spremeniti stanje bita. Če ne bi bilo treba, bi se spreminjala kar sama od sebe, zadeva bi bila nestabilna in neuporabna. Ta energija, dovodena za preklop se potem spremeni v toploto. Zaradi upornosti vodnikov, recimo.

> Kaj ima veze kolko so bitne inštrukcije, sedaj pa mi res to razloži, ker me prav zanima tvoja razlaga kako si to predstavljaš.

Če bi bilo vseeno, koliko (32 ali 128) bitne so, potem bi lahko pri 128 bitnih prešvercal v kodi štiri 32 bitne inštrukcije in bi nenadoma imel 4 krat toliko MIPSOV. Poleg tega so različne inštrukcije različno hitre. Pri seštevanju imaš takoj več MIPSov kot pri množenju. Ampak spet odvisno od procesorja in MIPSi ne dajo primerljivih rezultatov.

To ve vsak otrok.

> Zakaj se splača uporabiti več tega write erasea? Skozi več logičnih elementov kot gre signal, daljša je zakasnitev.? Je al ni tako?

Ni tako enostavno. Cela množica različnih možnih vrat je, ki nekaj zmnožijo. Nikakor niso ne energetsko in ne časovno enakovredne. Nekatere najhitrejše so energetsko požrešne.

> To sem ti že napisal, če se ti ne da brat ni moj problem. Če ne razumeš pa sploh.

Ti ne razumeš. Zate so Flopsi sveti, ne glede nad koliko biti operirajo. V isti zmoti si bil (in si po moje še) pri MIPSih.

> A in bit-flipi niso. U ta procesor naredi 10^6 bitflipov na sekundo, ampak kaj ko jih le 1/100 uporabi za inštrukcije ... lol

Ne, bit flipsi pa niso. Link.

No material system whether artificial or living can compute more than 2 x 10e47 bits per second and per gram of its mass.


Vidiš, zares štejejo samo biti, koliko jih (lahko) premečeš na sekundo.

> Kje sem pa jaz rekel, da računalniki ne proizvajajo toplote?

Ja. Ampak proizvajajo jo pri ireverzibilnem computingu predvsem zato in toliko, kolikor ugasnejo in prižgejo bitov. To ti ni jasno.

BluPhenix ::

No, da pogledamo:

Preprosto zato, ker moraš dovesti delo, če hočeš spremeniti stanje bita. Če ne bi bilo treba, bi se spreminjala kar sama od sebe, zadeva bi bila nestabilna in neuporabna. Ta energija, dovodena za preklop se potem spremeni v toploto. Zaradi upornosti vodnikov, recimo.


Moraš dovesti delo, da spremeniš stanje bita, ja, recimo. V bistvu ne spreminjaš stanja bita, ampak odpiraš in zapiraš tranzistorje, ne vem če si to predstavljaš. Če nebi bilo treba bi se zadeva spreminjala sama od sebe in bila nestabilna? Če ti tranzistorju ne daš pozitivne (n-kanalni) napetosti na gate, se ne spremeni nič. Nič ni nestabilno, lepo stabilno miruje zaprt. V toploto se ne spremeni energija dovedena za preklop, zaradi upornosti vodnikov. Kot verjetno veš, se proizvaja toplota le, med preklopi, vendar ne vem če veš zakaj tako. Na kratko, ker je le med preklopom na tranzistorju odprta pot med Vdd in Vss. Če narediš tako tranzistorsko vezje, da med preklopi ni odprte poti med Vdd in Vss, se bo proizvedlo nič toplote. Obstajajo vezave (complementary MOSFET), ki to stvar omilijo, vendar se je v realnosti ne da odpraviti. Toplota pa se proizvede večinoma zaradi upornosti kanala.

Če bi bilo vseeno, koliko (32 ali 128) bitne so, potem bi lahko pri 128 bitnih prešvercal v kodi štiri 32 bitne inštrukcije in bi nenadoma imel 4 krat toliko MIPSOV. Poleg tega so različne inštrukcije različno hitre.


Inštrukcije ne moreš tako prešvercat (če bi ti bilo jasno kako se inštrukcije izvajajo nekaj takega nebi mogel blekniti), se pa da to z podatki. Glej ga zlomka, tudi to se dela. Večinoma to foro uporabljajo DSPji, za računanje FFT. Imaš 32 bitno operacijo za z transform. Če ne uporabljaš kompleksnega FFT lahko teh 32 bitov uporabiš za dve 16 bit realni vrednosti.

Seveda različne inštrukcije so različno dolge, na CISC procesorjih. Na RISC pa vsaka inštrukcija traja natančno enako, en urin cikel. Zaradi tega je pri RISC procesorjih MIPS enostvno izračunati, je enak frekvenci delovanja procesorja. Pri CISC pa lahko ena inštrukcija porabi tudi do 6 ciklov, zaradi tega je št. MIPSov odvisno od programa, tako kot je pisalo v tvojem linku.

Ni tako enostavno. Cela množica različnih možnih vrat je, ki nekaj zmnožijo. Nikakor niso ne energetsko in ne časovno enakovredne. Nekatere najhitrejše so energetsko požrešne.


Cela množica nekih vrat ki nekaj zmnožijo ... Nekatere najhitrejše so seveda lahko energetsko požrešnejše. Nisi mi pa odgovoril na moje vprašanje.

Zame niso FLOPsi sveti, to si si ti izmislil jaz sem napisal le da so čisto uredu za primerjave med sistemi. MIPSi niso uredu ko gre za primerjave CISC RISC procesorjev, ko pa primerjaš RISC procesorje so čisto na mestu.

Ja. Ampak proizvajajo jo pri ireverzibilnem computingu predvsem zato in toliko, kolikor ugasnejo in prižgejo bitov. To ti ni jasno.


Meni je popolnoma jasno kaj in zakaj proizvaja toploto v čipih ne se bat. tebi ne vem če je. Bo treba prijet v roke kakšno knjigo o digitalnih integriranih vezjih in potem se delati pametnega.

V tvojem linku ni bilo nič takega, kar bi prikazalo to, da le biti štejejo. Je pač neka zgornja meja, ki je fizikalno nepremostljiva.

Thomas ::

> V bistvu ne spreminjaš stanja bita

Dost te mam. Pojma nimaš. Seveda spreminjaš stanje bitov.

> Inštrukcije ne moreš tako prešvercat

Seveda, da jo lahko. Ko zORaš nekaj 128 bitnega, si zORal štiri 32 bitne vrednosti.

Pojma nimaš, dost te mam.

BluPhenix ::

Ne, Thomas ti nimaš pojma. Sploh se mi ne da ukvarjat več s tabo, preberi kakšno stvar in potem se hvali in pametuj. Dokler pa ne boš poznal niti osnov, pa ni treba da pametuješ v takih temah.

Lahko orješ kolkor ti paše. Inštrukcij ne moreš tako švercat, to govoriš, ker nimaš pojma kakšna je arhitektura procesrjev in kako se inštrukcije v procesorjih izvajajo. Al ti malo zamenjuješ inštrukcije z podatki?
In še malo da te naučim. ORaš ne nikoli veš kot 4 bite hkrati, ker je več kot to nesmiselno delati. Zakaj se mi ne da razlagati.
Tudi če malo pomisliš, če narediš OR med bitoma 31 in 32, pride do napake, oziroma mešanje mšanja med podatki.

Zgodovina sprememb…

Thomas ::

> ORaš ne nikoli veš kot 4 bite hkrati

OMG, kakšna oslarija! Kakšna oslarija!

Thomas ::

> če narediš OR med bitoma 31 in 32, pride do napake, oziroma mešanje mšanja med podatki.

Ma kaj ti sploh govoriš?

v 128 bitnem registru imaš zaporedoma 4 32 bitne vrednosti, ki jih naenkrat poORaš z drugim takim registrom. Ali pa 8 16 bitnih vrednosti.

Bitwise ORanje vseh 128 bitov, z vsemi 128 biti drugega registra.

Pa tudi ko recimo 32 bitno ORaš dva 32 bitna registra, se zORajo vsi naenkrat.

To so osnove. A ti res nič ne veš, al kaj?

nodrim ::

jao, Thomas .. dej si preberi vsaj eno osnovno knjigo od Kodeka za ARS I al pa kej podobnega .. :\

BluPhenix ::

Thomas nobena oslarija.

OR in ALI vrat z več kot 4 vhodi se ne dela. Če hočeš več moraš naredit v stopnjah. Da bi ti razložil zakaj pa imaš premalo osnovnega znanja.

Aha sedaj si se pa boljše razložil, kaj ti blodi poglavi, ti delaš or med dvema 128 bitnima registroma. Ja, to se da in pride prav. Ampak če ti rečeš da ORaš 128 bitov to pomeni, da delaš OR med biti, očitno imaš probleme z izražanjem.

Še enkrat pa, to se da delati nad spremenljivkami, ne pa z inštrukcijami. Malo kako dela procesor, dobi inštrukcijo in nato podatke, nad temi podatki naredi, kar zahteva inštrukcija, ki je prišla pred podatki. kakšni in kaj so tej podatki inštrukcije ne zanima. 4 inštrukcij ne moreš dat skupaj, ker procesor potem ne bo deloval.

Osnove Thomas, osnove, ne filozofiraj na teme ki jih ne obvladaš, sej kot ti je predlaga nodrim lahko prebereš kaj od Kodeka, ali pa tudi kaj od Rebrška, tako za osnove, potem pa lahko nadgradiš s kakšno knjigo o procesorskuh arhitekturah.

Zgodovina sprememb…

nicnevem ::

Ah...razhajanja med inženirskimi ter teoretično-fizikalnimi stališči...
Še enkrat preberite kar je OwcA napisal...
overcomingbias.com -- transhumanizem.org -- singinst.org

Zheegec ::

V bistvu pri x86 kodi je naenkrat več inštrukcij zalimano skupaj in je potem potrebno ugotoviti koliko inštrukcij dejansko je v tistih fetchanih xyB, ampak to vseeno nima veze s tem kar Thomas govori, ker se inštrukcije izvajajo zaporedno, vsaka posebej.

Najprej instruction fetch, potem decode, align (CISC koda se prevaja v RISC v vsakem novejšem x86 procesorju), potem pa operand fetch za vsako inštrukcijo, razen za SIMD pakirane ki grejo posebej v SSE/3DNow! enote, pa še tam jih ni "več skupaj zlimano". Vsak register vsebuje eno 32-bit ali 64-bit (AMD64 recimo) vrednost, če je 8-bit je pa pač veliko ničel na težjih bitih in res mi ni jasno kaj želi Thomas povedati...
"božja zapoved pravi; <Spoštuj očeta in mater>,
ne govori pa o spoštovanju sodstva."
Janez Janša, 29.04.2014

nicnevem ::

IMHO samo to, da je merjenje hitrosti procov treba položiti na globje (univerzalne) teoretične temelje, ki ne bi imeli težav s katerimi se bavi MIPS, CPI, FLOPS...in očitno je eden izmed načinov merjenje preklapljanja bitov. Mislim da je tu določena povezava s sodobno informacijsko fiziko,....gledamo na comp magari kot na celularni avtoma, ki izvšuje nek computing, ter opazujemo preklapljanje njegovih celic. Vsaj tako nekako si predstavljam...

Nisem pa še slišal, da bi kak proizvajalec čipov omenjal koliko bitflipov ima njihov proc...niti mi ni jasno kako bi to sploh merili, čeprav se mi sama ideja sploh ne zdi slaba.


Btw, ALIEN3001, ravnokar smo se učili da so (tudi novejši) x86 proci klasičen primer CISC procov. Ampak če drži tole pretvarjanje v RISC komande (in ti verjamem da), bi prej rekel, da so neka sinteza obeh...nas učijo krivo vero?..hm..zgleda da vsaj malo res ;)
overcomingbias.com -- transhumanizem.org -- singinst.org

BluPhenix ::

Ja X86 je ena mineštra ned CISC in RISC, prevajanje pa se vrši kot je napisal ALIEN, za moje pojme ena velika potrata, vendar so na račun tega programi krajši, če se danes sploh kje to pozna.
Bi jih zrihtali da so full RISC in bo bilo.

Thomas ::

> jao, Thomas .. dej si preberi vsaj eno osnovno knjigo od Kodeka za ARS I al pa kej podobnega

Ja? In kaj bom videl notri takega, da me bo prepričalo, da nimam prav?

> OR in ALI vrat z več kot 4 vhodi se ne dela.

Kdo pa je govoril o več kot o dveh vhodih? Ti. Jest samo pravim, da se zORa lahko vseh 128 ali kolikor že bitov je register dolg - ISTOČASNO.

Zato je pomembno, koliko bitno ORanje štejemo v tiste salamenske MIPSE. Če 16 ali 128 je kar osemkratna razlika.

Z drugimi besedami povedano. MIPS brez podatka, na koliko bitih se izvaja, ni vreden nič.

> vseeno nima veze s tem kar Thomas govori, ker se inštrukcije izvajajo zaporedno, vsaka posebej.

Kakor kdaj. V resnici se jih lahko izvede več naenkrat.

Samo ni to point tukajle. Point je ta, da pri operacijah nad več biti naredimo več dela, kot na manj. Sej v tem je bistvo 64 bitnih procesorjev, recimo. Da se naenkrat naredi neka operacija nad 64 biti. Ne da se dela po 32 bitnih kosih in se shranjujejo še vmesni rezultati. Naprimer 64 bitno seštevanje v enem kosu ali po 32 bitnih kosih s prenosom.

MMX ukaz PAND recimo. Packed AND. Naprimer. Ta obdela naenkrat 8 osembitnih vrednosti. Ali 2 32. Naprimer.

Vsekakor je merodajno, nad kolikimi biti delamo. Če bi bilo vseeno, kar MIPS mera nekako implicira, potem bi raje delali s čimmanj biti in čimhitreje. Vendar ni to štos. Gre nam za to, da naredimo celotno delo čimprej, koliko MIPSov pa je ... je pa precej irelevantno.

Brane2 ::

IMHO ima Thomas načeloma prav. Gre za bitflipe. MIPS FLOPS itd so samo trenutno prikladna embalaža za bitflipe, ki BTW ni vedno lepo označena po pametnih enotah.

Kaj ti mpomeni pravzaprav MIPS iz zornega kota obdelave podatkov ? Stvar v bistvu govori o številu ukazov, izvedenih v sekundi,a to te kot končnega uporabnika niti ne zanima. Zanima te potreben čas, energija in denar za rešitev nekega problema. MIPS ti tu lahko da nek odgovor smao v zelo omejenem spektru slučajev.

Navsezadnje kak nafriziran osembitni Z-80 na 6 GHz ( ki da od sebe pri v povprečju 6cpi 1000 MIPS) ne bo enako uporaben pri reševanju kakih 32-bitnih problemov kot recimo kak Barton na 1Ghz (recimo da mu definiramo za to območje problemov 1 cpi in dobimo 1000MIPS pri 1GHz).

Thomas pravi, da pri biflipanju nujno porbljamo energijo, tudi če za trenuitek pozabimo na primitivne tranzistorje in si omislimo kak naprednejši teoretični model.

Kodekove knjige se ukvarjajo z današnjimi stroji in ne s teoretičnimi modeli, mejami computinga itd.
On the journey of life, I chose the psycho path.

CCfly ::

Btw, ALIEN3001, ravnokar smo se učili da so (tudi novejši) x86 proci klasičen primer CISC procov. Ampak če drži tole pretvarjanje v RISC komande (in ti verjamem da), bi prej rekel, da so neka sinteza obeh...nas učijo krivo vero?..hm..zgleda da vsaj malo res ;)

Poglej si mikroukaze pa ti bo takoj jasno, zakaj je x86 preoblečen RISC.
"My goodness, we forgot generics!" -- Danny Kalev

nodrim ::

jah .. s temi oznakami in meritvami je takole ...

MIPS-i in MFLOPS-i so seveda čudne enote, ki jih moraš pazljivo uporabljat .. niso primerne za primerjavo kar vseh procesorjev povprek ...

kakor tudi bitflipi ne povejo veliko o hitrosti procesorja, ker nič ne povejo o višjih nivojih arhitekture procesorja .. o samih ukazih in prenosnih poteh itd. itd.

kot bi za hitrost avtomobila upoštevali samo obrate ojnice ... na končno hitrost pa vplivajo vsaj še velikost koles in koeficient zračnega upora itd.

univerzalne enote za hitrost procesorjev ni in je po vsej verjetnosti nikoli ne bo, ker se procesorji razlikujejo v preveč stvareh ...

če pa primerjaš dva procesorja iz iste družine .. recimo par pentiumov 4 med seboj .. pa so vse te zgoraj omenjene enote približno isto uporabne ... Thomas: to je to, kar boš (poleg boljšega razumevanja stvari) potegnil iz Kodekove knjige ...

Brane2 ::

Brez zamere, a mislim, da je to Kodekovo knjigo obdelal daleč pred vami.

Videti je, da se ne spušča v detajle "ala Kodek", ker bi to prineslo "pissing contest", neskončna brezplodna prepucavanja itd.

Zato gleda tu na stvari v najbolj posplošeni varianti, skorajda brez oziranja "pod havbo motorja" današnjih strojev. V smislu,d a je edino kar na koncu šteje- rezultat -"bitflip", ne pa tehnične "boilerplate" lastnosti motorja, podvozja itd.

Pri tem je "bitflip" skorajda karikirana poenostavitev, saj mu verjetno okoliščine dajejo neko težo.
verjetn ni ravno vseeno, če je nastal kot rezultat simple XORa ali pa recimo zahtevnega FP deljenja in normalizacije. Po drugi strani pa mogoče niti ne. Na nižji stopnji granulacije je itak vse sestvljano iz enostavnih logičnih vrat, zato so razlike med "težami"posameznih bitnih operacij manjše, če sploh so...
On the journey of life, I chose the psycho path.

Zgodovina sprememb…

  • spremenil: Brane2 ()

Thomas ::

> recimo par pentiumov 4 med seboj .. pa so vse te zgoraj omenjene enote približno isto uporabne ...

LOL! Jest bi vseeno primerjal s še kakšnim AMD, če ne zameriš.

Bom razvijal svojo misel naprej. Vse v slogu - dalje slavec svojo goni. To pa zato, ker nekateri (npr. Brane) očitno dobro vidijo big picture.

Zakaj se nam gre za bitflipe?

A - ker so ti neobhodni za Turingovo mašino, katero naše mašine nekako posnemajo. Karkoli je izračunljivo, je izračunljivo v Turingovem smislu. Torej v smislu branja in pisanja bitov. To je matematični razlog.

B - ker so bitflipi tisto, kar nam načelno pobira energijo pri vsakem ireverzibilnem computingu, sicer bi bil kršen drugi zakon termodinamike. No shit! No, to je pa fizikalni razlog.

Kar se ša tiče imperialnih mer a la MIPS, GFLOPS - so preslabo definirane, da bi bile uporabne.

nodrim ::

hočem samo reči, da ti podatek o hitrosti preklapljanja posameznih bitov ne pove veliko o sami hitrosti procesorja ... le to vidimo kot rezultat naših ukazov in operacij, ki smo jih zahtevali od računalnika (procesorja) ...

zdej je odvisno o čemu se pogovarjamo in kaj nas zanima ... če govorimo o hitrosti računalnikov, nas ponavadi zanima kako hitro dobimo želeni rezultat .. zato se uporabljajo te enote MFLOP in MIPS, ker so bližje našem nivoju .. uporabniškem nivoju ...

sama hitrost bitflipov nima neposrednega vpliva na hitrost izračunanja rezultata .. oz. ima neposredni vpliv :) samo ni to edini faktor pri hitrosti prihajanja rezultatov ...

Thomas ::

> Na nižji stopnji granulacije je itak vse sestvljano iz enostavnih logičnih vrat, zato so razlike med "težami"posameznih bitnih operacij manjše, če sploh so...

Ja, tako je. Nazadnje se ti log(10900) podrobi v ogromno nekih bitflipov. Tako kot se ti podrobi 12+17. Samo da slednji v manj, vendar so v idealnem slučaju čisto enakovredni - po kosu.

Thomas ::

> sama hitrost bitflipov nima neposrednega vpliva na hitrost izračunanja rezultata .. oz. ima neposredni vpliv :) samo ni to edini faktor pri hitrosti prihajanja rezultatov ...

Deep down je samo to. Zato pa navijajo računalnike, da jim hitreje preklaplajo. Pa večajo bitnost, da se jih več bitov preklaplja naenkrat.

nodrim ::

ja res je .. deepdown je res samo to ... ampak to ni edino kar vpliva na končno hitrost računalnika ... zato ta podatek ni merodajen za primerjanje hitrosti med različnimi računalniki ... kar je edina smiselna uporaba vseh teh enot ...

uporabnika zanima kako hitro dobi rezultat neke operacije ... in ta hitrost ni odvisna samo od te najosnovnejše hitrosti preklapljanja posameznih bitov ...

in če imaš dva računalnika (procesorja), pa se ne moreš odločiti med njima, moraš nekako izmeriti njuno hitrost ... hitrost preklapljanja bitov ne bo povedala dovolj o sami končni hitrosti računalnika (procesorja) ... zato so sestavili te "višje" enote: MFLOP in MIPS ... ker te več povedo o končni hitrosti računalnika, čeprav še vedno ne dovolj ...

za ta namen so se razvili razni benchmarki, ki poskušajo čimširše izmeriti hitrost procesorja oz. celotnega računalniškega sistema ...

tako da sama hitrost preklapljanja posameznih bitov (posameznih elementov) ti pove samo to .. kako hitri so elementi in ne kako hiter je procesor ...

Brane2 ::


in če imaš dva računalnika (procesorja), pa se ne moreš odločiti med njima, moraš nekako izmeriti njuno hitrost ... hitrost preklapljanja bitov ne bo povedala dovolj o sami končni hitrosti računalnika (procesorja)


Mislim, da se motiš. Ravno bitflipi ti bodo povedali več. Imel si vhodne reultate in potreboval si toliko bitflipov, da si prišel do izhodnih. To je to- vsaj teroetično. Seveda ti CPU ne dovoljuje atomarnega bitflipanja ampak ima skupine bitflipov zapakirane v posamezne ukaze in da bo stvr še bolj komplicirana, isti ukaz ne pomeni vendo enake količine bitflipov. Tudi če pozabimo na različne možne vhodne podatke, ostanejo vedno druge okoliščine, ki vplivajo na to (cahe hit/miss, pipeline stall, interrupt pending itd).

Ravno MIPS ti ne pove veliko. 1E6 instrukcij na sekundo. Katerih instrukcij, v katerem zaporedju in s katerimi podatki ? Poleg tega, kako preračunaš te MIPSe benchmark programa v MIPSe svojega programa ?
On the journey of life, I chose the psycho path.

Zgodovina sprememb…

  • spremenil: Brane2 ()

Thomas ::

> tako da sama hitrost preklapljanja posameznih bitov (posameznih elementov) ti pove samo to .. kako hitri so elementi in ne kako hiter je procesor ...

Fundamentalna ovira je hitrost preklapljanja in število istočasnih možnih preklapljanj.

Moraš gledat na procesor, kot na neidealen Turingov stroj. Seveda je pomembno, kako dobro ima naoljena koleščka, s katerimi se giblje po traku sem in tja ... hehe ..

Seveda je pomembno, v koliko nanotehnologiji je in če ima silicij s kaj zračnih žepov ali nič ...

Toda ko zadeve pogledamo teoretično, so to stvari, ki jih je treba zoptimizirati, kolikor le gre.

Zgodovina sprememb…

  • zavarovalo slike: OwcA ()

nodrim ::

ja, v teoriji je res tako nekako .. samo pri praktičnih in realnih procesorjih ti to nič ne pomaga .. ker jih s tem ne moreš primerjati med seboj ...

to pa je tudi edini namen teh enot .. merjenje hitrosti procesorja, da se ga lahko primerja z drugimi ...

število preklopov in hitrost preklopov ni ista stvar ... ker na končno hitrost računalnika (torej izstavljanje želenih rezultatov) vpliva tudi arhitektura ukazov in samega jedra procesorja ...

benchmarki imajo svoje enote ... najbolj simpl je, da se na vseh procesorjih izvede čimvečja množica čimbolj raznolikih programov ... meri se čas izvajanja posameznega testa z določenim programom ... in ti časi se lahko potem primerjajo ... in dejansko nekaj pomenijo ...

noben procesor pač nima optimalnega nabora ukazov in ostale arhitekture ... zato si s to teoretično enoto hitrosti pri realnih procesorjih ne moremo pomagati .. veliko primerov je, ko ima en procesor višje število preklopov na sekundo pa je na koncu vseeno počasnejši od nekega drugega, ki ima manj preklopov na sekundo ...

Thomas ::

> veliko primerov je, ko ima en procesor višje število preklopov na sekundo pa je na koncu vseeno počasnejši od nekega drugega, ki ima manj preklopov na sekundo ...

Najbrž misliš na AMD, ki pri nižji frekvenci (preklopov) šiša kakšnega bolj navitega Intela.

Moraš vedeti, da ima tako zgrajena vrata za kakšno operacijo, da se naredi več bitflipsov v enem ciklu in zadeva je opravljena prej.

Za neko operacijo vedno obstaja minimalno potrebno število bitflipsov in minimalno potrebno število istočasnih bitflipsov.

Kot sem rekel. Čimhitreje in čimveč naenkrat! To je bistvo pohitrevanja. Ostalo je tko - sekundarna (terciarna) reč.

nodrim ::

ma ja .. seveda je sekundarna reč .. ampak še vedno je tam .. zato je ne moremo kar tako zanemariti in za mero hitrosti procesorja uporabljati samo hitrost in število preklopov, ker niso edini, ki vplivajo na hitrost dostavljanja rezultatov .. razlike se še posebej pokažejo pri različnih programih .. ali gre za strogo matematični program, ki večinoma računa samo operacije s plavajočo vejico ali pa za kakšen drug program, ki veliko meša tipe med seboj itd. ...

seveda je osnova hitrosti procesorjev hitrost njihovih vezij .. ampak za končno hitrost in za primerjavo med procesorji (zaradi tega so takšne in drugačne enote sploh navedene pri takšnih novicah in specifikacijah) ta enota ni dovolj merodajna ...

Brane2 ::

IMHO ti mešaš brutto bitflipe z NETTO bitflipi.

NETTO zajema tisto kar hočeš- število bitflipov (nujno ?) potrebnih za prihod z začetnih podatkov do rezultata- to so tisti bitflipi ki jih ti vidiš kot koristno informacijsko delo in pravzaprav to, kar si zahteval.

BRUTTO bitflipi pa poleg tega zajemajo še maso režijskih bitflipov, ki sicer ne povečajo neposredno computinga, so pa potrebni zaradi takih in drugačnih fizičnih zakonitosti izvedbe stroja.

Če stroj A pride z istim programom in vhodnimi podatki prej do rezultata od stroja, opravi v tem primeru v času izvajanja svojega programa več NETTO bitflipov od stroja B.
On the journey of life, I chose the psycho path.
«
1
2


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Kaj kupiti: aplikativni "server"

Oddelek: Kaj kupiti
5797 (739) dukedl
»

Vohunska kamera za slabega prešerna

Oddelek: Novice / Zasebnost
306384 (4240) Jst
»

Prenapetostna zaščita

Oddelek: Kaj kupiti
162501 (2227) svejk
»

Problem s črpalko!

Oddelek: Hlajenje in modifikacije
91239 (1085) PRST
»

varovalka od wooferja

Oddelek: Loža
212058 (1871) kajzer

Več podobnih tem