X-Bit Labs - ARM, znan po svojih varčnih procesorjih, ki se nahajajo predvsem v prenosnih napravah, bo očitno postal še mnogo bolj varčen. Dogovori z GlobalFoundries pomenijo, da bodo procesorji ARM lahko zdaj izdelani s postopkom SOI (Silicon On Insulator), katerega najbolj znan uporabnik je AMD. Zanimivo je, da testni primerki procesorjev ARM, izdelanih na SOI postopku, niso delo tovarn GlobalFoundries, temveč so jih pripravili v francoski družbi Soitec, ki skrbi tudi za okrožnico o SOI industriji.
Za neposredno primerjavo so pripravili dve identični jedri, osnovani na ARM11 procesorju, ki ga je moč najti v iPhoneu. Eno je bilo seveda izdelano s SOI postopkom, medtem ko so drugo izdelali v običajnem, t.i. bulk CMOS postopku. Pri enaki hitrosti je SOI jedro porabilo kar 40% manj energije ob 7% prihranku prostora ter je omogočalo tudi do 20% višje frekvence. S testom so potrdili domneve, da bi se SOI lahko izkazal pri čipih z nizko porabo in visoko zmogljivostjo. ARM bo tako lahko izdeloval varčnejše oz. mnogo zmogljivejše procesorje, kar je v vsakem primeru pozitivno za nas, uporabnike.
V mojem HTCju je 400MHz proc, ampak, to je se vseeno premalo.
Drugace pa; stavek, ki je italic ni potreben, saj GF vlagajo veliiiko truda in denarja v tej smeri, da je to neizbezno. in to je dobro ... naj TSMC malo cvika.
Zakaj pa ARM nebi dosegel zmogljivosti i7 sistema ali recimo vsaj polovico ? Zakaj v tej arhitekturi gradijo samo ultravarčne in ne tako zmogljive cpu-je.
Verjetno ne bistveno. Mislim, da bi nekaj pridobil na račun bistveno enostavnejše osnove in instrukcijskega dekoderja, vendar ne toliko,d a bi se splačalo iti v to tekmo, ker je many-cores veliko bolj profitabilna.
samo ne pride pri many-cores v postev tisti zakon skalabilnosti (da relativna hitrost izvajanja pada z vecanjem st. corov v primerjavi z enim samim, a toliko bolj navitim corom)?
Zakaj pa ARM nebi dosegel zmogljivosti i7 sistema ali recimo vsaj polovico ? Zakaj v tej arhitekturi gradijo samo ultravarčne in ne tako zmogljive cpu-je.
V glavnem zato, ker varčnost ARM procesorjev temelji na enostavnejši arhitekturi in izvedbi z *bistveno* manj logičnimi vrati:
ARM11/Cortex imajo tipično 2-3 mio transistorjev, Core i7 jih ima 731 mio. (Pozor! ti procesorji so zelo, zelo daleč narazen glede zmogljivosti!! Dajem samo številke tranzistorjev za primerjavo).
Če že kaj, je naravnost impresivno, kako je ARMu uspelo sestaviti sorazmerno močen CPU s tako malo elementi. Ne glede kateri ARM dizajn vzameš je povsem nemogoče zasnovati primerljiv (v smislu funkcij enot procesorja) x86 procesor ustrezne generacije s tako zelo majhnim številom elementov.
Ampak ARM ima cca 300x manj tranzistorjev je pa recimo 30x manj zmogljiv. Torej bi se verjetno še vedno dalo narest procesor, ki bi bil podobno močan ter cenejši in varčnejši ?
Ampak ARM ima cca 300x manj tranzistorjev je pa recimo 30x manj zmogljiv. Torej bi se verjetno še vedno dalo narest procesor, ki bi bil podobno močan ter cenejši in varčnejši ?
Verjetno ne bistveno. Mislim, da bi nekaj pridobil na račun bistveno enostavnejše osnove in instrukcijskega dekoderja, vendar ne toliko,d a bi se splačalo iti v to tekmo, ker je many-cores veliko bolj profitabilna.
Tukaj je verjetno skoraj bolj problem SW podpora. Pri superračunalnikih, kjer tega problema ni, je pa x86 itak dokaj nepomemben igralec.
Heh ob GlobalFoundries se vedno spomnim na kakšne škratovske kovače iz Tolkienovske mitologije
Jest pa na Global DJs al kaj so že tisti uničevalci dobrih komadov :D
Ampak ARM ima cca 300x manj tranzistorjev je pa recimo 30x manj zmogljiv. Torej bi se verjetno še vedno dalo narest procesor, ki bi bil podobno močan ter cenejši in varčnejši ?
Mogoče da mogoče ne. Zmogljivost ni neposredno vezana na število tranzistorjev. ARM athitektura se je tradicionalno veliko bolj opirala na optimizirano kodo, ki jo generira prevajalnik (ali brihten programer). Klasičen primer je lastnost ARMprocesorjev, da je izvajajo večino ukazov pogojno (na osnovi aritm. zastavic) -ne samo skoke. Na ta način se lahko s primerno generirano kodo izogneš ogromno pogojnim skokov, ki so poleg dodatnega ukaza performančno najbolj kritičen del izvajanja (napačno predviden skok pomeni, da imaš v delu cevovoda napačne ukaze in je treba vsebino zavreči - ekstra neugodno), starejša ARM jedra tudi ne podpirajo neporavnanih ukazov, imajo dodatne naslovne načine in aritmetične operacije (ki jih je seveda treba znati eksplicitno uporabljati) itd. To so vse triki, ki jih mora tipičen x86 procesor izvajati sam oz. niso avtomatično rešljivi real-time.
Pri x86 tovrstna optimizacija seveda ne pride v poštev, ker mora procesor nujno predvsem zčimbolj učinkovito izvajati obstoječo kodo, da je sploh tržno opravičljiv! To je recimo eden pomembnih razlogov, zakaj se Intel Atom procesorji slabše izkažejo (glede na primerljivo hiter procesor). So enostavnejši (recimo nimajo preurejanja ukazov), vendar na račun učinkovitosti izvajanja - zelo verjetno bi se dalo narediti kodo optimizirano posebej za Atom, ampak potem bi ti moral nekdo še enkrat prevesti cel Windows XP ;)
Ja saj je - predvsem pa je cenejši, ker ne rabiš kupa logike v procesorju... samo kot rečeno brez teh optimizacij med izvajanjem bi obstoječa x86 koda tekla dokaj neučinkovito tako da so s tega stališča on-the-fly optimizacije nujne.
ARM je itak RISC arhitektura, Intel pa CISC. Seveda je tudi zmotno pričakovati, da bi se hitrost povečevala linearno s številom tranzistorjev.
Če bi ARMu dodal dodatne ukaze, enormno povečal instruction set, SSE, MMX,... pol bi povečal stopnjo cevovoda, povečal superskalarnost, dodal branch predictor, dodal še kak core, krmilnik pomnilnika not ugradil, ... pa bi pršli na tistih 3B tranzistorjev. Pol bi lahk izvajal orenjk SIMD ukaze, pa simuliral znanstvene aplikacije, a glej ga zlomka... kaj ti bo to u telefonu, pa še več bo energije porabl + kdo bi to kupu za desktop, glede na to, da nima x86 instruction set.
Mislim, da je ARM taprav player za embedded zadeve, njegovi proci so na svojem področju čudovit tehnološki dosežek, tepst se za desktop se mu pa ne splača...
Bi bilo zanimivo videt kako primerjavo DMIPS/W ali kakšen konkreten test. Seveda bi se zmeraj najdla kakšna subjektivna stvar pri tej primerjavi ampak vseeno...